AI

ChatPaper

ChatPaper是一款集检索、阅读、知识问答于一体的文献知识工具,专为科研人员设计,旨在提高检索和阅读论文的效率,快速获取最新领域研究动态。它利用ChatGPT3.5的API接口,能够根...

Convai

对话式 AI API,用于语音识别、语言理解和生成,以及用于设计游戏和支持语音的应用程序的文本转语音。

DeepSeek Artifacts

DeepSeek Artifacts是一款基于AI的前端开发工具,能够自动生成React和Tailwind CSS代码,同时支持构建开放的前端代码数据集。它提供沙盒环境、项目导出以及快速部署等功能,适用于快速原型开发、教育场景及SEO优化等多种用途,旨在提升前端开发效率。

模型判官

模型判官是一款基于Next.js构建的在线AI模型评测平台,支持多模型对比、自动评估与打分、实时流式响应及国际化设计。它通过并行处理、评判模型机制和评分算法,为用户提供高效、精准的AI模型推荐服务。适用于AI模型选择、教育研究、内容创作、客户服务以及语言翻译等多个场景。

LongVILA

LongVILA是一款专为长视频理解设计的视觉语言AI模型,由多家知名研究机构共同开发。它具备强大的长上下文处理能力和多模态序列并行性,能在大量GPU上高效训练,无需梯度检查点。LongVILA通过五阶段训练流程,结合大规模数据集构建和高性能推理,显著提升了长视频字幕的准确性和处理效率。此外,它还支持多种应用场景,包括视频字幕生成、内容分析、视频问答系统等。

Muyan

Muyan-TTS是一款面向播客场景的开源文本转语音工具,基于超10万小时播客数据训练,支持零样本语音合成与说话人适配,可在0.33秒内生成1秒音频,适合实时与长内容合成。支持本地部署与API调用,应用于播客、有声书、视频配音、AI角色及新闻播报等领域,兼具高效性与灵活性。

Photo Room

人工智能背景生成器,描述您想要的图像,它会使用符合您确切要求的稳定扩散神奇地生成无限数量的独特背景

THREAD.ai

THREAD.ai,中国首个AI智能体(Agent)平台,华人版GPT Store,不需要代码知识、不需要编程,普通人也可以创造属于自己的第一款AI智能体!

LDGen

LDGen是一款结合大型语言模型与扩散模型的文本到图像生成工具,支持零样本多语言生成,提升图像质量和语义一致性。通过分层字幕优化、LLM对齐模块和跨模态精炼器,实现文本与图像的高效交互。实验表明其性能优于现有方法,适用于艺术创作、广告设计、影视制作等多个领域,具备高效、灵活和高质量的生成能力。

WatermarkRemover

WatermarkRemover是一款在线AI背景去除工具,支持多种图片格式,如PNG、JPEG等。它利用智能识别技术自动去除图片背景,并提供手动调整功能以满足个性化需求。操作简便,用户只需三步:导入、处理、导出。基础背景去除功能免费开放,适用于创意设计、博客、社交媒体、电子商务、教育和演示以及个人项目等场景。