生成

Mini

Mini-Omni 是一个开源的端到端语音对话模型,具备实时语音输入和输出的能力,能在对话中实现“边思考边说话”的功能。模型设计无需额外的自动语音识别(ASR)或文本到语音(TTS)系统,直接进行语音到语音的对话。Mini-Omni 采用文本指导的语音生成方法,通过批量并行策略提高性能,同时保持了原始模型的语言能力。它支持实时语音交互、文本和语音并行生成、跨模态理解等功能,适用于智能助手、客户服务

Nexa AI

Nexa AI致力于生成高质量的AI生成产品图像。它可以根据用户上传的产品图片,自动去除背景并生成符合不同行业的适用模板。

Rask Ai

Rask AI是新一代的视频翻译和配音工具,是一个利用先进的人工智能技术来自动化视频内容本地化和翻译过程的平台。

Ideogram AI

Ideogram AI通过其在线应用程序ideogram.ai,允许用户通过文字提示以多种艺术风格生成图像。

Agent Laboratory

Agent Laboratory是由AMD与约翰·霍普金斯大学合作开发的基于大型语言模型的研究辅助工具,支持从文献综述到报告撰写的全流程科研任务。它具备实验设计、代码生成、结果分析等功能,并通过多代理协作和用户反馈机制提升研究质量。实验表明其可显著降低研究成本,适用于机器学习、生物医学等多个领域。

Shakker

Shakker 是一款基于 AI 技术的图像生成与编辑平台,提供 Stable Diffusion 模型支持,具备图像局部修改、合成、背景去除、动作调整等功能。支持多种风格图像生成,包括动漫、肖像及表情包制作。适用于设计师、艺术家及游戏开发者,提供直观的操作界面,广泛应用于社交媒体营销、数字艺术创作及个性化礼物定制等领域。

AI Code Converter

AICodeConvert是一个强大的工具,可以让用户轻松地生成或转换代码和自然语言为他们喜欢的编程语言。该工具利用人工智能技术提供代码生成和翻译功能,从而提高生产力。

TripoSF

TripoSF是由VAST推出的新型3D基础模型,采用SparseFlex表示方法和稀疏体素结构,显著降低内存占用并提升高分辨率建模能力。其“视锥体感知的分区体素训练”策略优化了训练效率,使模型在细节捕捉、拓扑结构支持和实时渲染方面表现突出。实验数据显示,TripoSF在Chamfer Distance和F-score等关键指标上分别降低82%和提升88%。适用于视觉特效、游戏开发、具身智能及产品

Bith AI

Bith AI 是一款AI驱动的视频创作与编辑工具,支持文本转视频、自动字幕生成、多平台尺寸适配、多媒体融合及一键发布等功能。适用于社交媒体、企业营销、教育培训和个人创作等多种场景,提升视频制作效率与专业度。