多语言支持

Viewly AI

一款强大的AI图片识别应用，Viewly AI能识别图片中的内容、AI作诗、拍照翻译成多国语言。

Ai图片处理 2025年06月05日 54 点赞 0 评论 639 浏览

SANA 1.5

SANA 1.5是由英伟达联合多所高校研发的高效线性扩散变换器，专用于文本到图像生成任务。其核心优势包括高效的训练扩展、模型深度剪枝、推理时扩展等技术，能够在不同计算预算下灵活调整模型性能。支持多语言输入，并具备开源特性，适用于创意设计、影视制作、教育等多个领域。实验表明，其生成质量接近行业领先水平，同时显著降低计算成本。

AI项目与工具 2025年06月12日 56 点赞 0 评论 638 浏览

Speechelo

Speechelo是一款基于先进AI技术的文本转语音工具，支持超过30种性别和语言的声音选择，用户可通过调整语调、速度和音高来自定义语音效果。它兼容主流视频编辑软件，适用于产品演示、教育培训、营销推广等多种场景，助力高效生成高质量语音内容。

AI项目与工具 2025年06月12日 52 点赞 0 评论 638 浏览

Gemma 3

Gemma 3 是谷歌推出的开源人工智能模型，支持多语言、多模态处理，具备文本、图像及短视频分析能力。提供多种模型尺寸，适配不同硬件环境，优化了单 GPU/TPU 性能，推理速度提升显著。内置图像安全分类器，增强内容安全性。支持多种开发工具和部署方式，适用于人脸识别、物体检测、智能助手、文本分析等场景。

AI项目与工具 2025年06月12日 20 点赞 0 评论 637 浏览

阿里Accio

阿里巴巴最近推出的全球首个B2B领域的对话式AI搜索引擎，Accio通过AI技术主动理解并满足用户的采购需求，提供智能化的采购解决方案。

AI搜索问答 2025年06月05日 25 点赞 0 评论 636 浏览

xLAM

xLAM 是 Salesforce 开源的一款大型语言模型，专为功能调用任务设计。该模型具备多语言支持、预训练模型、迁移学习、自然语言处理等主要功能，并基于 Transformer 架构实现。它在多个基准测试中表现出色，适用于自动化任务、模板共享、插件开发和教育等多个应用场景。

AI项目与工具 2025年06月12日 55 点赞 0 评论 635 浏览

EchoMimicV2

EchoMimicV2是一款由阿里巴巴蚂蚁集团研发的AI数字人动画生成工具，能够基于参考图片、音频剪辑及手部姿势序列生成高质量的半身动画视频。它支持多语言（中英双语）输入，并通过音频-姿势动态协调、头部局部注意力及特定阶段去噪损失等技术手段显著提高了动画的真实度与细节表现力，适用于虚拟主播、在线教育、娱乐游戏等多个领域。

AI项目与工具 2025年06月12日 17 点赞 0 评论 635 浏览