语音 - 智狐AI导航

Gemma 3n

Gemma 3n 是谷歌 I/O 开发者大会推出的端侧多模态 AI 模型，基于 Gemini Nano 架构，采用逐层嵌入技术，将内存占用压缩至 2-4B 参数模型水平。支持文本、图像、短视频和音频输入，可生成结构化文本输出，并具备音频转录、情感分析等功能。可在本地设备运行，响应时间低至 50 毫秒，适用于语音助手、内容生成和学术任务定制。

AI项目与工具 2025年06月11日 87 点赞 0 评论 704 浏览

Lemon Slice Live

Lemon Slice Live 是一款基于扩散变换器模型（DiT）的实时视频聊天工具，可将图片转化为可互动的动画角色，支持多语言和实时对话。通过优化模型提升流畅度与响应速度，适用于娱乐、教育、营销等多种场景，结合语音识别、文本生成等技术，提供完整的交互体验。

AI项目与工具 2025年06月11日 61 点赞 0 评论 704 浏览

妙话AI

一个在线智能写作应用，妙话AI提供了包括自动生成绘画、语音对话机器人等多种功能。它集成了100多个智能AI大模型，用户可以通过一键操作进行聊天、写作、绘画和语音生成，轻松解决复杂问题。

AI写作对话 2025年06月05日 80 点赞 0 评论 705 浏览

DeepL-translator

DeepL Pro是一款由人工智能和神经网络提供支持的专业翻译服务，可跨多种设备和应用程序(包括文档、网页、电子邮件和口头对话)提供准确、安全和可定制的翻译

Ai语音工具 2026年06月24日 0 点赞 0 评论 705 浏览

Grimo

Grimo 是一款集成多种 AI 技术的写作辅助工具，支持语音输入、提示管理、实时网络搜索和团队协作等功能，适用于作家、内容创作者及专业人员。其提供多个版本以满足不同需求，具备高度定制化和智能化特性，有效提升写作效率和内容质量。

AI项目与工具 2025年06月11日 10 点赞 0 评论 706 浏览

VideoCaptioner

VideoCaptioner是一款基于大语言模型的智能字幕处理工具，支持语音识别、字幕优化、翻译、样式调整及视频合成等功能。无需GPU即可运行，兼容多语言和多种字幕格式，适用于视频创作者、教育工作者及字幕翻译团队，提升字幕制作效率与质量。

AI项目与工具 2025年06月12日 50 点赞 0 评论 708 浏览

voice.ai

voice.ai的使命是通过普及人工智能技术，增强协作创造力，并允许社区重新定义音频表达方式。公司相信人工智能应该是易于接近、对所有人开放且富有趣味的。

创作工具 2026年06月24日 0 点赞 0 评论 708 浏览

Vozard

一款由iMobie开发的AI驱动的实时语音变声软件，提供超过100种逼真的语音效果。用户可以在在线聊天、游戏等场景中使用。

Ai语音工具 2025年06月05日 94 点赞 0 评论 708 浏览

OCTAVE

OCTAVE是一款由Hume AI研发的语音语言处理工具，融合了多种领先AI技术，具备强大的个性化语音生成能力，支持从文字到语音的即时转化，并能精准模仿不同说话者的声线与情感表达。其主要功能包括多角色对话生成、复杂指令理解与响应，以及实时语音处理等。此外，OCTAVE可应用于客户服务、虚拟助手、教育培训、娱乐游戏等多个领域，为用户带来更加自然、生动的交互体验。

AI项目与工具 2025年06月12日 14 点赞 0 评论 709 浏览

AiSofiya

Sofiya是一款由人工智能驱动的文本到语音转换器，可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率，并有一个强大的声音工作室，以合并和增强...

Ai语音工具 2026年06月24日 0 点赞 0 评论 709 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期