语音

TTS-vue

TTS-Vue是一个开源的桌面应用程序,它利用了微软的语音合成技术,为用户提供了一个简单易用的文本到语音转换工具。

J1 Assistant

J1 Assistant 是一款基于安卓平台的 AI 智能助手,支持语音输入与多任务处理。用户可通过语音转换为文本,发送至搜索引擎、AI 模型或创建备忘录。支持任务管理、信息查询及智能对话,适用于日常事务管理、学习研究和生活辅助。目前为 Beta 版本,仅限海外用户使用。

Mochii AI

Mochii AI 是一款多功能AI助手,支持智能对话、文档分析、网页总结、图像识别等功能,兼容多种AI模型。用户可跨平台使用,适用于文档处理、内容创作、代码生成及数据分析等场景,具备个性化定制和上下文理解能力,提升工作效率与体验。

声动视界SoundView

一款面向带货短视频的AI视频工具,声动视界SoundView提供视频翻译、文本转语音和视频配音等功能。

Realtime API

Realtime API是一款由OpenAI研发的低延迟、多模态对话式API,支持文本与音频输入输出,具备实时语音处理、自然语音合成及多模态交互等功能。通过WebSocket协议实现持久连接,支持事件驱动的交互模式,适用于客户服务、语言学习、游戏娱乐等多种应用场景。

Offer蛙

Offer蛙是一款AI驱动的面试辅助工具,支持实时语音识别与答案生成,结合高频题库和简历信息,为用户提供专业级回答。具备代码题优化、多平台适配及隐私保护功能,适用于技术面试和线上面试场景,提升面试表现与专业形象。

Whisper

Whisper是一个开源的自动语音识别系统,经过68万小时的多语言和多任务监督数据训练

Podcastfy

Podcastfy 是一款基于生成式人工智能技术开发的开源工具,可将网络文章、PDF 文件及纯文本转化为多语言对话式音频。它不仅支持多源文本合并,还具备强大的文本转语音功能,允许用户选择不同的语音模型来优化音频效果。此外,其开源特性便于开发者根据需求进行个性化定制,广泛适用于内容摘要、语言本地化、教育材料转化等多个领域。

木言AI

专注于文字语音合成配音、字幕配音、智能视频创作的全自动化在线工具。制作视频无需出镜,木言AI是新自媒体人必不可少的工具!

问小白上线DeepSeek

“问小白”平台提供免费且无限使用的DeepSeek R1满血版服务,支持联网搜索、文件上传、多模态处理等功能,运行流畅稳定。平台在多项实测中表现优异,具备深度思考能力、智能追问及语音交互功能,适用于多种场景,用户体验良好,且完全免费。