J1 Assistant J1 Assistant 是一款基于安卓平台的 AI 智能助手,支持语音输入与多任务处理。用户可通过语音转换为文本,发送至搜索引擎、AI 模型或创建备忘录。支持任务管理、信息查询及智能对话,适用于日常事务管理、学习研究和生活辅助。目前为 Beta 版本,仅限海外用户使用。 AI项目与工具 2025年06月12日 34 点赞 0 评论 423 浏览
悦音配音 AI智能配音工具,独有的AI智能配音技术,更专业,完美贴近真人配音,AI模仿真人情感(怀旧、欢快、激情、伤心、抒情、惊讶等),支持多音字、停顿、整数、小数、数字等特色发音,... 创作工具 1970年01月01日 0 点赞 0 评论 419 浏览
LiveKit Agents LiveKit Agents 是一款基于 Python 的多模态 AI 工具框架,支持实时语音、视频和数据交互。其核心功能包括基于 WebRTC 的低延迟通信、与 OpenAI 等服务的深度集成、丰富的插件生态系统以及负载均衡与自动扩展能力。适用于虚拟助手、客户服务、实时翻译、视频内容审核等多个应用场景。 AI项目与工具 2025年06月12日 55 点赞 0 评论 404 浏览
MiniCPM MiniCPM-o 2.6 是一款高性能的多模态大模型,具备 8B 参数量,支持视觉、语音及多模态直播等多种功能。其在图像处理、语音识别和实时交互方面表现优异,采用高效的 token 技术提升推理速度,可在端侧设备上运行。支持多种语言和音色配置,适用于智能助手、内容创作、教育、客服和医疗等多个领域。 AI项目与工具 2025年06月12日 58 点赞 0 评论 403 浏览
蓝心大模型 蓝心大模型是由vivo研发的通用大模型矩阵,包括语言、端侧、语音、图像及多模态模型。该模型在内容创作、知识问答、逻辑推理、代码生成、信息提取、多语言翻译等方面表现出色。蓝心端侧大模型3B在移动设备上表现出色,蓝心语音大模型支持多语言,蓝心图像大模型融合了中国特色和东方美学,蓝心多模态大模型则提供了流畅的视频对话体验。 AI项目与工具 2025年06月12日 76 点赞 0 评论 398 浏览
TTS-Voice-Wizard TTS语音向导是一种工具,允许用户通过微软Azure语音识别和TTS将语音转换为文本,然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项,包括100... Ai语音工具 1970年01月01日 0 点赞 0 评论 386 浏览
Pipecat Pipecat是一款开源Python框架,用于构建语音和多模态对话系统。它整合了语音识别、文本转语音及对话处理功能,支持与主流AI平台集成,采用模块化管道架构,提升开发效率。基于帧的实时处理机制确保流畅交互,适用于语音助手、企业服务、教育、医疗及多模态应用等多种场景。 AI项目与工具 2025年06月12日 78 点赞 0 评论 386 浏览