语音 - 智狐AI导航

TTS-Voice-Wizard

TTS语音向导是一种工具，允许用户通过微软Azure语音识别和TTS将语音转换为文本，然后再转换回语音。它还向VRChat发送OSC消息以在头像上显示文本。该工具有许多自定义选项，包括100...

Ai语音工具 2026年06月24日 0 点赞 0 评论 737 浏览

Chat Video

Chat Video 基于AI的高效视频学习工具，具有语音识别、摘要总结、AI 问答等功能。

视频剪辑 2025年06月05日 25 点赞 0 评论 735 浏览

TranSmart腾讯交互翻译

一款基于腾讯语音、图像、自然语言处理等领域的技术开发的新一代智能翻译设备

Ai语音工具 2026年06月24日 0 点赞 0 评论 734 浏览

Enhance Speech

一款由 Adobe 出品的录音增强工具，可以去除音频背景噪音，让语音或者录音听起来就像在专业录音室中录制一样，使音频具有专业录音室品质录音的干净、专业的声音。

Ai语音工具 2025年06月05日 29 点赞 0 评论 734 浏览

星火纪要

星火纪要是科大讯飞推出的音视频处理平台，支持语音转录、内容总结、多语言翻译、数据分析等功能，适用于会议、访谈、销售、培训等场景。系统可快速生成会议纪要，角色分离准确率超95%，支持12种场景模板，提升工作效率与信息管理能力。

AI项目与工具 2025年06月12日 49 点赞 0 评论 734 浏览

OmniAudio

OmniAudio-2.6B是一款专为边缘设备设计的高性能音频语言模型，具备语音识别、转录、问答、对话生成及内容创作等核心功能。其技术优势在于多模态架构的高效集成、稀疏性利用以及三阶段训练流程，支持FP16和Q4_K_M量化版本，确保在资源受限的环境下仍能稳定运行。OmniAudio-2.6B可应用于智能助手、车载系统、会议记录、教育和医疗等多个领域，为用户提供便捷、高效的语音交互体验。

AI项目与工具 2025年06月12日 95 点赞 0 评论 729 浏览

绘声美音

绘声美音是一款集声音克隆、AI变声、文字转语音及多种音频处理功能于一体的在线工具，用户可通过微信公众号便捷使用。支持上传语音训练专属声纹模型，进行歌曲翻唱并生成MV，同时提供变声、音频提取、听歌识曲等功能，适用于娱乐、配音、创作等多种场景。

AI项目与工具 2025年06月12日 39 点赞 0 评论 729 浏览

Spiritme AI

一款AI视频平台，可以让用户通过数字化化身生成个性化视频。该平台利用人工智能技术，帮助用户轻松创建独特和引人入胜的视频。

Ai视频生成 2025年06月05日 30 点赞 0 评论 729 浏览

豆包大模型1.5

豆包大模型1.5是字节跳动推出的高性能AI模型，采用大规模稀疏MoE架构，具备卓越的综合性能和多模态能力。支持文本、语音、图像等多种输入输出方式，适用于智能辅导、情感分析、文本与视频生成等场景。模型训练数据完全自主，性能优于GPT-4o和Claude 3.5 Sonnet等主流模型，且具备成本优势。

AI项目与工具 2025年06月12日 23 点赞 0 评论 728 浏览

Dola

Dola是一款基于人工智能的日历助手，它允许用户通过多种方式（包括文字、语音和图片）与主要的即时通讯软件交互，以高效地创建和管理日程事件。Dola具备自然语言理解和日历同步功能，能够自动识别并添加日程，支持跨平台同步，并在事件开始前发送提醒。此外，它还提供群组管理功能，适合团队和组织使用。Dola简化了日程管理流程，提升了个人和团队的工作效率。

AI项目与工具 2025年06月12日 93 点赞 0 评论 727 浏览

语音

首页

语音

列表

默认

浏览次数

发布日期