Wispr Flow Wispr Flow 是一款基于AI技术的语音转文字工具,支持100多种语言,具备自动编辑、上下文感知和低音量识别等功能,提升写作与沟通效率。提供免费基础版及付费专业版和团队版,适用于写作、商务、学习等多种场景,注重用户隐私保护,操作便捷自然。 AI项目与工具 2025年06月12日 79 点赞 0 评论 495 浏览
IndexTTS IndexTTS 是一款由 B 站开发的高性能文本转语音系统,专注于中文语音合成,支持拼音纠正、精准停顿控制和高自然度语音输出。采用混合建模方法,结合汉字与拼音,提升发音准确性。系统具备零样本语音克隆能力,音质优秀,广泛应用于内容创作、在线教育、智能客服等领域。训练数据丰富,性能指标优异,包括低字词错误率、高扬声器相似性和高主观音质评分。 AI项目与工具 2025年06月12日 15 点赞 0 评论 122 浏览
Signs Signs是由英伟达推出的AI手语学习平台,通过实时手势识别与3D虚拟教学,帮助用户精准掌握美式手语。平台支持用户上传视频,丰富学习资源,具备互动性与个性化反馈,适用于初学者及进阶学习者,同时为无障碍技术开发提供数据支持。 AI项目与工具 2025年06月12日 69 点赞 0 评论 464 浏览
LipRead Pro LipRead Pro 是一款基于AI技术的视频唇读工具,可将视频中的唇部动作转换为文字,支持多语言和口音识别。其高精度算法确保了文字输出的准确性,适用于内容创作、无障碍辅助、安全监控、历史档案修复等多种场景。操作简便,处理高效,注重用户数据隐私保护,适合专业用户和普通用户使用。 AI项目与工具 2025年06月12日 100 点赞 0 评论 485 浏览
SpeechGPT 2.0 SpeechGPT 2.0-preview 是复旦大学 OpenMOSS 团队开发的拟人化实时交互系统,基于大量中文语音数据训练,支持低延迟、高自然度的语音与文本交互。具备情感控制、实时打断、多风格语音生成等功能,适用于智能助手、内容创作及无障碍通信等场景,技术上融合了语音-文本联合建模与多阶段训练策略,提升语音表现力与智能化水平。 AI项目与工具 2025年06月12日 23 点赞 0 评论 247 浏览
Luvvoice Luvvoice 是一款基于 AI 技术的在线文本到语音转换平台,提供超过 200 种高质量 AI 声音和 70 多种语言选项。用户可以通过上传 PDF 或 TXT 文件,将文本快速转换为自然语音,适用于教育、内容创作、营销及无障碍服务等多个场景。平台支持多种语言调节功能,生成的音频文件支持 MP3 格式下载。 AI项目与工具 2025年06月12日 33 点赞 0 评论 391 浏览
Voxify Voxify是一款利用AI技术将文本转化为自然语音的专业工具,具备超过450种声音选择,支持140多种语言和方言。用户可自定义音调、语速及情感表达,满足多样化的应用场景。此外,Voxify支持多格式输出并提供API接口,便于集成至其他系统中。 AI项目与工具 2025年06月12日 82 点赞 0 评论 159 浏览
ebook2audiobookXTTS ebook2audiobookXTTS是一款开源AI工具,可将EPUB、PDF、MOBI等多种电子书格式转换为高质量的有声书(.m4b)。通过集成Calibre和Coqui XTTS技术,支持多语言处理和章节识别,同时保留电子书元数据,适用于个人学习、教育培训、企业培训以及公共图书馆等场景,帮助用户高效获取知识。 AI项目与工具 2025年06月12日 78 点赞 0 评论 491 浏览
Whispo Whispo是一款AI驱动的语音转录工具,支持用户通过快捷键快速录制语音并将其转写为文本,同时具备本地数据处理、隐私保护及基于大型语言模型的文本后处理功能。它适用于会议记录、教育、自动字幕生成等多个场景,旨在提升工作效率和用户体验。 AI项目与工具 2025年06月12日 47 点赞 0 评论 191 浏览
Illuminate Illuminate是一款基于谷歌Gemini语言模型开发的AI工具,可将学术论文转化为生动的音频讨论。它通过自然语言处理技术和文本到语音合成,生成包含核心观点的对话内容,支持用户在碎片化时间中高效学习。该工具具备动态音频转换、个性化学习体验、互动反馈及多平台共享等功能,适用于学术研究、学生辅助学习及非专业人士的知识普及。 AI项目与工具 2025年06月12日 29 点赞 0 评论 323 浏览