语音 - 智狐AI导航

Huxe AI

Huxe AI是一款基于生成式AI技术的个人音频伴侣应用，旨在为用户提供高度个性化的音频体验。其主要功能包括个性化音频简报、实时问答、减少屏幕时间以及与现有应用的无缝集成。通过连接用户的日历、邮件等数据流，Huxe AI能够生成定制化的语音内容，帮助用户高效管理日程、获取信息并提升学习效率。

AI项目与工具 2025年06月12日 76 点赞 0 评论 639 浏览

Speechelo

Speechelo是一款基于先进AI技术的文本转语音工具，支持超过30种性别和语言的声音选择，用户可通过调整语调、速度和音高来自定义语音效果。它兼容主流视频编辑软件，适用于产品演示、教育培训、营销推广等多种场景，助力高效生成高质量语音内容。

AI项目与工具 2025年06月12日 52 点赞 0 评论 638 浏览

CapsWriter

CapsWriter-Offline是一款基于PC端的离线语音输入与字幕转录工具，支持实时语音转文字功能，具备高准确率和无限时长录音能力。其核心技术依托于深度学习模型，可处理中英文混合语音，并提供热词自定义功能以提升特定术语的识别效果。此工具适用于会议记录、学术讲座、视频字幕生成等多种场景，同时确保用户数据的安全与隐私。 ---

AI项目与工具 2025年06月12日 38 点赞 0 评论 636 浏览

ToolBaz

ToolBaz 是一款多功能的 AI 创作平台，涵盖文章撰写、故事生成、图像与视频制作、语音合成及代码编写等功能，旨在通过人工智能技术简化创作过程，提升内容质量和效率。无论是营销文案、社交媒体帖子还是产品描述，ToolBaz 都能快速生成高质量的结果，同时支持跨领域应用，如品牌宣传、客户服务和教育培训等。

AI项目与工具 2025年06月12日 14 点赞 0 评论 635 浏览

CoGenAV

CoGenAV是一种先进的多模态学习模型，专注于音频和视觉信号的对齐与融合。通过对比特征对齐和生成文本预测的双重目标进行训练，利用同步音频、视频和文本数据，学习捕捉时间对应关系和语义信息。CoGenAV具备音频视觉语音识别、视觉语音识别、噪声环境下的语音处理、语音重建与增强、主动说话人检测等功能，适用于智能助手、视频内容分析、工业应用和医疗健康等多个场景。

AI项目与工具 2025年06月11日 80 点赞 0 评论 635 浏览