语音

讯飞会议

科大讯飞推出的一款智能、高效、安全的云视频会议协作平台,为用户提供音视频清晰稳定流畅的音视频、多端协同、远程会议、AI降噪、实时多语种字幕、自动生成会议记录等功能。

Uberduck

Uberduck是一个开源的语音AI社区,可以帮助用户在几分钟内通过api创建人工智能生成的音频应用程序。它允许用户使用5000 +富有表现力的声音制作AI画外音,并使用他们的AI生成的说唱...

uTools

一个多功能、现代化的效率工具平台,uTools 提供了多样化的功能,满足你不同的需求,成为一款功能强大的个人效率助理。

Actor Mode

Actor Mode 是由 ElevenLabs 开发的 AI 语音生成工具,支持用户通过自身声音生成风格一致的语音内容。它具备多语言支持、语音属性调节、即时生成等功能,适用于有声读物、视频配音、虚拟助手等多个领域。用户可通过录制或上传音频,让 AI 提取语音特征并生成符合要求的语音输出,提高创作效率与个性化表达。

OSUM

OSUM是一款由西北工业大学研发的开源语音理解模型,结合Whisper编码器与Qwen2 LLM,支持语音识别、情感分析、说话者性别分类等多种任务。采用“ASR+X”多任务训练策略,提升模型泛化能力和稳定性。基于约5万小时语音数据训练,性能优异,适用于智能客服、教育、心理健康监测等多个领域。

FoloUp

FoloUp 是一款开源的 AI 语音面试平台,能根据职位描述自动生成面试问题,并通过自然语言交互与候选人进行语音面试。系统支持实时分析、评分与报告生成,提供数据仪表盘用于跟踪候选人表现。平台支持一键分享、远程面试和批量招聘,结合语音识别、NLP 和安全数据管理技术,适用于多种招聘场景,提升招聘效率与质量。

PocketPod

PocketPod是一款基于人工智能技术的个性化播客生成工具。它可以根据用户的兴趣和需求,自动创建包括每日新闻更新和特定主题深入探讨在内的播客内容。用户还可以将PDF文件等文档转换成播客形式,便于在多种场合下收听。该工具主要服务于忙碌人士、学生及播客爱好者,提供了个性化新闻播客、广泛话题覆盖、按需内容创建、文档转播客等功能,并支持与用户的日历和提醒系统集成。

小饿

小饿是饿了么推出的AI语音助手,专为外卖骑手设计,支持语音交互完成接单、确认到店等操作,提升配送效率。具备权益提醒、天气预警、路线提示、订单热力图及收入预估等功能,覆盖多种配送场景,增强用户体验。已在多个城市上线,适用于蜂鸟众包APP用户。

逗逗

逗逗是心影随形(上海)技术有限公司开发的AI游戏伙伴,它通过语音互动、情绪陪伴、智能攻略、笑话分享和多角色扮演,为玩家提供个性化和有趣的游戏体验。

睿声Reecho

一款专注于5秒瞬时语音克隆和超拟真语音合成的AI语音克隆平台。