语音

知存科技

专注研发基于存算一体先进技术的人工智能芯片

Unmute

Unmute 是 Kyutai 推出的低延迟语音交互系统,专注于语音转文字和文字转语音功能。基于先进 AI 模型,提供实时、高效的语音交互体验,支持用户与 AI 进行语音交流,并能将文字内容快速转换为自然流畅的语音输出。其低延迟处理能力实现无缝交互,具备快速集成、随时打断、10秒生成声音、多样化调整等功能,适用于在线教育、智能客服、语音助手、游戏娱乐和企业会议等场景。

Tactiq.io

一个为各种在线会议平台(例如 Google Meet、Zoom 和 MS Teams)提供实时转录服务的平台。Tactiq.io提供实时转录、人工智能生成的会议摘要、行动项目以及提出自定义问题的功能等功能。

Text

将文本转换成歌曲的工具。它使用自然语言处理将文本输入转换为音频组合。该工具允许用户从各种音乐风格和乐器中进行选择,以及调整节奏、键和动态等参数。生成的音轨可以导出为高...

FoloUp

FoloUp 是一款开源的 AI 语音面试平台,能根据职位描述自动生成面试问题,并通过自然语言交互与候选人进行语音面试。系统支持实时分析、评分与报告生成,提供数据仪表盘用于跟踪候选人表现。平台支持一键分享、远程面试和批量招聘,结合语音识别、NLP 和安全数据管理技术,适用于多种招聘场景,提升招聘效率与质量。

创音岛

创音岛是一款集录音转文字、配音、AI写歌及音频编辑于一体的综合性音乐创作与音频处理平台。它采用先进语音识别技术,支持多场景下的文字转录需求;提供多样化的配音选项和智能化音乐编曲功能,帮助用户轻松创作音乐;并配备音频编辑工具,满足用户对音频文件的精细化处理需求。该平台界面友好,操作便捷,适合音乐爱好者、创作者及专业人士使用。

小饿

小饿是饿了么推出的AI语音助手,专为外卖骑手设计,支持语音交互完成接单、确认到店等操作,提升配送效率。具备权益提醒、天气预警、路线提示、订单热力图及收入预估等功能,覆盖多种配送场景,增强用户体验。已在多个城市上线,适用于蜂鸟众包APP用户。

讯飞会议

科大讯飞推出的一款智能、高效、安全的云视频会议协作平台,为用户提供音视频清晰稳定流畅的音视频、多端协同、远程会议、AI降噪、实时多语种字幕、自动生成会议记录等功能。

Avatar IV

Avatar IV 是 HeyGen 推出的 AI 数字人模型,支持用户通过上传照片和语音快速生成逼真视频。该工具基于音频驱动的表情引擎,能精准捕捉语音中的语调、节奏和情感,生成自然流畅的面部表情和动作。操作简单,无需专业技能,适用于多种角色形象,涵盖社交媒体、企业营销、在线教育等多个领域,是高效内容创作的理想选择。

Speechify

Speechify是一款文本转语音的应用程序,通过将文本转换成自然的声音,帮助你理解和记住更多你所阅读的内容。它可以在Chrome、iOS、Android和Mac上使用。