语音

TTS-vue

TTS-Vue是一个开源的桌面应用程序,它利用了微软的语音合成技术,为用户提供了一个简单易用的文本到语音转换工具。

Narration Box

Narration Box是一种语音合成服务,用户可以创建画外音、旁白、有声读物、音频页面、播客等。它拥有超过700个人工智能增强的仿人叙述者,支持20多种语言,功能强大的语音编辑器,...

Freestyler

Freestyler是一款由多机构合作开发的AI工具,专注于说唱音乐的自动化生成。它通过结合语言模型、条件流匹配技术和神经声码器,实现了从歌词和伴奏到高质量说唱音频的全流程转化。Freestyler还推出了RapBank数据集,并支持零样本音色控制,广泛应用于音乐创作、现场表演、游戏音效及教育等领域。

Chat Video

Chat Video 基于AI的高效视频学习工具,具有语音识别、摘要总结、AI 问答等功能。

Offer蛙

Offer蛙是一款AI驱动的面试辅助工具,支持实时语音识别与答案生成,结合高频题库和简历信息,为用户提供专业级回答。具备代码题优化、多平台适配及隐私保护功能,适用于技术面试和线上面试场景,提升面试表现与专业形象。

Voicify.AI

Voicify AI是创建高质量AI混音的平台,仅需几秒钟即可完成。它允许用户使用AI技术和社群上传的AI语音模型生成AI混音。

MNN

MNN是一个由阿里巴巴开源的轻量级深度学习推理框架,支持多种模型格式和网络结构,具备高性能、低内存占用及跨平台特性。它通过模型量化、计算图优化和异构计算等技术,在移动设备和嵌入式系统中实现高效推理。主要功能涵盖模型转换、硬件加速、内存优化及多模型支持,广泛应用于图像识别、语音处理、智能家居及工业检测等领域。

PodAgent

PodAgent是一款由多所高校与企业联合开发的播客生成框架,采用多智能体协作机制,模拟真实脱口秀场景,自动生成高质量对话内容。系统具备声音匹配、语音合成与表现力增强功能,并提供多语言支持和完整播客结构生成能力。同时,PodAgent引入评估指标,确保内容的专业性与多样性,适用于媒体、教育、企业推广等多个领域。

Audio Enhancer

一个在线音频增强工具,Audio Enhancer使用人工智能算法来帮助用户轻松地减少音频文件中的背景噪音,用于改善音频录音的清晰度和整体质量。

Translate Now

Translate Now是一款免费的翻译应用程序,可让您在 100 多种语言之间翻译文字、语音和图像。它使用 Google 翻译技术,提供快速、准确的翻译。