工具
EmotiVoice
EmotiVoice是网易有道推出的开源文本到语音系统,支持中英文及2000+音色,能根据提示生成带情感的语音。具备情感合成、语音克隆、多语言支持等功能,提供Web界面和API接口,适用于有声读物、智能助手、教育、客服等场景,技术上支持高效部署与模型微调。
ShowBiz AI
ShowBiz AI是一款基于BlackEye多模态视听大模型的专业级AI视频创作平台,专注于文本转动画、全流程AI赋能以及多种视频编辑功能。它支持从文案生成到分镜脚本设计再到编辑工具的一站式服务,涵盖横屏转竖屏、慢动作生成、抠像、扩图、擦除、高光处理、语音转写及语音生成等功能,旨在提升视频制作效率并降低创作成本,同时激发创意灵感。
FireRedASR
FireRedASR是小红书推出的工业级自动语音识别(ASR)模型系列,支持普通话、中文方言和英语,具备高精度和高效推理能力。其包含FireRedASR-LLM和FireRedASR-AED两个版本,分别聚焦于极致精度和计算效率。模型在多个场景如智能助手、视频字幕生成、歌词识别和语音输入中表现出色,且已开源,推动语音识别技术的发展。
AI Poster Maker
通过大量海报素材训练AI,AI Poster Maker能够根据用户提供的文本描述和标题,自动生成海报。它能智能提取信息,即使没有具体指示也能生成相关设计。