自然语言
Gemini Live
Gemini Live是一款由谷歌开发的智能语音助手,拥有自然语言理解和多模态识别能力,支持语音、图像和视频交互。其主要功能包括自然语言对话、多模态识别、个性化语音选择、任务自动化以及智能打断和续接。此外,Gemini Live还与谷歌的原生应用深度集成,提升用户体验。目标用户包括商务人士、技术探索者、多语言用户、创意人士和老年人。
EasyAnimate
EasyAnimate是一款由阿里巴巴研发的AI视频生成工具,支持通过文本或图片生成视频。用户可以上传图片作为视频的起始和结束画面,增加视频编辑的灵活性。该工具最长可生成1分钟的视频,适用于内容创作、教育、营销等多个领域。用户可以通过简单的操作快速生成高质量的视频内容。
Toucan TTS
Toucan TTS是一款由德国斯图加特大学自然语言处理研究所开发的文本到语音合成工具箱。它基于Python和PyTorch构建,支持超过7000种语言及多种方言和变体。主要功能包括多说话人语音合成、语音风格克隆、人机交互编辑、语音参数调整以及发音清晰度和性别特征调整。该工具箱适用于语音模型教学、文字朗读和多语言应用开发等场景,并提供在线交互式演示功能,方便用户快速理解和使用。