多语言

悦录

悦录依托同花顺的语音识别技术,为用户提供免费的录音转文字、语音转文字、视频字幕等服务,1小时音频最快5分钟出稿,准确率高达97%+,全程加密,文件信息安全。

海豚AI配音

海豚AI配音是一款支持多语言、多音色的文本转语音工具,提供超过500种真人音色和1000多种二次元音色,适用于有声书、自媒体、教育、动漫及广告等领域。支持多人配音、声音克隆、变声等功能,操作简便,适合各类内容创作者提升作品质量。

creatify

Creatify是一款由人工智能驱动的视频广告制作平台,支持根据产品信息自动生成高质量营销视频。其主要功能包括自动视频生成、AI脚本创作、多样化模板选择、动态特效设计及多语言支持。Creatify适用于电商、品牌推广、教育培训等多种场景,帮助用户高效制作专业视频广告,降低时间和成本投入。

Smodin

Smodin.io是一款多语言写作辅助平台,为全球的学生、作家和互联网工作者提供一系列工具来改善写作。它提供文本改写、检测抄袭、自动引用生成和多语言翻译等功能,以提高写作内容的质量和效率。

Krut AI

Krut AI是一款专注于电商领域的AI图像生成工具,提供产品图像生成、模特照片创作、背景移除、图像放大、虚拟试穿等多项功能。用户可通过文本或图片输入快速生成高质量视觉内容,无需复杂操作。平台适用于电商产品展示、广告设计、社交媒体内容制作等多个场景,支持多语言内容生成,助力企业提升视觉表现力和运营效率。

Caveduck

一个AI角色扮演聊天服务,支持中、英、日韩等多语言,提供多种LLM选择,RWD支援良好,任何设备开启网页即用,无需App。

MacWhisper

MacWhisper是一款基于OpenAI Whisper技术的AI音频转文字工具。它能够在本地设备上将音频文件快速转录成文本,并支持多种语言。该工具具有多种音频和视频格式兼容性,提供不同的转录模型选择,支持字幕导出,且具备视频播放功能。最新版本增加了基于Apple芯片的硬件加速,提升了实时语音识别效率,并集成了OpenAI语言模型以提高转录和翻译的准确性。MacWhisper适用于记者、媒体工作

VoxInstruct

VoxInstruct是清华大学开源的语音合成技术,能够根据人类语言指令生成高质量的语音。该系统采用统一的多语言编解码器语言建模框架,将传统的文本到语音任务扩展到了更广泛的人类指令到语音任务。VoxInstruct通过引入语音语义标记和多种无分类器指导策略,提升了语音合成的自然度和表现力。它支持多语言和跨语言合成,适用于智能语音助手、有声读物、教育培训等多个领域。

字节跳动发布“豆包MarsCode”智能开发工具,面向国内开发者免费

豆包MarsCode是一款由字节跳动开发的免费AI编程工具,提供AI驱动的云端集成开发环境(IDE)和智能编程扩展。其主要功能包括代码补全、生成、优化、注释生成、代码解释和错误修复等。MarsCode支持云函数开发,集成API测试、存储和部署工具,并能自动生成JSON Schema。此外,MarsCode扩展支持多种编程语言和IDE,涵盖从代码编辑到单元测试生成的多个辅助功能,显著提升了编码效率和