多语言

X-Me

X-Me是一个创新的AI Avatar视频生成平台,允许用户创建个性化的AI化身视频。用户可以上传自拍视频,输入文本,并生成支持147种语言的多语言视频内容。

TTS-vue

TTS-Vue是一个开源的桌面应用程序,它利用了微软的语音合成技术,为用户提供了一个简单易用的文本到语音转换工具。

GOT-OCR2.0

创新的OCR模型,它通过先进的技术提供了精准、高效的OCR解决方案。无论是文档数字化、场景文本识别还是票据处理等应用场景,GOT-OCR 2.0都能提供强大的支持。

Notta

Notta是由MIND CRUISER LIMITED推出的语音转写软件,主要针对个人使用,并在海外拥有数十万用户。这款软件具有录音实时转写、音/视频导入转写、文本多格式导出、音频标记等功能,...