转换 - 智狐AI导航

Voyage Multimodal

Voyage Multimodal-3 是一款多模态嵌入模型，能够处理文本、图像以及它们的混合数据，无需复杂文档解析即可提取关键视觉特征。它在多模态检索任务中的准确率显著高于现有最佳模型，支持语义搜索和文档理解，适用于法律、金融、医疗等多个领域的复杂文档检索任务。

AI项目与工具 2025年06月12日 27 点赞 0 评论 711 浏览

AiSofiya

Sofiya是一款由人工智能驱动的文本到语音转换器，可以快速准确地将文本合成为超过135种语言和方言的自然语音。它支持多种音频格式和频率，并有一个强大的声音工作室，以合并和增强...

Ai语音工具 2026年06月24日 0 点赞 0 评论 711 浏览

Memo.ac

Memo是一款将视频转换为翻译文本、字幕和笔记的工具，它支持多语言，可以在中文、英文、日文和90多种语言之间进行转录和翻译。

Ai语音工具 2025年06月05日 62 点赞 0 评论 711 浏览

ZMO.AI

ZMO.AI 是一款多功能的 AI 图像生成与编辑平台，支持文本或图片输入生成艺术作品、动漫、照片等，具备照片编辑、背景更换、风格迁移等功能。适用于电商、社交媒体、广告设计、数字艺术等领域，帮助用户高效创作高质量视觉内容。

AI项目与工具 2025年06月12日 85 点赞 0 评论 709 浏览

LeiaPix Converter

LeiaPix Converter是其旗下一款由AI技术驱动的免费在线图像处理工具，可帮助用户一键将静态的2D图像转换为动态3D

Ai绘画生成 2025年06月05日 63 点赞 0 评论 708 浏览

Llasa TTS

Llasa TTS是基于LLaMA架构的开源文本转语音模型，支持高质量语音合成、情感表达和音色克隆。采用单层VQ编解码器和Transformer结构，具备多语言支持及长文本处理能力，适用于智能助手、有声读物、游戏娱乐等场景。模型提供不同参数规模版本，支持零样本学习，提升语音自然度和表现力。

AI项目与工具 2025年06月12日 71 点赞 0 评论 707 浏览

imgAK

imgAk 是一款基于AI技术的图像处理工具，支持老照片修复、黑白上色、无损放大、风格转换、卡通化处理、一键抠图等功能，操作简便，适用于多种场景，如艺术创作、广告设计和历史影像修复，提升图像质量与视觉表现力。

AI项目与工具 2025年06月12日 57 点赞 0 评论 706 浏览

Make-A-Character（简称Mach）是由阿里巴巴集团智能计算研究院开发的3D数字人生成框架，通过文本描述快速生成逼真的3D角色。该系统支持灵活的定制化、高度逼真的渲染、完整的角色模型及动画支持。其工作流程包括文本解析、视觉提示生成、参考肖像图像生成、密集面部坐标检测、几何生成、纹理生成、纹理修正、头发生成、资产匹配和角色装配。Mach生成的角色模型可以无缝集成到游戏和电影行业的标准CG

AI项目与工具 2024年01月01日 39 点赞 0 评论 706 浏览

GTSinger

GTSinger是一项由浙江大学研发的开源高质量歌声数据集，包含80.59小时的多语言专业录音棚歌声数据，支持歌声合成、技巧识别、风格迁移和语音到歌声转换等多种任务。它通过音素级标注和真实乐谱支持，为歌唱技巧的研究和应用提供了强大工具。

AI项目与工具 2025年06月12日 77 点赞 0 评论 706 浏览

腾讯混元文生视频

腾讯混元文生视频是一款利用AI技术生成高质量视频内容的工具，可根据文本提示生成具有大片质感的视频。它支持多语言输入，涵盖高清画质、流畅镜头切换及自然场景模拟等功能，适用于电影制作、广告设计、教育培训等多种应用场景。

AI项目与工具 2025年06月12日 22 点赞 0 评论 705 浏览

转换

首页

转换

列表

默认

浏览次数

发布日期