AI - 智狐AI导航

SignLLM

SignLLM是一款支持多语言手语生成的AI模型，能将文本转换为自然流畅的手语视频，覆盖包括ASL、GSL、LSA、KSL在内的八种手语。其核心技术包括离散化与层次化表示、自监督学习、符号-文本对齐等。该工具可用于教育、医疗、法律、媒体等多个场景，提升听障人群的沟通便利性与信息获取能力。

AI项目与工具 2025年06月12日 86 点赞 0 评论 858 浏览

链企AI

由浙江链企智能技术有限公司推出的AI商业搜索工具，链企AI提供企业信息、招投标、知识产权等多维度的商业查询服务，通过自研的大模型技术，帮助用户快速、准确地获取全面的商业信息。

AI服务商 2025年06月05日 56 点赞 0 评论 858 浏览

Moshi

Moshi是一款由法国Kyutai实验室开发的端到端实时音频多模态AI模型，具备听、说、看的能力，并能模拟70种不同的情绪和风格进行交流。Moshi具有多模态交互、情绪和风格表达、实时响应低延迟、语音理解与生成、文本和音频混合预训练以及本地设备运行等特点。它支持英语和法语，主要应用于虚拟助手、客户服务、语言学习、内容创作、辅助残障人士、研究和开发、娱乐和游戏等领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 858 浏览

通义星尘

基于通义大模型设计的一个能够快速创造独有人设、风格的角色对话扮演智能体，可在多种场景中进行多种形式的人工智能互动，广泛应用在角色扮演、教育&服务等领域。

AI写作对话 2025年06月05日 24 点赞 0 评论 858 浏览

GPT-SoVITS

一个强大的语音合成工具，特别适合需要快速生成特定人声的场景。它通过先进的技术实现了高质量的语音克隆和文本到语音转换，支持多种语言，并提供了易于使用的WebUI工具。

Ai平台模型 2026年06月24日 0 点赞 0 评论 858 浏览

LOKI

LOKI是一个由中山大学与上海AI实验室联合推出的合成数据检测基准，用于评估大型多模态模型在识别视频、图像、3D模型、文本及音频等多模态合成数据方面的性能。它包含超过18,000个问题，涵盖26个子类别，支持多层次标注和细粒度异常注释，并通过自然语言解释增强模型的可解释性。LOKI还通过对比多种开源和闭源模型的表现，揭示了这些模型在合成数据检测任务中的优势与不足。

AI项目与工具 2025年06月12日 50 点赞 0 评论 858 浏览

HumanRig

HumanRig是由阿里巴巴团队研发的3D人形角色自动绑定系统，提供大规模高质量数据集和先进算法，支持从粗到细的骨架估计与蒙皮优化。其核心组件包括先验引导骨架估计器（PGSE）和网格-骨架互注意网络（MSMAN），适用于游戏开发、影视制作、VR/AR及数字人应用，有效提升3D角色动画制作效率和质量。

AI项目与工具 2025年06月11日 11 点赞 0 评论 858 浏览

Dubbing AI

DubbingAI 语音生成器作为实时变声器，可以将任何语音转换为优质语音和克隆语音。从游戏玩家到直播主播和内容创作者。每个人都可以使用 Dubbing AI 生成跨年龄、语言和口音的逼真配音。

Ai语音工具 2025年06月05日 19 点赞 0 评论 858 浏览

Podcastle

Podcastle是一款以AI为核心的播客制作平台，集成了录音室、音频与视频编辑器及AI生成的声音工具，支持本地多人协作录音、降噪处理、品牌定制化功能及声音克隆技术。该平台覆盖从创意到发布的全链条服务，并支持内容托管与多平台分发，适用于个人播客、远程采访、教育培训、企业沟通及有声读物制作等多种场景。

AI项目与工具 2025年06月12日 31 点赞 0 评论 859 浏览

HRAvatar

HRAvatar是由清华大学联合IDEA团队推出的单目视频重建技术，能够从普通单目视频中生成高质量、可重光照的3D头像。它采用可学习的形变基和线性蒙皮技术，结合精确的表情编码器和物理渲染模型，实现高精度重建和实时渲染（约155 FPS）。支持材质编辑、跨视角渲染和动画化，适用于数字人、虚拟主播、AR/VR、游戏开发和影视制作等领域。

AI项目与工具 2025年06月11日 43 点赞 0 评论 859 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期