AI - 智狐AI导航

LOKI

LOKI是一个由中山大学与上海AI实验室联合推出的合成数据检测基准，用于评估大型多模态模型在识别视频、图像、3D模型、文本及音频等多模态合成数据方面的性能。它包含超过18,000个问题，涵盖26个子类别，支持多层次标注和细粒度异常注释，并通过自然语言解释增强模型的可解释性。LOKI还通过对比多种开源和闭源模型的表现，揭示了这些模型在合成数据检测任务中的优势与不足。

AI项目与工具 2025年06月12日 50 点赞 0 评论 859 浏览

HumanRig

HumanRig是由阿里巴巴团队研发的3D人形角色自动绑定系统，提供大规模高质量数据集和先进算法，支持从粗到细的骨架估计与蒙皮优化。其核心组件包括先验引导骨架估计器（PGSE）和网格-骨架互注意网络（MSMAN），适用于游戏开发、影视制作、VR/AR及数字人应用，有效提升3D角色动画制作效率和质量。

AI项目与工具 2025年06月11日 11 点赞 0 评论 859 浏览

TechGPT

TechGPT是一个强大的垂直领域大语言模型，具备处理专业领域文本的能力，并在信息抽取、智能问答和序列生成等方面表现出色。

Ai平台模型 2026年06月24日 0 点赞 0 评论 859 浏览

可灵2.1

可灵2.1是快手推出的AI视频生成模型，现已上线可灵AI视频平台。该模型包含标准版、高品质版和大师版，分别满足不同创作需求，支持图生视频和文生视频功能。标准版生成速度快，高品质版效果出色，大师版提供影视级效果。用户可通过上传图片或输入文字生成视频，并设置参数后下载使用。适用于短视频、营销广告、AI短剧、专业影视及教育培训等场景。

AI项目与工具 2025年06月11日 57 点赞 0 评论 859 浏览

Dubbing AI

DubbingAI 语音生成器作为实时变声器，可以将任何语音转换为优质语音和克隆语音。从游戏玩家到直播主播和内容创作者。每个人都可以使用 Dubbing AI 生成跨年龄、语言和口音的逼真配音。

Ai语音工具 2025年06月05日 19 点赞 0 评论 859 浏览

HiDream

HiDream-I1是一款由HiDream.ai团队开发的开源AI图像生成模型，具备17亿参数，支持多种图像风格生成，包括真实、卡通和艺术风格。其在提示词理解、细节渲染和图像一致性方面表现出色，适用于艺术创作、商业设计、教育科研等领域。模型采用扩散模型和混合专家架构（MoE），并集成多种文本编码器，实现高质量与高效率的图像生成。项目已在GitHub和HuggingFace开源，便于研究与应用。

AI项目与工具 2025年06月12日 64 点赞 0 评论 860 浏览

SWEET

SWEET-RL是Meta开发的多轮强化学习框架，专为提升大型语言模型在协作推理任务中的表现而设计。通过引入训练时的额外信息优化“批评者”模型，实现精准的信用分配与策略优化。在ColBench基准测试中，其在后端编程和前端设计任务中表现出色，成功率提升6%。适用于文本校对、社交媒体审核、广告合规等多种场景，具备高度的通用性和适应性。

AI项目与工具 2025年06月12日 15 点赞 0 评论 860 浏览

Moshi

Moshi是一款由法国Kyutai实验室开发的端到端实时音频多模态AI模型，具备听、说、看的能力，并能模拟70种不同的情绪和风格进行交流。Moshi具有多模态交互、情绪和风格表达、实时响应低延迟、语音理解与生成、文本和音频混合预训练以及本地设备运行等特点。它支持英语和法语，主要应用于虚拟助手、客户服务、语言学习、内容创作、辅助残障人士、研究和开发、娱乐和游戏等领域。

AI项目与工具 2025年06月12日 73 点赞 0 评论 860 浏览

AniTalker

AniTalker是一款先进的AI工具，能将单张静态人像与音频同步转化为生动的动画对话视频。它通过自监督学习捕捉面部动态，采用通用运动表示和身份解耦技术减少对标记数据的依赖，同时结合扩散模型和方差适配器生成多样且可控的面部动画。AniTalker支持视频驱动和语音驱动两种方式，并具备实时控制动画生成的能力。

AI项目与工具 2025年06月12日 62 点赞 0 评论 860 浏览

GradeAssist

GradeAssist是一款面向教师的AI辅助论文评分工具，支持自定义评分标准、抄袭检测及AI写作分析等功能，可快速生成客观一致的评分结果并提供个性化反馈，有助于提升评分效率、维护学术诚信及减轻教师工作压力。

AI项目与工具 2025年06月12日 52 点赞 0 评论 860 浏览

AI

首页

AI

列表

默认

浏览次数

发布日期