训练

首页

训练

列表

默认

浏览次数

发布日期

VisionFM

VisionFM

VisionFM是一款专为眼科设计的多模态多任务视觉基础模型，通过大规模预训练支持多种眼科成像模态处理，涵盖疾病筛查、诊断、预后预测、表型细分及全身性生物标志物分析等功能。其在疾病诊断上的表现超越了大部分眼科医生，并具备强大的泛化能力和少样本学习能力。

AI项目与工具 2025年06月12日 83 点赞 0 评论 509 浏览

DrivingDojo

DrivingDojo

DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集，包含18,000个视频片段，涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随（AIF）基准，用于评估世界模型的预测能力，并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。

AI项目与工具 2025年06月12日 85 点赞 0 评论 508 浏览

Sync Labs

Sync Labs

Sync Labs是一款基于AI技术的视频配音工具，其主要功能是实现实时唇形同步，支持多种语言。该工具无需用户进行额外的训练，通过简单的界面操作即可实现音频与视频的完美匹配。它适用于电影、播客、游戏和广告等多种视频内容制作，同时提供了开放API，方便集成到各类应用和服务中。

AI项目与工具 2025年06月12日 96 点赞 0 评论 506 浏览

InstantMesh

InstantMesh

一个基于单张图片，利用先进的稀疏视图大型重建模型（LRM）架构，快速生成3D网格（Mesh）的工具

Ai开源项目 2025年06月05日 51 点赞 0 评论 505 浏览

ChatLearn

ChatLearn

ChatLearn是一款由阿里云开发的高效对齐训练框架，支持多种对齐训练方法，包括RLHF、DPO、OnlineDPO和GRPO。它提供灵活的编程接口、资源调度机制和分布式计算支持，适用于自动化对话系统训练及复杂多模型训练场景。用户可以自定义模型执行流程，实现个性化训练策略。

AI项目与工具 2025年06月12日 90 点赞 0 评论 505 浏览

V-JEPA

V-JEPA

创新的自监督学习模型，它通过预测视频帧的特征表示来学习视频的视觉表示。这种方法不仅能够处理视频内容，还能在图像任务上表现出色，具有广泛的应用潜力。

Ai平台模型 2026年06月23日 0 点赞 0 评论 504 浏览

Skild Brain

Skild Brain

Skild Brain 是 Skild AI 推出的具身智能基础模型，具备强大的泛化能力和多场景适应性，可应用于机器人控制、物体操作、环境导航等任务。其基于大规模数据训练，支持多种机器人平台，适用于工业自动化、物流、医疗及家庭服务等领域。

AI项目与工具 2025年06月11日 72 点赞 0 评论 501 浏览

生成时代

生成时代

AIGC 多模态 API 平台，提供 AIGC 图像生成、图像编辑、视频生成、视频编辑、音频生成、训推一体等 API，免去 GPU 和模型维护成本，帮助开发者快速搭建 AIGC 应用。

Ai平台模型 2025年06月05日 88 点赞 0 评论 501 浏览

LabelU

LabelU

一款轻量级的开源标注工具

Ai平台模型 2026年06月23日 0 点赞 0 评论 497 浏览

HiDiffusion

HiDiffusion

大幅提升扩散模型的图像生成质速度提升6倍，由字节跳动的研究团队开发，只需添加一行代码即可

Ai开源项目 2025年06月05日 10 点赞 0 评论 493 浏览

微信公众账号

微信扫一扫加关注