数据

CAD

CAD-MLLM 是一款基于多模态输入生成参数化 CAD 模型的系统,融合了文本、图像和点云等多种数据形式。它通过命令序列与大型语言模型的结合,实现了高效的数据对齐与处理,并提出了创新的评估指标。CAD-MLLM 具备强大的鲁棒性和交互式设计能力,适用于工业设计、建筑设计、汽车制造等多个领域。

Vanna

Vanna 是一款开源的 Python RAG 框架,能够基于大型语言模型生成精确的 SQL 查询。它支持多类型数据库与 LLMs,采用检索增强生成技术提高查询准确性,同时保障数据安全。Vanna 还具备自定义前端界面和用户反馈机制,广泛适用于数据分析师、BI 工具、客户支持系统及数据科学项目等领域。

EICopilot

EICopilot是百度研究院开发的企业信息搜索工具,基于AI智能体和大型语言模型,实现自然语言到图数据库查询的精准转换。具备自动脚本生成、意图识别、查询掩码等技术,提升信息检索效率与准确性。适用于金融分析、企业调查、市场研究等多个领域,支持复杂关系查询与结果提炼。

Objaverse

Objaverse 是一个为3D领域提供巨大资源的数据库,它不仅支持 AI 模型的训练和3D内容的生成,还与流行的3D编辑软件 Blender 兼容。

Mendeley

一款由Elsevier公司提供的免费文献管理软件,Mendeley可以帮助您存储、组织、记录、共享和引用参考和科研数据,特别适合科研人员、学者和学生使用。

DELIFT

DELIFT是一种针对大型语言模型微调的数据优化算法,通过成对效用度量与次模优化技术,有效减少数据量需求,同时维持甚至提升模型性能。它适用于指令调优、任务特定微调及持续微调三个关键阶段,并具备高计算效率和广泛适用性,广泛应用于数据科学家、研究人员及教育工作者等领域。

MeetingMind

MeetingMind是一款利用AI技术自动转录会议音频并提取关键信息的工具,支持任务分配、决策追踪和风险识别等功能,适用于企业会议、远程协作、项目管理和教育培训等多种场景,显著提升会议效率和执行力。

DrivingDojo

DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集,包含18,000个视频片段,涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随(AIF)基准,用于评估世界模型的预测能力,并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。

CreatiLayout

CreatiLayout 是一种先进的布局到图像生成技术,由复旦大学与字节跳动联合开发。它基于大规模布局数据集 LayoutSAM,结合 SiamLayout 框架和 MM-DiT 架构,实现高质量、细粒度可控的图像生成。同时,其 LayoutDesigner 工具支持多种输入方式,帮助用户优化布局设计。适用于海报制作、室内设计、视觉创作及教学等多个领域。

万物追踪

万物追踪是一款基于生成式AI技术的信息推送工具,能从全球数据中精准捕捉用户关心的事件,如政策变化、股票动态、体育赛事等,并实时生成定制内容推送给用户。用户可自由订阅感兴趣的主题,系统自动持续追踪并推送更新。适用于财经、科技、体育、教育和娱乐等多个领域,提供高效、个性化的信息获取体验。