DrivingDojo DrivingDojo是一个由中国科学院自动化研究所与美团无人车团队合作研发的数据集,包含18,000个视频片段,涵盖全面的驾驶操作、多智能体交互及开放世界驾驶知识。它定义了动作指令跟随(AIF)基准,用于评估世界模型的预测能力,并支持自动驾驶算法开发、世界模型训练、多智能体交互模拟及罕见事件处理等多个应用场景。 AI项目与工具 2025年06月12日 85 点赞 0 评论 156 浏览
DeepEyes DeepEyes是由小红书团队和西安交通大学联合开发的多模态深度思考模型,基于端到端强化学习实现“用图思考”能力,无需依赖监督微调。它在推理过程中动态调用图像工具,增强对细节的感知与理解,在视觉推理基准测试V* Bench上准确率高达90.1%。具备图像定位、幻觉缓解、多模态推理和动态工具调用等功能,适用于教育、医疗、交通、安防和工业等多个领域。 AI项目与工具 2025年06月11日 21 点赞 0 评论 156 浏览
BuboGPT | 字节大模型 BuboGPT是由字节跳动开发的大型语言模型,能够处理多模态输入,包括文本、图像和音频,并具有将其响应与视觉对象相对应的独特能力。 Ai平台模型 2025年06月05日 99 点赞 0 评论 156 浏览
Pippo Pippo是由Meta Reality Labs研发的图像到视频生成模型,可基于单张照片生成多视角高清人像视频。采用多视角扩散变换器架构,结合ControlMLP模块与注意力偏差技术,实现更丰富的视角生成和更高的3D一致性。支持高分辨率输出及细节自动补全,适用于虚拟现实、影视制作、游戏开发等多个领域。技术方案涵盖多阶段训练流程,确保生成质量与稳定性。 AI项目与工具 2025年06月12日 38 点赞 0 评论 155 浏览
Granite 4.0 Tiny Preview Granite 4.0 Tiny Preview是IBM推出的轻量级语言模型,具备高效计算能力和紧凑结构,支持在消费级GPU上运行多个长上下文任务。采用混合Mamba-2/Transformer架构,结合高效与精准优势,支持无位置编码(NoPE)处理128K tokens上下文。内存需求降低72%,推理时仅激活1B参数,适用于边缘设备部署、长文本分析及企业级应用开发,适合资源受限环境下的AI研究与 AI项目与工具 2025年06月11日 42 点赞 0 评论 155 浏览
大模型GPT中文调教指南 ChatGPT中文调教指南为Awesome ChatGPT Prompts 的汉化版。ChatGPT中文调教指南分享了各种ChatGPT有趣的玩法 Ai提示指令 2025年06月05日 52 点赞 0 评论 155 浏览
MCA MCA-Ctrl是由中科院计算所与国科大联合开发的图像定制生成框架,通过引入SAGI和SALQ注意力控制策略及主体定位模块,提升图像生成质量与一致性。支持零样本图像生成,适用于主体特征保持、背景一致性维护等多种任务,广泛应用于数字内容创作、广告设计、艺术创作等领域。 AI项目与工具 2025年06月11日 82 点赞 0 评论 155 浏览
6Pen Art 支持多种模型和中文描述,不保留版权,不保留数据。6Pen为用户提供了一个强大且易于使用的AI绘画平台,适合需要进行创意绘画和视觉设计的个人或专业人士。 Ai绘画生成 1970年01月01日 0 点赞 0 评论 155 浏览
FlowiseAI FlowiseAI 是一款开源的低代码 AI 工具,允许用户通过可视化拖拽方式快速构建大型语言模型应用。支持多模型集成、对话记忆、API 接口等功能,适用于聊天机器人、工作流自动化和文档问答等多种场景。提供本地、Docker 和云平台部署方式,适合开发者和企业用户进行灵活应用开发。 AI项目与工具 2025年06月12日 18 点赞 0 评论 155 浏览