OpenEMMA

简介：OpenEMMA是一个开源的端到端自动驾驶多模态模型框架，基于预训练的多模态大型语言模型（MLLMs），能够处理视觉数据和复杂驾驶场景的推理任务。它通过链式思维推理机制提升轨迹规划和感知任务性能，并集成了优化的YOLO模型以提高3D边界框预测的准确性。此外，OpenEMMA支持人类可读的输出，适用于多种驾驶环境，包括城市道路、高速公路、夜间及复杂天气条件下的驾驶。

AI小编 825 阅读 0 评论 36 点赞

项目地址

OpenEMMA是由德州农工大学、密歇根大学和多伦多大学联合开发的开源端到端自动驾驶多模态模型框架。该框架利用预训练的多模态大型语言模型（MLLMs），结合视觉数据和复杂驾驶场景的推理能力，显著提升了模型在轨迹规划和感知任务中的表现。通过引入链式思维推理机制和优化的YOLO模型，OpenEMMA实现了3D边界框预测的高精度，并为自动驾驶研究提供了强大的技术支持。

本文分类：AI项目与工具
本文标签：自动驾驶多模态模型链式思维推理 YOLO模型 3D边界框预测端到端规划视觉问答夜间驾驶复杂天气条件开源项目
浏览次数：825 次浏览
发布日期：2025-06-12 00:00:00
本文链接：https://tools.sihangdaima.com/AIxiangmuyugongju/9685.html

评论列表共有 0 条评论

暂无评论

OpenEMMA

评论列表 共有 0 条评论

发表评论 取消回复

评论列表共有 0 条评论

发表评论取消回复