★DriveVLM: 视觉语言模型驱动的自动驾驶
DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models
2024-02-19|CoRL 2024
城市道路VLM规划
提出DriveVLM框架,将视觉语言大模型融入自动驾驶全链路,通过场景理解、场景分析和分层规划三阶段实现复杂场景推理决策。
arXiv
DriveVLM: The Convergence of Autonomous Driving and Large Vision-Language Models
提出DriveVLM框架,将视觉语言大模型融入自动驾驶全链路,通过场景理解、场景分析和分层规划三阶段实现复杂场景推理决策。
VAD: Vectorized Scene Representation for Efficient Autonomous Driving
提出全向量化驾驶场景表示,将agent运动和地图元素建模为显式向量实例,避免密集栅格化,实现高效端到端规划。
MapTR: Structured Modeling and Learning for Online Vectorized HD Map Construction
提出MapTR,通过置换等价建模和分层query设计,实现高效的端到端在线矢量化高精地图构建,消除对离线HD Map的依赖。