AD
AutoDrive AI 知识库
AD AI
首页管理
AD Knowledge Base - Autonomous Driving AI Research
每周收到自动驾驶×大模型领域的精选论文解读

标签筛选

共 6 篇筛选:端到端

GenAD: 用生成式端到端模型实现自动驾驶

GenAD: Generalized Predictive Model for Autonomous Driving

2024-06-17|CVPR 2024
端到端预测规划

将自动驾驶建模为生成式序列预测问题,通过结构化latent空间实现场景预测与规划的统一生成,是端到端方法的新范式。

GitHubarXiv
有代码

★OccNet: 以3D占用栅格表示驾驶场景

Scene as Occupancy

2023-10-01|ICCV 2023
感知端到端

提出3D占用栅格作为统一感知表示,可描述任意形状物体的精细3D结构,弥补传统3D框对不规则障碍物建模的不足。

GitHubarXiv
有代码

★VAD: 向量化场景表示的端到端自动驾驶

VAD: Vectorized Scene Representation for Efficient Autonomous Driving

2023-10-01|ICCV 2023
端到端城市道路高速规划

提出全向量化驾驶场景表示,将agent运动和地图元素建模为显式向量实例,避免密集栅格化,实现高效端到端规划。

GitHubarXiv
有代码

★MapTR: 在线高精地图的结构化建模

MapTR: Structured Modeling and Learning for Online Vectorized HD Map Construction

2023-06-18|ICLR 2023
感知端到端城市道路地图

提出MapTR,通过置换等价建模和分层query设计,实现高效的端到端在线矢量化高精地图构建,消除对离线HD Map的依赖。

GitHubarXiv
有代码

★UniAD: 面向规划的统一自动驾驶框架

Planning-oriented Autonomous Driving

2023-06-18|CVPR 2023 Best Paper
感知端到端预测规划

提出统一自动驾驶框架UniAD,通过query-based设计将感知、预测、规划联合优化在单一网络中,在nuScenes上实现SOTA端到端驾驶性能。

GitHubarXiv
有代码

★BEVFormer: 基于时空Transformer的多相机BEV感知

BEVFormer: Learning Bird's-Eye-View Representation from Multi-Camera Images via Spatiotemporal Transformers

2022-10-01|ECCV 2022
感知端到端

通过时空Transformer构建统一BEV表示,用空间交叉注意力做2D-to-3D投影,时间自注意力融合历史帧,支持3D检测和地图分割。

GitHubarXiv
有代码

关于 AutoDrive AI 知识库

AutoDrive AI 知识库是一个面向自动驾驶 AI 工程师与研究者的垂直论文索引平台。我们持续追踪端到端自动驾驶、视觉语言模型(VLM)、视觉语言动作模型(VLA)、世界模型、自动标注、3D 感知、BEV 感知、运动规划等核心方向的前沿研究,并提供中文解读与工程评注。

每篇论文均附带多维度标签分类(研究方向、技术范式、数据模态、应用场景、关联公司、论文类型),帮助你快速定位与筛选目标文献。无论你在调研最新的端到端架构、寻找可复现的开源实现,还是关注 Waymo、Tesla、华为等企业的技术动态,这里都是你的起点。

订阅周报,获取每周精选论文解读