AD
Admin
Papers
View Site
Edit Paper
BEVFormer: 基于时空Transformer的多相机BEV感知
论文标题
*
英文原标题
(选填)
arXiv / 原文链接
(选填)
粘贴 arxiv ID(如 2401.12345)可自动补全链接
GitHub 链接
(选填)
发表日期
*
发表会议/期刊
(选填)
有开源实现
精选推荐
中文摘要
*
通过时空Transformer构建统一BEV表示,用空间交叉注意力做2D-to-3D投影,时间自注意力融合历史帧,支持3D检测和地图分割。
69/200
工程评注
*
**部署关键**:空间交叉注意力占推理时间60%。 - 需自定义 TensorRT plugin 处理 deformable attention - BEVFormer-Small 在 Orin 上可达 ~10FPS - backbone 量化 INT8,transformer head 保持 FP16 - `num_points=4` 是精度/速度最佳平衡点 - 已成为 BEV 感知方向的事实标准 baseline
支持 Markdown 格式,无字数限制
标签分类
(已选 2 个)
技术方向
(1 selected)
感知
Perception
预测
Prediction
规划
Planning
控制
Control
地图
Mapping
定位
Localization
技术范式
(1 selected)
端到端
End-to-End
VLM
Vision-Language Model
VLA
Vision-Language-Action
世界模型
World Model
强化学习
Reinforcement Learning
数据相关
数据生成
Data Generation
自动标注
Auto Labeling
仿真
Simulation
应用场景
城市道路
Urban Road
高速
Highway
停车
Parking
越野
Off-road
Update Paper
Cancel