原文链接:https://mp.weixin.qq.com/s/5jOQHHeLFpfdIPIzGn2uqg
自动驾驶最难的,其实不是“看路”,而是“做决策”
自动驾驶系统每一秒都在疯狂自问:“我接下来的 5 秒钟该怎么开?”
这看似简单,实则暗藏杀机。前车会不会突然加塞?行人是否正准备横穿马路?侧方车辆有没有变道意图?这些环境意图并非确定项,而是分裂成成千上万种可能的未来场景(Scenarios)。
真正的智能体必须在毫秒级时间内,在“信念空间(Belief Space)”中权衡这些不确定性,找到那条最安全、最流畅的路径。然而,这种“不确定性规划”长期以来面临三大天敌:
- 规模爆炸: 交互对象越多,未来可能性的组合呈指数级增长。
- 决策长程: 规划 1 秒容易,但预测 5 秒后的博弈,算力开销会瞬间“爆表”。
- 计算瓶颈: 传统算法慢如蜗牛,导致机器人在面对并线博弈时犹豫不决。

破解之道:Vec-QMDP 的“暴力美学”
为了破解算力瓶颈,来自上海交通大学、上海创智学院及理想汽车的研究团队提出了 Vec-QMDP 框架。其核心思想简单而粗暴:不再纠结于算法的精简,而是直接把“不确定性规划”重构成超级并行计算问题。

1. 理论回归:用 POMDP 处理“不确定性”
团队采用了机器人学中处理不确定性的经典框架——POMDP(部分可观测马尔可夫决策过程)。但是传统 POMDP 规划器很难并行化,且计算速度慢。于是,研究者引入了 QMDP 近似,它允许不同的未来情形进行独立搜索,为大规模并行计算打开了大门。
2. 硬件对齐:SIMD 指令级加速
Vec-QMDP 彻底抛弃了传统的面向对象(OOP)代码,采用了面向数据设计(DOD)。通过将内存布局从“结构体数组(AoS)”转为“数组结构体(SoA)”,实现了完全向量化的数据结构:
- 一变多: 原本一次只能算 1 个场景,现在利用现代 CPU 的 SIMD(单指令多数据流) 单元,一次性处理几十甚至上百个场景。
3. 两层向量化:榨干 CPU 每一滴性能
全局向量化(Global): 在多个“平行时空”里同时模拟未来的动态演化与轨迹预测。
局部向量化(Local): 在单个场景内,将最耗时的碰撞检测任务并行化(如:车 vs 车辆、车 vs 行人同时计算),效率倍增。

实验结果:零训练,却更强!
在自动驾驶权威基准测试 nuPlan 上,Vec-QMDP 交出了一份令人震惊的答卷:
- 极致速度: 仅需 9ms 计算时间,就达到了 SOTA(行业最高水平)的决策性能。
- 恐怖吞吐: 在处理 10,000 个场景时,延迟仅为 14ms,树构造吞吐量相比以往方案提升了 227x 至 1073x。
- 降维打击: 最令人振奋的是,这是一个零训练(No Learning)的纯算法规划器。它的表现不仅超越了传统串行模型,甚至优于许多经过大规模数据训练的深度学习模型。


升华:通向通用机器人时代的“安全防线”
Vec-QMDP 的意义远不止于自动驾驶,它为具身智能领域带来了两点深刻启示:
- 跨领域通用性: 这种并行规划能力可以无缝迁移至工业协作机械臂、移动机器人等任何需要在复杂不确定环境下快速决策的场景。
- 大模型的“安全紧箍咒”: 它可以作为端到端模型或 VLA(视觉-语言-动作)大模型的实时鲁棒校验器。端到端模型给策略,Vec-QMDP 在毫秒内完成万次推演进行校验,为黑盒模型套上一层高性能、可解释的安全防线。
总结而言: 并不是所有问题都要交给“大数据”。通过正确的决策理论结合极致的硬件底层优化,经典规划算法依然能爆发惊人的工业价值。
更多信息
该项目目前正处于开源筹备阶段,代码与主页即将上线,欢迎持续关注:
- 🌐 项目主页:https://sii-boluomonster.github.io/VecQMDP-website/
- 📄 论文链接:https://arxiv.org/pdf/2602.08334
- 💻 开源仓库:https://github.com/SII-BoluoMonster/VecQMDP(代码整理中)

发表回复