2024-06-13 速度提高60倍！GaussianCity：重建你的自动驾驶场景(南洋理工大学)

基于NeRF的方法生成3D城市显示出了有希望的生成结果，但在计算上效率不高。最近，3D高斯Splatting（3D-GS）已成为目标级3D生成的高效替代方案。然而，将3D-GS从有限尺度的3D物体和人类扩展到无限尺度的3D城市并非易事。无边界的3D城市生成会产生显著的存储开销（内存溢出问题），因为需要将点扩展到数十亿个，这通常需要数百GB的VRAM来呈现一个跨越10km²的城市场景。

GaussianCity，一个生成性Gaussain Saplatting框架，专门用于通过单次前馈传递高效地合成无边界的3D城市。主要贡献有两点：

1）紧凑的3D场景表示：引入了BEV-Point作为高度紧凑的中间表示，确保无边界场景中的VRAM使用量增长保持不变，从而实现无边界城市的生成。

2）空间感知的高斯属性解码器：提出了空间感知的BEV-Point解码器来生成3D高斯属性，该解码器利用点序列化器整合BEV点的结构和上下文特征。

大量实验表明，GaussianCity在无人机视角和街道视角的3D城市生成中都取得了最先进的结果。特别值得注意的是，与CityDreamer相比，GaussianCity表现出更优越的性能，速度提高了60倍（10.72 FPS vs 0.18 FPS）。

GaussianCity方法介绍

BEV-Point Initialization

在3D-GS中，所有的3D高斯函数在优化过程中都会使用一组预定义的参数进行初始化。然而，随着场景规模的扩大，VRAM的使用量会急剧增加，使得生成大规模场景变得不实际。为了解决这个问题，这里提出了一种高度紧凑的表示方法，即BEV-Point。在BEV-Point表示法中，仅保留可见的BEV点，因为只有它们会影响当前帧的apperance。它确保VRAM的使用量保持不变，因为给定固定的相机参数，可见BEV点的数量不会随着场景规模的增加而增加。