Joris Rijsdijk、Christoph Peters、Michael Weinmann 和 Ricardo Marroquim 的论文《Gaussian Point Splatting》已列入 ACM Transactions on Graphics 45(4),将在 SIGGRAPH 2026 展示,时间是 7 月 20 日。

这篇论文有意思的地方,不是又给 3D Gaussian Splatting 起了一个新名字。它改的是渲染负载的形态:不再主要按传统方式绘制每个 Gaussian splat,而是从 Gaussians 里采样像素大小的不透明点,再把点独立 splat 到 framebuffer。

我的判断是,它提供了一条更偏工程吞吐的路线。适合追求超大规模场景实时交互的人看,但不适合被理解成无损替换。

方法核心:把连续 splat 拆成随机点

Gaussian Point Splatting 的基本做法,是从每个 Gaussian 体内采样像素级、完全不透明的点。每个点独立写入 framebuffer。

这一步看起来像“撒点”,但难点不小。同一个像素可能被多个点命中。点少了,opacity 对不上;点多了,画面会变厚,噪声和走样也会冒出来。

论文的关键贡献之一,就是推导每个 Gaussian 应该采样多少点,以及这些点该怎样分布,才能匹配目标 opacity。

这个变化对图形开发者很直接:它把一部分连续合成问题,转成了可并行投点问题。GPU 更喜欢后者。

路线基本做法工程收益画面代价
原始 Gaussian splatting直接绘制 Gaussian splat表达和保真路径更直观,已被大量 3DGS 工作采用大场景下排序、合成和负载压力更突出
Gaussian Point Splatting从 Gaussian 采样不透明点,独立写入 framebuffer更适合大规模并行,负载更均衡有轻微噪声,aliasing 表现与原方法不同

所以它不是“更漂亮”的论文,而是“更好喂 GPU”的论文。这里的取舍很朴素:舍一点洁净,换更大的吞吐空间。

性能来源:atomics、剔除和负载均衡

作者提到的方法包括 64-bit atomics、并行编程 primitives、层级视锥剔除和遮挡剔除。

64-bit 原子操作的作用,是让多个线程可以并发写 framebuffer。层级视锥剔除和遮挡剔除,则尽量不把看不见的 Gaussians 送进后续流程。

这几件事合在一起,指向同一个目标:减少串行瓶颈,让 GPU 上的线程更均匀地干活。

原文称该方法可实时渲染 hundreds of millions of Gaussians。这里不能改写成具体数量、具体帧率或某张显卡上的成绩。公开页面目前没有给出完整帧率和硬件配置。

论文、源码、补充视频和在线 viewer 可以作为验证入口。但它们不等于第三方评测,也不能直接推出“所有 3DGS 管线都能低成本替换”。

限制也很清楚。训练方式、数据分布、显示分辨率、temporal reprojection、后处理,以及硬件上的原子操作性能,都会改变最终体验。补充视频中区分是否使用 temporal reprojection,本身就说明噪声控制不是免费来的。

谁最该看:大场景 3DGS 的开发者和研究者

最该看这篇论文的,是两类人。

一类是图形学与实时渲染开发者。尤其是做大规模 3DGS viewer、数字孪生、机器人仿真、虚拟制片预览的人。对他们来说,关键问题不是单帧能不能更干净,而是视角转动时能不能稳定、加载能不能少等、显存和带宽能不能扛住。

这类团队更现实的动作,不是马上迁移,而是先做小规模接入验证。重点看三件事:现有工具链改动成本、目标硬件上的 64-bit atomics 表现、快速运动时噪声是否可接受。

另一类是关注 3D Gaussian Splatting 大场景应用的研究者。Gaussian Point Splatting 至少给了一个清楚信号:大场景 3DGS 的瓶颈,已经不只在表示和训练,也在实时显示、可见性处理和 GPU 调度。

接下来最该看四个变量:

变量为什么重要目前该怎么判断
测试硬件与帧率决定“实时”到底落在哪类设备上等论文正式细节和可复现实测
接入成本决定现有 3DGS 工具链能不能用先看源码结构和数据格式改动
噪声与 aliasing决定产品画面是否能接受重点测快速运动、细线结构、半透明边界和高频纹理
temporal reprojection决定稳定性是否依赖额外技巧分开看开关前后的画质和延迟

如果这些变量过关,Gaussian Point Splatting 的价值会落在工程侧:让超大规模 3DGS 从“能展示”更接近“能交互”。

如果过不了,它也不是没有价值。它至少把问题摆到台面上:大场景渲染的胜负,很多时候不在表示多优雅,而在谁更会把任务切碎、分发,并让 GPU 持续满载。