伪标签生成是RWSeg算法的关键环节,它决定了最终模型的性能上限。传统的全监督方

酸酸甜甜小苏 2025-06-17 01:46:11

伪标签生成是RWSeg算法的关键环节,它决定了最终模型的性能上限。传统的全监督方法依赖人工标注的完整标签,而RWSeg需要从极少量的单点标注出发,通过智能算法生成高质量的密集标签。这个过程就像是一粒种子发芽长大,最终覆盖整个植物一样神奇。 RWSeg的伪标签生成过程首先从图的构建开始。什么是图?简单来说,就是由点和线组成的数学结构,点代表物体,线代表物体间的关系。在RWSeg中,研究者为每个实例构建了一个完全连接的无向图。图中的每个节点都是点云中的一个点,而边则表示点与点之间的连接关系。 这些图有个有趣的特点:虽然不同实例的图包含相同的节点和边,但它们的初始值设置不同。对于第l个实例图,只有那些带有实例标签l的点会被赋予一个正的初始值,其他点的初始值为0。这样设计的目的是让标签信息从已知点向未知点传播。 图构建完成后,下一步是确定边的权重,也就是转移矩阵。权重越大,两个点之间的"亲近度"就越高,标签传播的可能性也就越大。RWSeg考虑了点的空间位置以及实例偏移预测来计算权重。具体来说,如果两个点在3D空间中距离较近,它们之间的权重就较大;如果两个点都指向同一个实例中心,它们之间的权重也会较大。 在计算权重时,RWSeg使用了一个聪明的技巧:它不直接使用点的原始坐标,而是加上预测的偏移向量后的坐标。这样做的好处是,即使两个点在空间位置上很近,但如果它们指向不同的实例中心,它们之间的权重也会比较小,有助于区分边界附近的点。 有了图和权重,RWSeg就可以开始执行随机游走算法了。随机游走的基本思想很直观:想象一个人在图上随机行走,每次都按照边的权重决定下一步的方向,权重大的边被选择的概率也大。经过多次行走后,这个人访问各个节点的频率就反映了节点与初始节点的"亲近度"。 RWSeg的随机游走算法与传统方法的最大区别在于引入了跨图竞争机制。在每次迭代后,它会对同一位置在不同实例图上的节点分数进行调整,使得这些分数符合概率分布(总和为1)。这种调整会抑制在其他实例图中得分较高的点的激活,从而鼓励不同实例图之间的竞争。 这种竞争机制特别适合解决实例分割中的边界歧义问题。想象两个紧挨着的椅子,它们的边界很难区分。通过图间竞争,如果一个点在椅子A的图中得分高,它在椅子B的图中的得分就会被压低,从而帮助算法确定这个点应该属于椅子A。 实验数据也证明了这一点。没有跨图竞争时,RWSeg在ScanNet-v2数据集上椅子类别的AP为64.2%,书架类别的AP为48.1%;加入竞争机制后,这两个指标分别提升到67.4%和52.3%。这个提升在那些紧密排列的物体类别上尤为明显。 RWSeg还采用了一种渐进式的标签更新策略。在每次随机游走迭代后,它会选取一定比例(默认50%)的高置信度点作为新的种子点,用于下一轮迭代。这样,随着迭代的进行,标签信息会从初始的单点逐渐扩散到整个物体,最终形成完整的实例分割结果。

0 阅读:0
酸酸甜甜小苏

酸酸甜甜小苏

酸酸甜甜小苏