杭州弈儒软件技术有限公司
飞书用户9314
隐式场
分享
Occupancy Net(占据网络)
输入“/”快速插入内容
Occupancy Net(占据网络)
飞书用户9314
5月2日修改
Occupancy Networks(占据网络)是一种
用于3D重建和几何表示
的深度学习方法,由 Mescheder 等人在 2019 年提出,其核心思想是——
用一个神经网络来连续地表示三维空间中任意一点是否属于某个物体
。这是相对于传统离散体素(Voxel)或点云(Point Cloud)表示的一种更精细、连续、内存高效的方式。
•
有啥
用 这个目标——“从照片构建一个包含占据状态和语义信息的密集 3D 体积表示”——的意义在于,它提供了一个
极其丰富和完整的现实世界三维理解
,这对于许多需要与三维环境进行交互或理解的应用来说
至关重要
。
🚪核心概念:Occupancy Function(占据函数)
Occupancy Network 学习一个函数:
其中:
•
输入是一个点
(三维空间中的某个坐标点)
•
是条件输入,比如图像特征、点云特征等(可选)
•
输出是该点被物体“占据”的概率(0~1之间)
这个函数就像个“会思考的三维探测仪”,你问它空间中的任一点,它告诉你“这点是不是在物体内部”。
🧠 网络结构简述
Occupancy Network 本质上是一个
多层感知机(MLP)
,如下所示:
代码块
Plain Text
Input: 3D point (x, y, z) + optional condition (e.g. image feature vector)
↓
Positional encoding(可选)
↓
MLP(带ReLU等激活)
↓
Sigmoid 输出是否被占据的概率
通常该网络会
条件化
在一个图像编码器或者点云编码器上,这样可以从图像或稀疏点云中恢复出完整的3D形状。
🎯训练目标
训练时,采样一批空间点
,判断其是否落在真实物体的体积内(通常通过3D mesh或ground truth voxels判断),得到 ground truth labels
,然后最小化二分类交叉熵损失:
🧱相较其他方法的优势
方法
分辨率
是否连续表示
优势
Voxels
离散
❌
实现简单,但内存开销大
Point Clouds
离散
❌
灵活,但缺乏拓扑结构
Meshes
显式
❌
难以优化拓扑