type
status
date
slug
summary
tags
category
icon
password
Last edited time
Apr 21, 2024 01:46 PM
3D点云预处理——通往端到端框架的曙光(An End to End Framework is All You Need for 3D Industrial Anomaly Detection)
问题来源
Mvtec3D数据集
正常的点云图应该只对物体本身建模,而不对背景等无关物体进行建模,这样会引来无关的计算,增大误判的概率,使用数据前需要对点云数据进行预处理
📝 主旨内容
历史
BTF(Back to the Feature)率先引入了点云预处理的方法,之后用到Metec3D的数据集几乎都沿用了此处理方法,M3DM还把它拓展到了Eyescandies数据集
存在的问题
- 预处理和训练分离,无法满足工业制造的需求(端到端)
- 现有预处理方法处理时间长(几个小时)
- 现有预处理方法占用CPU高
- 现有预处理方法丢失部分点云细节(部分平面)
3D-ADS
eliahuhorwitz • Updated Aug 26, 2024
M3DM
nomewang • Updated Sep 9, 2024
CPMF
caoyunkang • Updated Dec 27, 2024
现状(记录平均处理时间,CPU占用)
处理器:i7-7700 3.6GHz
类别 | 平均处理时间(秒) | 简单去除背景(秒) | 备注 |
bagel | 28.39 | 0.048(提升591倍) | 376个样本 |
cable_gland | 1.71 | ㅤ | ㅤ |
carrot | 4.03 | ㅤ | ㅤ |
cookie | 10.52 | ㅤ | ㅤ |
dowel | 1.01 | ㅤ | ㅤ |
foam | 16.62 | ㅤ | ㅤ |
peach | 8.23 | ㅤ | ㅤ |
potato | 6.40 | ㅤ | ㅤ |
rope | 3.76 | ㅤ | ㅤ |
tire | 7.44 | ㅤ | ㅤ |
mean | 8.81 | ㅤ | ㅤ |
方法对比
直觉:在3D点云的信息噪声多,在预处理点云数据时可以引入RGB信息
In Gate Open, we discover that depth information may work as the noise and degrade the total performance if we select both RGB features and depth features during inference, so we design an attentionbased information entropy fusion module to select the feature for fusion, which can enhance the performance of all classes in MVTec 3D-AD and Eyescandies.(在Gate Open中,我们发现,如果我们在推理过程中同时选择RGB特征和深度特征,深度信息可能会起到噪音的作用,并降低总的性能,因此我们设计了一个基于注意力的信息门槛融合模块来选择融合的特征,这可以提高MVTec 3D-AD和Eyescandies中所有类别的性能。) —— EasyNet
创新点
- 速度提升约176倍
- CPU功耗下降XX倍,能在低性能CPU上正常运行
- 异常检测精度AUROC提升XX……
- 提出一个统一的端到端多模态异常检测框架
实验(探索改进方案)
类别 | 数量 | 总耗时 | 平均 | 方法 | 内存 | CPU |
bagel | 376 | 1:23:54 | 13.39s | 原方法 | 2.76G | 突发1200% |
bagel | 376 | ㅤ | 40.5s | 避免重复reshape和concatenate(get_edges_of_pc) | 4.43G | 突发1100% |
ㅤ | ㅤ | ㅤ | ㅤ | CPU/GPU并行? | ㅤ | ㅤ |
ㅤ | ㅤ | ㅤ | ㅤ | 直接去除黑色部分 | ㅤ | ㅤ |
ㅤ | ㅤ | ㅤ | ㅤ | SAM配合目标检测 | ㅤ | ㅤ |
一些结果(在速度远超的前提下,保留了更多信息)
探索阈值不同的情况下对结果的影响
3D-ADS(在bagel类上的结果,不弱于原处理方法,部分指标甚至反超)
AUPRO
I-ROCAUC
P-ROCAUC
Method | 论文数值 | 复现数值 | Ours |
RGB iNet | 0.898 | 0.902 | 0.898 |
Depth iNet | 0.701 | 0.763 | 0.746 |
Raw | 0.040 | 0.402 | 0.374 |
HoG | 0.518 | 0.712 | 0.723 |
SIFT | 0.894 | 0.944 | 0.944 |
FPFH | 0.894 | 0.974 | 0.974 |
BTF | 0.894 | 0.976 | 0.976 |
Method | 论文数值 | 复现数值 | Ours |
RGB iNet | 0.854 | 0.875 | 0.854 |
Depth iNet | 0.624 | 0.69 | 0.712 |
Raw | 0.578 | 0.627 | 0.606 |
HoG | 0.560 | 0.487 | 0.493 |
SIFT | 0.696 | 0.722 | 0.713 |
FPFH | 0.820 | 0.825 | 0.806 |
BTF | 0.938 | 0.923 | 0.942 |
Method | 论文数值 | 复现数值 | Ours |
RGB iNet | 0.983 | 0.983 | 0.983 |
Depth iNet | 0.941 | 0.957 | 0.951 |
Raw | 0.404 | 0.803 | 0.792 |
HoG | 0.782 | 0.911 | 0.916 |
SIFT | 0.974 | 0.986 | 0.986 |
FPFH | 0.995 | 0.995 | 0.995 |
BTF | 0.996 | 0.996 | 0.996 |
🤗 总结归纳
需要的文件
含mvtec3d和eyescandies数据集,原预处理方法和提出的方法代码
- 阿里云盘(适合Autodl可以自己存一份很方便加载到autodl的实例中,但不能分享压缩包所以链接内没有显示数据集)
- 123网盘(后兴起的网盘,主打大容量2T,不限速 可提取直链)
- 南航云盘(学生账号容量10G,老师账号容量500G,走学校内网速度快 可提取直链)
任务
- 找到更多用到了原数据处理方法的论文(开源,十个方法左右)
- 在同一硬件环境(多组不同硬件)下比较现有方法和我们方法的预处理时间和CPU,内存占用
- 预处理后得到的点云数据可视化
- 经预处理数据训练后的异常检测结果可视化
- 训练结果指标表格(不预处理,原方法预处理(原论文数值+复现数值),Ours)
- 探索不同阈值
threshold_value
下对所有结果的影响,是否可以自适应,还是需要每个类别单独设置阈值
- 测试“强行”端到端(预处理+推理)的推理速度(FPS)——在
TestDataset
的__getitem__
方法内增加预处理逻辑
- 对背景不是纯黑色的Eyescandies数据集表现如何(feature work)
论文参考
李沐 一种多模态数据增强方法
RetNet Transformer的继任者
谷歌 无限注意力
专利参考
📎 参考文章
- 作者:ziuch
- 链接:https://ziuch.com/article/Point-Cloud-Preprocessing
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。
相关文章