type
status
date
slug
summary
tags
category
icon
password
Last edited time
Apr 21, 2024 01:46 PM
😀
3D点云预处理——通往端到端框架的曙光(An End to End Framework is All You Need for 3D Industrial Anomaly Detection)

问题来源

Mvtec3D数据集

💡
正常的点云图应该只对物体本身建模,而不对背景等无关物体进行建模,这样会引来无关的计算,增大误判的概率,使用数据前需要对点云数据进行预处理
正常建模的点云数据
正常建模的点云数据
 
点云数据预处理
点云数据预处理
 

📝 主旨内容

历史

💡
BTF(Back to the Feature)率先引入了点云预处理的方法,之后用到Metec3D的数据集几乎都沿用了此处理方法,M3DM还把它拓展到了Eyescandies数据集

存在的问题

  1. 预处理和训练分离,无法满足工业制造的需求(端到端)
  1. 现有预处理方法处理时间长(几个小时)
  1. 现有预处理方法占用CPU高
  1. 现有预处理方法丢失部分点云细节(部分平面)
3D-ADS
eliahuhorwitzUpdated Aug 26, 2024
M3DM
nomewangUpdated Sep 9, 2024
CPMF
caoyunkangUpdated Aug 28, 2024
notion image
 
notion image
notion image

现状(记录平均处理时间,CPU占用)

处理器:i7-7700 3.6GHz
类别
平均处理时间(秒)
简单去除背景(秒)
备注
bagel
28.39
0.048(提升591倍)
376个样本
cable_gland
1.71
carrot
4.03
cookie
10.52
dowel
1.01
foam
16.62
peach
8.23
potato
6.40
rope
3.76
tire
7.44
mean
8.81

方法对比

💡
直觉:在3D点云的信息噪声多,在预处理点云数据时可以引入RGB信息
In Gate Open, we discover that depth information may work as the noise and degrade the total performance if we select both RGB features and depth features during inference, so we design an attentionbased information entropy fusion module to select the feature for fusion, which can enhance the performance of all classes in MVTec 3D-AD and Eyescandies.(在Gate Open中,我们发现,如果我们在推理过程中同时选择RGB特征和深度特征,深度信息可能会起到噪音的作用,并降低总的性能,因此我们设计了一个基于注意力的信息门槛融合模块来选择融合的特征,这可以提高MVTec 3D-AD和Eyescandies中所有类别的性能。) —— EasyNet
notion image
notion image
 

创新点

  1. 速度提升约176倍
  1. CPU功耗下降XX倍,能在低性能CPU上正常运行
  1. 异常检测精度AUROC提升XX……
  1. 提出一个统一的端到端多模态异常检测框架
不可能三角
不可能三角

实验(探索改进方案)

类别
数量
总耗时
平均
方法
内存
CPU
bagel
376
1:23:54
13.39s
原方法
2.76G
突发1200%
bagel
376
40.5s
避免重复reshape和concatenate(get_edges_of_pc)
4.43G
突发1100%
CPU/GPU并行?
直接去除黑色部分
SAM配合目标检测

一些结果(在速度远超的前提下,保留了更多信息)

RGB
RGB
原3D
原3D
原方法
原方法
Ours
Ours

探索阈值不同的情况下对结果的影响

notion image
原始点云
原始点云
阈值为10
阈值为10
阈值为16
阈值为16

3D-ADS(在bagel类上的结果,不弱于原处理方法,部分指标甚至反超)

AUPRO
I-ROCAUC
P-ROCAUC
Method
论文数值
复现数值
Ours
RGB iNet
0.898
0.902
0.898
Depth iNet
0.701
0.763
0.746
Raw
0.040
0.402
0.374
HoG
0.518
0.712
0.723
SIFT
0.894
0.944
0.944
FPFH
0.894
0.974
0.974
BTF
0.894
0.976
0.976
Method
论文数值
复现数值
Ours
RGB iNet
0.854
0.875
0.854
Depth iNet
0.624
0.69
0.712
Raw
0.578
0.627
0.606
HoG
0.560
0.487
0.493
SIFT
0.696
0.722
0.713
FPFH
0.820
0.825
0.806
BTF
0.938
0.923
0.942
Method
论文数值
复现数值
Ours
RGB iNet
0.983
0.983
0.983
Depth iNet
0.941
0.957
0.951
Raw
0.404
0.803
0.792
HoG
0.782
0.911
0.916
SIFT
0.974
0.986
0.986
FPFH
0.995
0.995
0.995
BTF
0.996
0.996
0.996

🤗 总结归纳

 
原始处理结果
原始处理结果

需要的文件

含mvtec3d和eyescandies数据集,原预处理方法和提出的方法代码

任务

  1. 找到更多用到了原数据处理方法的论文(开源,十个方法左右)
  1. 在同一硬件环境(多组不同硬件)下比较现有方法和我们方法的预处理时间和CPU,内存占用
  1. 预处理后得到的点云数据可视化
  1. 经预处理数据训练后的异常检测结果可视化
  1. 训练结果指标表格(不预处理,原方法预处理(原论文数值+复现数值),Ours)
  1. 探索不同阈值threshold_value下对所有结果的影响,是否可以自适应,还是需要每个类别单独设置阈值
  1. 测试“强行”端到端(预处理+推理)的推理速度(FPS)——在TestDataset__getitem__方法内增加预处理逻辑
  1. 对背景不是纯黑色的Eyescandies数据集表现如何(feature work)
    1. notion image
 

论文参考

李沐 一种多模态数据增强方法
RetNet Transformer的继任者
谷歌 无限注意力

专利参考

📎 参考文章

XUI搭建Reality及客户端推荐LightNet: 多模态工业异常检测轻量化网络
Loading...