ziuch の 博客

机器学习西瓜书学习笔记(吃瓜中ing)

科研全流程加速——让AI为你插上翅膀

基于Docker镜像，通过Notion一键构建自己的博客

Docker部署NotionNext

2024年春招/实习笔试题解合集，持续更新中……

2024年春招/实习笔试题解合集

python常用数据类型，线性结构，树，图，基础算法，数学，动态规划，排序，贪心

数据结构与算法讲义(Python版)

PatchCore中Memory Bank中对核心集选择策略

PatchCore内存库中核心集的选择

chatpaper插件——一个基于GPT4的论文阅读辅助插件

ChatPaper-Click——让GPT4帮你解读论文

FastGPT是一个基于LLMs构建的知识平台，提供数据处理、RAG检索、可视化AI工作流编排等一整套开箱即用的功能，让您轻松开发和部署部署复杂的问答系统，无需进行大量设置或配置。

FastGPT——构建你自己的GPT

OPENAI最新模型，GPT-4o——端到端的多模态大模型，高速智能多模态

GPT-4o——端到端的多模态大模型

Transformer中的位置编码——出现原因，变化历程

Transformer中的位置编码

2024年异常检测顶会汇总

南京景点及美食推荐(三日游)

比较了不同使用GPT4的价格，最后与GPT3.5进行了对比

GPT4的上车姿势

Xboard机场面板及Xrayr后端搭建

重要数据

2024年09月25日周三组会

2024年09月18日周三组会

DINO自监督训练ViT，多视角——异常哪里跑得了，2024年异常检测顶会汇总

2024年08月07日周三组会

多模态异常检测新范式——跨模态差异，异常检测常用指标，Nature微调指令

2024年07月31日周三组会

2024年07月24日周三组会

2024年07月17日周三组会

多模态异常检测新范式——跨模态差异

2024年07月10日周三组会

多模态异常检测新范式——跨模态差异，Nature微调指令，大语言模型动向

2024年07月03日周三组会

多模态异常检测新范式——跨模态差异，LogiCode—大模型解决逻辑异常新范式，近期大语言模型动向

2024年06月26日周三组会

PatchCore的内存库核心集策略，MVTec 3D-AD数据集预处理的意义，LogiCode—大模型解决逻辑异常新范式

2024年06月19日周三组会

PatchCore的内存库核心集策略，近期会议

2024年06月12日周三组会

工业异常检测(内存库)，工业异常检测(重构)，AutoDL攻略

2024年06月05日周三组会

工业异常检测(内存库)，集成学习在大模型上的应用，Docker部署NotionNext

2024年05月29日周三组会

3D点云预处理，集成学习在大模型中的应用

2024年05月22日周三组会

3D点云预处理，DeepSeek，GPT-4o(多模态模型回顾)，私域大模型的实现

2024年05月15日周三组会

3D点云预处理，GPTs 外挂知识库，2024春招/实习题解

2024年05月08日周三组会

3D点云预处理，3D异常检测数据集，图像异常检测未来的可能方向，ChatPaper-Click，2024春招/实习题解

2024年04月30日周二大组会

3D点云预处理，白嫖GPT3.5API，2024春招/实习题解

2024年04月24日周三组会

3D点云预处理，LLLM长上下文大语言模型，SAM结合目标检测

2024年04月17日周三组会

3D点云预处理，难样本结合异常检测，白嫖GPT3.5API

2024年04月10日周三组会

LightNet进度汇报，T-Rex开集目标检测，3D点云预处理

2024年04月03日周三组会

LightNet进度汇报，LLM+LVM结合，思维链

2024年03月27日周三组会

面向工业场景下的多模态异常检测的预计工作

2024年03月20日周三组会

自建Nvidia-Docker镜像并上传到官方仓库，少样本异常检测解决华为难题

2024年03月06日周三组会

Sora国内案例，曹云康简介，CVPR VAND，华为难题(零/少样本分类)

2024年02月28日周三组会

2024年02月22日周四组会

多模态异常检测，论文，华为难题，工具

2024年02月08日周四大组会

华为难题的思考，及其纺织数据集

2024年02月01日周四组会

华为难题的思考(以非训练方法为主)，RGB+3D多模态融合的工业异常检测

2024年01月26日周五组会

大模型落地应用案例集，Github部署个人主页/论文项目

2024年01月19日周五组会

2024年01月12日周五组会

2024年01月05日周五组会

CLIP用于异常检测和定位，ChatPaper-Click插件

2023年12月29日周五组会

GPT4V进行通用异常检测，部分多模态异常检测论文，ChatPaper-Click插件

2023年12月24日周日大组会

从图像异常检测到多模态(以EasyNet举例) 视觉融合 LLM赋能科研

2023年12月15日周五组会

CCF第十四届太湖论坛 模态融合的SimpleNet

2023年12月10日周日大组会

2023年12月02日周六组会

多模态异常检测数据集 UniAD——基于重构的多类异常检测的统一模型

2023年11月26日周日组会

2023年11月17日周五组会

2023年11月10日周五组会

2023年10月27日周五组会

利用Diffusion在通过学习少量的异常样本来生成大量与异常掩膜对齐的异常图像

AnomalyDiffusion(AAAI2024)

Control Net：控制增强的微调方法

基于CLIP的多尺度窗口零样本/少样本异常分类和定位方法

WinCLIP——首次探索零样本异常分类和分割

无需训练的CLIP自适应框架用于零样本异常定位

AnoVL——使用CLIP用于零样本异常定位

GPT-4V在多模态、多领域异常检测任务中的应用，包括图像、视频、点云和时间序列数据，跨多个应用领域，如工业、医疗、逻辑、视频、三维异常检测和定位任务。

通用异常检测新曙光：GPT-4V的全方位异常检测表现

LLM赋能科研

Git常用命令

生成密钥对 修改配置文件 将公钥复制到相应服务器 服务器允许密钥登陆

Window配置免密登录服务器

自主可控算力与人工智能大模型发展

CCF第十四届太湖论坛

研究背景 即时性进化 持续性进化 推理链进化 特色数据构建

无人移动平台自主进化学习方法与应用——张艳宁教授

从模型到大模型 对大模型技术的初步见解 对船海大模型的初步构想 船海的智能实践和大模型展望

打造船海大模型——赵峰研究员

深度学习方法回顾 视觉融合简介 大模型视觉融合 小模型视觉融合

大模型与小模型的思考：以视觉融合为例——吴小俊教授

行业痛点 需求分析 基于数据流理论的解决方案 挑战与创新

面向AI服务的混合任务异构数据流运行时系统——毛睿教授

视觉大模型的诞生背景 发展历程回顾 未来趋势展望 我们的工作

视觉大模型现状与未来——于俊清教授

申威自主架构及生态 申威平台人工智能生态

申威自主芯 赋能人工智能生态——沈金祥高工

生成式大模型的技术解读 讯飞星火应用实践和思考 大模型下一步发展的展望

生成式人工智能的技术解读和产业影响——方四安院长

DSP技术发展现状 DSP技术新机遇 芯领域DSP技术路线 DSP计算平台

国产高性能DSP处理器设计及异构智能计算平台——王国澎总工程师

智能算力需求与发展 自主可控的AI芯片发展趋势 应用案例

智算融合 筑基创新 智能计算系统解决方案加速大模型落地发展——洪源副总裁(夏忠谋博士)

模态融合的SimpleNet

1. 基于EasyNet进行优化(构造异常的策略，模态融合策略) 2. 结合大模型，以解决“一类一模型”问题，继承零/少样本异常检测能力  3. 注入领域知识，为企业实际生产提供科学决策

论文方向

自建图床及随机图片API

2023-11-11

多模态工业互联网异常检测技术研究

开题报告

大模型相关

多模态异常检测数据集

一个模型解决所有类别的异常检测！

UniAD—多类异常检测的统一模型

李沐团队 视觉语言预训练的新型数据增强方式

MixGen: A New Multi-Modal Data Augmentation

重构前后端 采用React构建前端 Django Rest Framework构建后端

ChatpaperV2项目重启(装死中)

第一个使用深度学习模型对红外与可见光图像进行融合的方法

DenseFuse: A Fusion Approach to Infrared and Visible Images(TIP2019)

融合CNN的浅层特征和Transform的全局建模特征，再将融合图像与原始图像输入到模态特定判别器

TGFuse: An Infrared and Visible Image Fusion
Approach Based on Transformer and Generative
Adversarial Network(TIP2023)

SSIM损失和MSE损失

使用在imagenet的第2，3层特征 邻域特征聚合 贪婪策略构建内存库

PatchCore: Towards Total Recall in Industrial Anomaly Detection(CVPR2022)

以重建的方法为主体，辅助使用数据增强的及分割图的深入推断

DRÆM —— A discriminatively trained reconstruction embedding for surface anomaly detection(ICCV2021)

2024-01-08

2024-01-07

通过Github部署自己的个人主页/论文项目

Github个人主页/论文项目教程模板

中国信通院：大模型落地应用案例集

Notion记账模板食用指南

RGB+3D多模态融合的工业异常检测

少量异常样本，插件形式，区分细微异常

华为难题的思考(以非训练方法为主)

3D点云+图片的工业异常检测

华为难题——纺织样本数据

生成异常分割图放入gt文件夹，上传图片至图床(得到图片直链)。逻辑异常标注

华为难题——数据规整

通过rclone挂载onedrive每天定时同步VPS数据

Rclone挂载onedrive

知行合一

技术分享

心情随笔

首页

搜索

文字

往期整理

历史归档

文章分类

文章标签

关于我

友链

Github

CFM环境安装，数据集和checkpoints下载

CFM的踩坑指南

AnomalyPainter协同VLLM-LDM-Tex9K生成多样真实异常

论文

AnomalyPainter——合理，真实，多样我全都要

拉链异常检测项目——对三种不同的拉链检测拉头，链牙，上下齿和布带是否存在异常

研究生

异常检测

拉链异常检测项目

工具

常用命令

打破了原有的比对异常分割图的范式，将评测基准向大语言模型对齐

博零寒假阅读

MMAD——为大模型出的异常检测试卷

password

icon

date

type

slug

类型为Notice的文章将被显示为公告，仅 hexo和next支持；仅限一个公告

📝 主旨内容

能力对比

发展简史

CLIP: 连接文本和图像(ICML2021)

VATT: 多模态自监督下的Transform框架(NeurIPS2021)

BLIP: 统一生成和理解任务(ICML2022)

BLIP2: Q-Former让LLM睁开双眼(ICML2023)

NExT-GPT: 支持全模态输入输出的大语言模型(CoRR2023)

AnomalyGPT: 大规模视觉语言模型用于工业异常检测(AAAI2024)

能力提升

🤗 总结归纳

📎 参考文章