type
status
date
slug
summary
tags
category
icon
password
Last edited time
Mar 16, 2024 07:01 AM
😀
李沐团队 视觉语言预训练的新型数据增强方式
mix-generation
amazon-scienceUpdated Aug 1, 2024
 

📝 主旨内容

架构

💡
图片融合+文本拼接
notion image

架构变体

增强变种

notion image

增强位置 增强比例

notion image

结果

💡
MixGen不仅使这些模型学习到更好的多模态潜在表示,而且还提高了它们的数据效率
notion image
 
notion image
notion image

🤗 总结归纳

在这项工作中,作者提出了一种新的视觉语言联合数据增强方法,称为 MixGen。在四个最近的最先进模型上添加 MixGen 可以在五个不同的下游任务中实现持续改进。强有力的实证结果表明,MixGen 不仅使这些模型学习到更好的多模态潜在表示,而且还提高了它们的数据效率。

📎 参考文章

UniAD—多类异常检测的统一模型ChatpaperV2项目重启(装死中)
Loading...