type
status
date
slug
summary
tags
category
icon
password
Last edited time
Mar 16, 2024 07:01 AM
李沐团队 视觉语言预训练的新型数据增强方式
mix-generation
amazon-science • Updated Aug 1, 2024
📝 主旨内容
架构
图片融合+文本拼接
架构变体
增强变种
增强位置 增强比例
结果
MixGen不仅使这些模型学习到更好的多模态潜在表示,而且还提高了它们的数据效率
🤗 总结归纳
在这项工作中,作者提出了一种新的视觉语言联合数据增强方法,称为 MixGen。在四个最近的最先进模型上添加 MixGen 可以在五个不同的下游任务中实现持续改进。强有力的实证结果表明,MixGen 不仅使这些模型学习到更好的多模态潜在表示,而且还提高了它们的数据效率。
📎 参考文章
- 作者:ziuch
- 链接:https://ziuch.com/article/MixGen
- 声明:本文采用 CC BY-NC-SA 4.0 许可协议,转载请注明出处。
相关文章