T-Rex2:文图协同实现通用目标检测知行合一这是一个可提示且可交互的开放集物体检测模型,既可以接受文本提示,也可以接受视觉提示(在同一图片或跨多图片的盒子或点)作为物体检测的输入。它具备强大的零次学习物体检测能力,且对各种情景都非常实用,仅需一套权重。2024-3-31 论文 目标检测