May, 2023

Im-Promptu: 基于图像提示的上下文组合

TL;DR本研究探讨了模拟推理对于在可组合元素的视觉刺激下的情境组合的学习的作用,并提出了一个名为Im-Promptu的元学习框架,用于训练多个具有不同组成水平的代理。实验揭示了推广能力和组合度之间的权衡,可以扩展学习到的组合规则到看不见的域,但在组合任务上表现不佳。集中于对象的标记方法配合交叉注意模块生成一致和高保真的解决方案,这种感性偏见特别关键。最后,我们展示了Im-Promptu作为图像生成的直观编程界面的用例。