May, 2024

具备大型语言模型的版面生成代理

TL;DR研究了使用 GPT-4V 多模态大语言模型的基于代理的布局生成系统,通过顺序放置对象在虚拟空间中生成反映用户指令的布局,实验证实该方法能以高成功率生成反映用户指令的虚拟空间,并通过消融研究成功地确定了对行为生成性能改善做出贡献的要素。