BriefGPT.xyz
Ask
alpha
关键词
layout prediction
搜索结果 - 3
TextDiffuser-2:释放语言模型在文本呈现中的能力
通过使用语言模型进行布局规划,TextDiffuser-2 能够实现更合理的文本布局和具有增强多样性的生成。
PDF
7 months ago
CVPR
学习三维物体的形状和布局,无需三维监督
本研究提出了一种基于多视图图像的方法,用于识别三维场景的对象形状和布局,通过在大型数据集上的实验,证明该方法可扩展应用于现实图像,并与依赖三维信息的方法相比,表现得更好。
PDF
2 years ago
AAAI
DOC2PPT: 科学文献自动生成演示文稿
文档导出幻灯片是一项困难的多模态推理任务,我们提出了一种新颖的基于层次序列 - 序列算法的方法,在文档摘要、图像和文本检索、幻灯片结构和布局预测等方面具有较高的性能。
PDF
3 years ago
Prev
Next