BriefGPT.xyz
Ask
alpha
关键词
visual layout
搜索结果 - 2
PosterLlama:连接语言模型的设计能力与内容感知布局生成
PosterLlama 是一种生成视觉上连贯且文本相关的布局的网络,通过重新格式化布局元素为 HTML 代码并利用语言模型中嵌入的丰富设计知识来进行设计,通过独特的基于深度的海报增强策略提高模型的鲁棒性。在多个基准测试中,PosterLla
→
PDF
3 months ago
AAAI
VisualMRC:基于文档图片的机器阅读理解
本研究提出了一个名为 VisualMRC 的新的视觉机器阅读理解数据集,包含来自多个网络域的 10,000 多个文档图像,以及 30,000 多个问题和答案对,以帮助发展自然语言理解和生成能力。此外,研究还引入了一个扩展了现有序列到序列模型
→
PDF
3 years ago
Prev
Next