BriefGPT.xyz
Ask
alpha
关键词
visio-linguistic representations
搜索结果 - 3
HL 数据集:将高层语言概念与视觉相结合
本文介绍一个新的高级数据集(High-Level Dataset),可以拓展经典 COOC 数据集,使得机器学习模型更好地理解抽象概念,并进一步提升模型的多模态融合能力。
PDF
a year ago
EMNLP
Lexi: UI 语言的自监督学习
本研究探索如何利用 UI 说明书中的图像来学习 UI 屏幕及其组件的通用视觉 - 语言表示,并提出了一种名为 Lexi 的预训练模型,该模型可处理 UI 屏幕的独特特点,包括其丰富的文本和上下文敏感性。通过创建包含 114k UI 图像及其
→
PDF
a year ago
我们是否正确地进行预训练?更深入地挖掘视觉语言预训练
该研究在研究预训练数据集的选择时发现,与下游任务相似的自动生成数据集是预训练的更好选择,而某些合理的预训练数据集对某些下游任务完全无效,这表明视听语言预训练仍需要简单的设计选择来实现接近最新成果的结果。
PDF
4 years ago
Prev
Next