BriefGPT.xyz
大模型
Ask
alpha
关键词
unsupervised learning objectives
搜索结果 - 2
标点恢复提升结构理解无需监督
非监督学习目标如语言建模和去噪在产生预训练模型方面扮演重要角色,然而,最近的大语言模型的对话能力令人印象深刻,但它们在捕捉文本内的句法或语义结构方面滞后。我们假设这种语言性能和机器能力之间的差异是由于目前流行的预训练目标对语言结构知识的转移
→
PDF
5 months ago
AAAI
图像字幕和 VQA 统一视觉语言预训练
本文提出了一个统一的视觉语言预训练模型,采用共享的多层 Transformer 网络进行编码和解码,通过两个任务的无监督学习目标对大量的图像文本对进行预训练,使得该模型在图像字幕和视觉问答等多个任务上均取得了最先进的结果。
PDF
5 years ago
Prev
Next