BriefGPT.xyz
大模型
Ask
alpha
关键词
multimodal behavior understanding tasks
搜索结果 - 1
为预训练语言模型整合非语言线索而文本化多模态信息
本文研究了如何将非语言性特征(例如视觉和听觉)转化为对应的文本描述,并将其与口头文本结合,从而将多模态信息整合到基于文本的预训练大语言模型中。我们称此方法为 TextMI,并在情感、幽默和讽刺检测等多个下游任务中进行了 fine-tune,
→
PDF
a year ago
Prev
Next