Feb, 2024

MIKO:透过大型语言模型进行多模态意图知识蒸馏,用于社交媒体常识发现

TL;DR为了理解社交媒体帖子中的意图,我们提出了 MIKO,一种多模态意图知识提取框架,通过协同使用大型语言模型和多模态大型语言模型来揭示用户的意图。应用 MIKO 到公开的社交媒体数据集,我们构建了一个包含 137,287 条帖子中 1,372,000 个意图的意图知识库,并通过两阶段注释验证了生成的知识的质量,并对常用的大型语言模型进行意图生成的性能基准测试。我们进一步将 MIKO 应用于讽刺检测数据集,并提取出一个学生模型来展示应用意图知识的下游效益。