Feb, 2024

多元文化常识知识蒸馏

TL;DR通过 MANGO 方法,从概念和文化两个入口点逐步指导大型语言模型,提取文化知识,通过聚类和生成式摘要方法合并,最终获得了 167K 个高准确性的关于 30K 个概念和 11K 个文化的表述,达到了非常显著的提升。将 MANGO 的知识应用于对话系统中,增强了对话系统的整体质量、特异性和文化敏感性,经过人工标注员评价证实。提供数据和代码下载。