Mar, 2023

使用丰富元数据注释对屏幕人物进行个性化语言建模

TL;DR本文描述了对 Cornell 电影对话语料库中的 863 个发言人进行人工特征标注的方法,这些标注可以用于个性化语言模型,包括特征引用和角色描述,并自动提取了超过 95%的电影的六个 Metadata。实验证明,这些注释可以有效地用于个性化语言模型,可以将语言困惑度降低多达 8.5%。