Nov, 2022

辅助实体的语言模型用于识别值得检查的句子

TL;DR提出了一种新的文本分类和排序框架,该框架可以自动化地识别政治辩论和演讲文本中值得核查的句子,这种框架结合了句子的语义分析和通过句子中已识别的实体获得的额外实体嵌入,使用五种不同的语言模型、六种不同的知识图谱嵌入模型以及两种组合方法实例化,然后进行了广泛的评估,结果显示神经语言模型明显优于传统的 TF.IDF 和 LSTM 方法,其中 ALBERT 模型始终是所有测试的神经语言模型中最有效的模型,实体嵌入与知识图谱嵌入一起使用明显优于现有基于句子实体之间相似性和相关性分数的文献方法。