MMSep, 2022

使用文本对文本转换变压器从短文本中提取关键词

TL;DR探讨了 Text-To-Text Transfer Transformer (T5) 语言模型在波兰语 (plT5) 中对短文本段进行内在和外在关键词提取的相关性。通过对新的波兰开放科学元数据语料库(POSMAC)的评估,比较了四种不同方法得到的结果,其中 plT5kw 模型在频繁和稀疏表示关键词方面得到了特别有前途的结果。还讨论了模型在新闻和电话对话稿件的表现,并尝试在内在和外部关键词提取的情况下评价文本模型的挑战。