Nov, 2022

提高作者归属度中的词频

TL;DR本文介绍一种计算作者归属和相似文体任务中相对词频的简单方法,该方法采用与传统方法不同的规范化因子,即仅涉及相关令牌的总数,并使用词嵌入模型来确定语义背景,该方法的性能通常优于传统的基于最高频词的方法,差异在于输入设置。