Sep, 2023

TopRoBERTa:深伪造文本的拓扑感知作者归属

TL;DR我们提出了 TopRoBERTa 方法,通过在 RoBERTa 模型中加入拓扑数据分析(TDA)层,捕捉深度伪造文本中的更多语言模式。通过从 RoBERTa 的重塑池输出中提取 TDA 特征作为输入,我们展示了具有 TDA 层时处理嘈杂、不平衡和异构数据集的优势。最终,TopRoBERTa 在 2/3 个数据集上胜过传统的 RoBERTa,宏 F1 得分提升高达 7%。