Nov, 2023

基于拓扑数据分析和滑动窗口技术的人工文本边界检测

TL;DR通过使用不同的方法和特征,我们提出了一种基于 RoBERTa 模型和冻结语言模型嵌入特征的新方法,能够超过人类准确度水平和先前考虑的基准,在真实或假文本基准测试上取得更好的结果,并且分析了各种设置下所有提出分类器的鲁棒性以及对人工文本边界检测算法性能的负面影响。