Feb, 2024

机器生成文本本地化

TL;DR该研究旨在识别机器生成的文本并对文档中的机器生成部分进行定位,以避免由于对部分新闻文章的机器生成篡改而导致整个文档的误导。通过利用上下文信息,该方法能够在多个句子同时预测其是否为机器生成,从而提高了性能。与之前的研究相比,该方法在 GoodNews、VisualNews、WikiText、Essay 和 WP 五个不同数据集上提高了 4-13% 的平均准确率(mAP)。