Jun, 2024

多社交:机器生成的社交媒体文本检测的多语言基准

TL;DR该研究提出了第一个多语种(22 种语言)和多平台(5 个社交媒体平台)数据集 ——MultiSocial,用于在社交媒体领域评估机器生成文本检测的性能,结果显示 fine-tuned 的检测器在社交媒体文本上训练没有问题,并且训练过程中选择的平台对结果有影响。