May, 2023

TalkUp: 为理解授权语言铺平道路的新数据集

TL;DR这项研究首次探索计算机如何探测授权语言使用,定义了授权语言检测为一个新任务,并介绍了一个 Reddit 帖子标记数据集 ——TalkUp,它可以用来训练语言模型以捕捉授权和非授权语言。