May, 2023

从口哨到喇叭:通过语言模型揭示编码修辞

TL;DR本研究对狗哨进行了大规模的计算研究,开发了一种类型学并分析了其在历史美国政治家演讲中的使用。研究发现,带有狗哨的有害内容可以逃避毒性检测,从而突显了这种编码语言带来的在线风险。