Oct, 2020

使用自然语言模型生成偏见新闻的威胁

TL;DR本文利用威胁模型,展示公开可获得的语言模型能够可靠地生成偏见新闻内容,并使用可控文本生成生成大量高质量的偏见新闻文章。通过80个参与者的主观评价,证明所生成的偏见新闻通常是流畅的;通过24名参与者的偏见评估,证明所生成文章的偏见(左或右)通常是明显的,可以轻易地被识别。