Dec, 2023

在大型语言模型中通过思维链条推理来调节新的网络仇恨浪潮

TL;DR在线仇恨是一个不断升级的问题,对互联网用户的生活产生负面影响,并由于不断发展的事件而面临快速变化,进而导致新的在线仇恨浪潮构成重大威胁。为了解决这一关键问题,我们提出了一种名为 HATEGUARD 的新型框架,通过利用最近引入的思维链(CoT)提示技术,借助大型语言模型(LLMs)的能力,采用基于推理的方法有效地管理新的在线仇恨浪潮,并通过自动生成和更新检测提示来实现基于提示的零 - shot 检测,以应对新的在线仇恨浪潮。