Jun, 2023
利用基础模型最小监督检测政策违规行为
Using Foundation Models to Detect Policy Violations with Minimal Supervision
Sid Mittal, Vineet Gupta, Frederick Liu, Mukund Sundararajan
TL;DR利用大规模文本数据训练的基础模型可以通过硬提示和软提示技术检测政策违规,本文采用链式思考提示模型对该任务进行硬提示,并结合软提示技术进行模型训练和分类解释,基于实验结果提出了有效的政策违规检测工作流程。