Jun, 2024

改进的少样本越狱能够规避对齐的语言模型及其防御

TL;DR使用少量样本演示和特殊系统标记,通过随机搜索精确破解文本语言模型(LLMs),以获得高准确率的自动语音识别结果(ASRs)。