May, 2024

大型语言模型基于优化的越狱技术的改进技术

TL;DR提出改进的优化方法、多坐标更新策略等技术来实现大语言模型的监狱破解攻击,并在实验中证明其有效性。