Apr, 2024

DESTEIN: 通过通用导航对偶和头部激活融合实现语言模型的过滤式导航

TL;DR该研究提出了 DeStein,一种通过调整激活空间内的内部表示来净化语言模型的新方法,该方法在资源和时间成本较低的情况下实现了混合解毒向量和原始表示,实证结果表明该方法在常用的解毒评估指标上明显优于现有的最先进方法,并保持了令人满意的生成质量和多样性,同时还将该方法扩展到多个大型语言模型,展示了其实用性和可扩展性。