Nov, 2023

关于大型语言模型的操纵能力与基于数据的人物角色

TL;DR通过数据驱动的协同过滤方法,将用户嵌入到连续矢量空间中并聚类为具有一致观点的群体,以便实现更细致、更准确地理解不同社会群体,并增强模型的可操控性。最后,我们提出了一种有效的方法来将大型语言模型导向特定的个人,并通过学习软提示模型将用户的连续表示映射为虚拟令牌序列,从而使模型能够根据给定用户生成对应的回应。我们的结果表明,相比于一系列基准方法,我们的操控性算法具有更好的性能。