Oct, 2023

自动议会:处理语言模型中的决策不确定性和不一致问题的解决方案

TL;DR该研究论文提出了一种通过自动议会来提高语言模型(LMs)决策能力的方法 - 自动议会由代表特定视角的 AI 代表构成,代表自身包括三个 AI 模型:生成模型、修改模型和评估模型。我们提供了两种生成最佳解决方案的机制:用于响应生成的同时修改机制,以及用于公平评估解决方案的评估机制。整个过程始于每个生成模型根据其代表的理论创建响应,然后修改模型对其他响应进行调整以使其更加自洽,评估模型共同评估最佳的终点响应,最后,修改模型和生成模型根据评估模型的反馈进行学习。在我们的研究中,我们测试了评估机制,比较了单值零指导提示和自动议会少量指导提示在评估道德复杂场景中的应用,结果发现与基线相比,自动议会结构的损失值减少了 57.3%。我们最后讨论了自动议会的一些潜在应用和作为自动道德议会实施时的潜在影响。