Aug, 2023

SurveyLM: 探索增强语言模型行为中新兴价值观的平台

TL;DR该研究报告介绍了我们关于 SurveyLM 的工作,这是一个用于分析增强语言模型 (ALMs) 在复杂社交环境中以动态方式形成的态度和价值观的平台。通过应用传统研究社交行为的调查和实验方法,我们系统地评估 ALMs,以提供对它们的对齐和新兴行为的前所未有的洞察力。此外,SurveyLM 平台利用 ALMs 的反馈来增强调查和实验设计,加快了高质量调查框架的开发和测试,同时节约资源。通过 SurveyLM,我们旨在揭示影响 ALMs 新兴行为的因素,促进其与人类意图和期望的对齐,从而为负责任地开发和部署先进的社交人工智能系统做出贡献。该白皮书强调了该平台提供可靠结果的潜力,突出了它对对齐研究的重要性以及对未来社交人工智能系统的影响。