Nov, 2023

InCA: 大型语言模型的车载会话系统评估的重新思考

TL;DR在研究中提出了一套特定于汽车问答系统的关键绩效指标(KPIs)和相应的数据集,通过初步的全面实证评估证明了该方法的有效性,并研究了在提示中使用不同角色的影响,发现这样做可以增强模型在评估中模拟多样观点的能力,从而反映具有不同背景的个体对于一个主题的感知。