Apr, 2024

NegotiationToM: 一种用于测试机器思考他人心态的谈判基准

TL;DR使用 NegotiationToM 基准测试表明,尽管使用了思维链式方法(CoT method),目前最先进的大型语言模型在人类情况下的表现明显较差。