Mar, 2024

LMStyle 基准测试:评估聊天机器人的文本风格转移

TL;DR本研究提出了 LMStyle Benchmark,这是一个适用于聊天风格文本风格转换的评估框架,可以自动化和可扩展地评估大型语言模型的风格转换质量,并引入了适应度等新颖的度量方法,从而更好地反映人类判断。