EMNLPOct, 2022

龙与地下城:人工智能对话挑战

TL;DR本篇论文将 Dungeons and Dragons 视为一个对话系统的挑战问题,通过创建一个包含近 900 场游戏的游戏数据集以及使用大型语言模型生成对话来测试模型的性能,并通过人工评估和自动评估来判断其质量。