Nov, 2023

ChessVision -- 逻辑连贯多标签分类的数据集

TL;DR我们介绍了一个数据集,命名为 ChessVision 数据集,其中包含 200,000 + 张带有注释的象棋游戏进行中的图像,需要从图像中重新创建游戏状态,并附带一套约束以确保产生 “合理” 的游戏状态,同时还提出了用于衡量逻辑一致性的附加指标。通过对该任务进行分析,我们发现现有的视觉模型在标准指标上表现可观,但产生了大量不连贯的结果,这表明此数据集对未来研究提出了重大挑战。