Dec, 2023

诚信为上策:定义与缓解 AI 欺诈

TL;DRAI 系统中存在欺骗性代理对安全性、可信度和合作性构成挑战。本文针对代理为达到目标而进行欺骗的问题展开研究,引入了基于哲学文献的结构因果游戏中欺骗的形式定义,并且给出了用于减缓欺骗的图形标准。