Jul, 2023

信用分配:发展类人智能代理人的挑战和机遇

TL;DR本研究使用基于经验决策的认知模型 IBLT 来测试不同的信用分配机制,并发现决策复杂性会影响人类表现,而不影响模型的表现。机器学习方法如 TD 方法和 Q 学习方法在人类能力匹配方面表现不佳,但在最终能够超越人类。IBL 模型在信用分配方面比其他模型表现更好,研究为未来 AI 系统的开发提供了洞察。