May, 2024

AI 科学家的 “图灵测试

TL;DR通过提出一个 “AI 科学家的图灵测试” 来评估 AI 代理能否独立地进行科学研究,这篇论文在提供特定问题的交互式库或数据集的前提下,提出了七个评估 AI 代理在各个科学领域中进行突破性发现能力的基准测试。这些基准测试旨在建立 AI 在科学研究中的能力标准,并激发对这个激动人心领域的进一步研究。