May, 2025

人工智能代理的成功率是否存在半衰期?

TL;DR本研究针对特定的研究工程任务,填补了AI代理在长时间任务中表现的理解空白,提出了一种简单的数学模型,该模型表明成功率随任务长度呈指数下降。最重要的发现是,失败的潜在原因在于长任务涉及越来越多的子任务,任何一个子任务的失败都将导致整体任务失败。