Feb, 2024

将保障放在自治之上:LLM 代理在科学中的风险

TL;DR通过全面考察科学领域的基于大语言模型的智能 Agent 的漏洞,找出潜在的风险、强调对安全措施的需求,以及提出人工监管、Agent 对齐、环境反馈三元框架来缓解风险,还强调了目前保护科学 Agent 的限制和挑战,并呼吁针对这些问题制定改进模型、鲁棒基准和全面规定。