May, 2024
元反省:利用过去反思学习语言代理的指令
METAREFLECTION: Learning Instructions for Language Agents using Past Reflections
Priyanshu Gupta, Shashank Kirtania, Ananya Singha, Sumit Gulwani, Arjun Radhakrishna...
TL;DR利用自我反思的模型生成语言反馈,METAREFLECTION 技术能够学习特定领域的通用提示指令并提高大型语言模型的效率。在基础设施即代码漏洞检测和问答方面,METAREFLECTION 相对于 GPT-4 表现出 16.82%(IAC)、31.33%(COT)和 15.42%(REACT)的显著改进。