Feb, 2024

反馈链:缓解响应一致性的影响

TL;DRAI 模型如 ChatGPT 存在可靠性和一致性问题,本文通过引入 Chain-of-Feedback 触发模型偏离实际答案,提出一种新的提示方法 Recursive Chain of Feedback (R-CoF),以修正模型最初错误的推理。