Apr, 2024

从用户编辑中学习潜在偏好,使 LLM 代理人保持一致

TL;DR基于用户编辑的互动学习语言代理,通过历史编辑数据推断用户的潜在偏好,定义推动未来回复生成的提示策略,实现代理和用户偏好的对齐,减少用户编辑成本和提高性能。