BriefGPT.xyz
Ask
alpha
关键词
latent preference
搜索结果 - 1
从用户编辑中学习潜在偏好,使 LLM 代理人保持一致
基于用户编辑的互动学习语言代理,通过历史编辑数据推断用户的潜在偏好,定义推动未来回复生成的提示策略,实现代理和用户偏好的对齐,减少用户编辑成本和提高性能。
PDF
3 months ago
Prev
Next