Apr, 2024
LLM-Personalize: 通过强化自我训练使 LLM 规划器与人类偏好保持一致的家务机器人
LLM-Personalize: Aligning LLM Planners with Human Preferences via Reinforced Self-Training for Housekeeping Robots
Dongge Han, Trevor McInroe, Adam Jelley, Stefano V. Albrecht, Peter Bell...
TL;DR通过优化流程,个性化 LLM 规划器以适应个体用户偏好,大幅提高与人类偏好的一致性。