May, 2024
基于 LLM 的习得函数的贝叶斯优化在自然语言偏好了解中的应用
Bayesian Optimization with LLM-Based Acquisition Functions for Natural Language Preference Elicitation
David Eric Austin, Anton Korikov, Armin Toroghi, Scott Sanner
TL;DR设计一个基于贝叶斯优化框架的自然语言查询方法,通过与用户进行对话来主动获取自然语言反馈,以减少对项目效用的不确定性,从而识别出最佳推荐。