BriefGPT.xyz
Ask
alpha
关键词
behavior alignment
搜索结果 - 3
SIGIR
行为对齐:评估基于 LLM 的对话推荐系统的新视角
基于大型语言模型的对话式推荐系统在行为一致性方面存在差异,本研究提出了行为一致性评估指标 Behavior Alignment,该指标通过与人类推荐者进行对比能够更好地衡量系统性能,并且提出了一种基于分类的隐式测量方法来评估该指标的鲁棒性。
PDF
3 months ago
通过奖励函数优化进行行为对齐
通过使用双层目标的新框架,将辅助奖励与环境的主要奖励相结合,我们提供了一种集成设计者指定的启发式方法的鲁棒且有原则的方式,以解决现有方法的主要缺点,即使给出不对齐或指定不良的辅助奖励函数,也能始终导致高性能解决方案。
PDF
8 months ago
BLSP:基于继续写作行为对齐的语音 - 文本预训练引导
通过行为对齐的方式,我们提出了一种轻量级的语言 - 语音预训练方法,将大型语言模型(LLMs)的能力扩展到语音识别、语音翻译、口语理解和对话等领域,实现了语音和文本之间的模态对齐。
PDF
10 months ago
Prev
Next