BriefGPT.xyz
Ask
alpha
关键词
expectation-maximization approach
搜索结果 - 2
ACL
多方对话应答生成的 EM 预训练
此篇论文提出了一种基于 EM(期望最大化)算法的方法,用于优化多方对话应答生成模型,解决多方对话数据中缺乏标注指定对话对象的标签的问题。
PDF
a year ago
ICML
安全强化学习的约束变分策略优化
该研究通过引入新的期望最大化方法,并从概率推理的角度解决问题,将安全增强学习问题分解为凸优化和监督学习两个阶段,实现了更稳定和更高效的学习表现,并在连续机器人任务的广泛实验中取得了显著的约束满足性能和样本效率提升。
PDF
2 years ago
Prev
Next