BriefGPT.xyz
大模型
Ask
alpha
关键词
feedback learning
搜索结果 - 4
UniFL:通过统一反馈学习改善稳定扩散
UniFL 是一个统一框架,利用反馈学习全面增强扩散模型,在提升生成模型质量和加速推理方面表现出优越性能。
PDF
3 months ago
EMNLP
大型语言模型中主观人类偏好和价值的反馈学习的过去、现状和更好未来
人类反馈在大型语言模型中被广泛应用,本研究回顾了现有的人类反馈学习方法,并提出了未解决的五个概念和实践上的挑战。
PDF
9 months ago
ICML
神经网络鲁棒性的反馈学习
通过分析决策空间中的模型鲁棒性,提出一种反馈学习方法,以了解模型的学习情况,促进纠正缺陷的重新训练过程。根据一组基于距离的准则进行的评估表明,我们的方法可以显著提高模型的准确性和对各种逃逸攻击的鲁棒性,同时观察到跨类不平等的存在,并提出通过
→
PDF
5 years ago
ACL
通过属性分解从知识库中发现事实
提出了一种新的知识库任务,即从头实体中发现相关事实的问题,并提出了一个新的框架来解决该问题,其中使用自编码器组件和反馈学习组件来实现。实验结果表明,该框架取得了有希望的结果。
PDF
5 years ago
Prev
Next