BriefGPT.xyz
Ask
alpha
关键词
feedback rules
搜索结果 - 2
多步任务中的智能提问优化:融合人类反馈和偏好对齐
通过结合人类设计的反馈规则,采用基于遗传算法的大语言模型驱动的离散提示优化框架,实现了对多步任务中自动提示的改进,相比现有的方法,平均有 27.7% 和 28.2% 的改善效果。
PDF
5 months ago
FROTE: 基于反馈规则的过采样编辑模型
本研究提出了一种基于反馈规则的过采样技术来处理机器学习模型的更新问题,能够在不断更新的规则下,更快速地重新训练模型,实现决策边界的快速调整和更新。
PDF
3 years ago
Prev
Next