BriefGPT.xyz
Ask
alpha
关键词
pfm
搜索结果 - 2
偏好匹配与流匹配
Preference Flow Matching (PFM) 是一种新的偏好强化学习(PbRL)框架,通过利用流匹配技术直接从偏好数据中学习,从而减少对预训练模型的大量微调的依赖,有效地将模型输出与人类偏好对齐,避免了奖励模型过拟合等常见问
→
PDF
a month ago
预训练基础模型综述:从 BERT 到 ChatGPT 的历史
本研究综述了最近的预训练基础模型技术的研究进展,重点探讨了这些技术在文本、图像、图形以及其他数据模态中的应用前景、挑战和机遇,同时也讨论了这些技术的基本组成、现有预训练方法和未来趋势。
PDF
a year ago
Prev
Next