generative adversarial feedback | BriefGPT

关键词generative adversarial feedback

搜索结果 - 1

使用生成对抗反馈来微调语言模型
研究探讨了使用生成对抗反馈的强化学习（RLGAF）方法，以弥补人类评估者的专业知识和生产力限制并帮助对齐大型语言模型（LLMs）的输出，从而为进一步实现 AI 对准提供了前景。
PDFa year ago