BriefGPT.xyz
大模型
Ask
alpha
关键词
self-generated responses
搜索结果 - 1
自我对弈微调将弱语言模型转化为强语言模型
通过自我对弈优化学习,无需专家对手,实现在大型语言模型中无需人工标注数据即可达到人类水平性能的研究
PDF
6 months ago
Prev
Next