BriefGPT.xyz
Ask
alpha
关键词
instruction tuning corpus
搜索结果 - 1
从挫折中获益:通过错误分析对齐大型语言模型
通过暴露大型语言模型存在的缺陷输出并进行彻底评估,该研究提出了一种根据错误分析的新型对齐策略,以完全理解其内部原因,并将有害回应转化为模型对齐的指令调整语料库,从而不仅使 LLMs 不再产生有缺陷的回应,还可训练其自我批评,并利用其判别有毒
→
PDF
9 months ago
Prev
Next