BriefGPT.xyz
大模型
Ask
alpha
关键词
conditional training
搜索结果 - 3
一种用于条件扩散建模的框架及其在蛋白设计中的应用
通过统一条件训练和条件采样程序,本文基于数学上理解的 Doob 的 h 转换方法提出了一个新的视角,揭示了现有方法之间的联系,并提出了一种新的改进方法,通过在图像外延和结构基元搭建方面的实验证明了其有效性。
PDF
7 months ago
使用人类偏好进行语言模型预训练
通过在预训练中引入人类的反馈,实现对于语言模型的生成文本的可控和可导向性,减少哪些偏离人类喜好的内容的生成,并且在标准的预训练和任务特定的微调中保持下游任务表现。推荐在训练开始时,就结合人类反馈,不再使用模仿学习的方式预训练语言模型。
PDF
a year ago
无向模型的分段训练
本文介绍了一种基于单个团集合的独立训练方法,以在训练大规模无向图模型时提高准确性,并通过对三个自然语言数据集的实验,证明了其比伪似然更准确,并且通常与使用信念传播的全局训练相当。
PDF
12 years ago
Prev
Next