BriefGPT.xyz
Ask
alpha
关键词
alignment process
搜索结果 - 4
从分布到 Overton 多元主义:研究大型语言模型的对齐问题
对语言模型执行对齐过程会改变其输出分布的多个属性。研究分析了语言模型响应的对齐后分布漂移的两个方面,发现对齐过程抑制了无关和无用的内容,将输出分布转向覆盖基础语言模型中多个响应的信息,从而在单个响应中提供多样化的信息。此外,研究还表明基础模
→
PDF
11 days ago
Proxy-RLHF: 大规模语言模型中分离生成与对齐的代理模型
我们介绍了一种代理强化学习方法(Proxy-RLHF),该方法解耦了生成和对齐大型语言模型的过程,以较低的计算成本实现与人类价值观的对齐。
PDF
4 months ago
与 LLM 对齐:一种用于编码视觉皮层 fMRI 活动的新型多模态训练范式
提出了一种新的多模态训练范式,用于编码视觉皮层中的 fMRI 活动。使用预训练的 LLM 和对比损失函数完成图像和文本信息的对齐,提高了视觉编码模型的性能。
PDF
6 months ago
使用梵文遗产工具验证和规范化 DCS 语料库,以构建已标记的黄金语料库
本研究描述了修正后的对齐过程,并记录了额外的语言差异,以标准化数字梵语语料库,并为其提供完整的形态和词汇信息以及分段词。
PDF
4 years ago
Prev
Next