BriefGPT.xyz
Ask
alpha
关键词
alignment technique
搜索结果 - 3
在 LLM 中,上下文学习是否足够用于指令遵循?
通过对长文本 LLMs 进行多个 in-context 学习示例的贪婪选择,我们改进了 ICL 与 URIAL 的对齐效果,但仍未消除与指令微调之间的差距,进一步的削减研究揭示了 ICL 在指令调整的环境中的特殊性,从而推进了对 ICL 作
→
PDF
a month ago
PERL: 从人类反馈学习的参数高效强化学习
使用参数高效的强化学习(PERL)方法,研究了从人类反馈中进行增强学习的方法,该方法能够降低计算复杂度并提高模型的性能,为大型语言模型的对齐技术提供了可能性。
PDF
4 months ago
MM
小型蜂窝网络中无线回传和接入的毫米波波束成形技术
本研究提出了一种利用室外毫米波通信实现基站间回程网络和单个基站内移动接入的方案,同时,这篇论文通过研究大型阵列的波束成形来克服毫米波传输中的室外障碍,并提出了一种高效的波束对准技术来适应柱式摇晃和其他环境影响。
PDF
11 years ago
Prev
Next