BriefGPT.xyz
大模型
Ask
alpha
关键词
alignment information
搜索结果 - 5
鲁棒即插即用适应性的解耦对齐
我们介绍了一种低资源安全增强方法,用于对齐大型语言模型(LLMs),无需受过监督的精调或来自人类反馈的强化学习。我们的主要思想是利用知识蒸馏从现有的良好对齐的 LLMs 中提取对齐信息,并以即插即用的方式整合到未对齐的 LLMs 中。通过使
→
PDF
a month ago
重新考虑神经语音识别中的熵半环
在流媒体环境中,语音识别模型需要在完整音频流可用之前将语音的子序列映射为文本,但由于训练过程中很少有语音和文本之间的对齐信息可用,模型需要以完全自我监督的方式进行学习。本文通过熵半环重新考虑了神经语音识别模型,展示了如何通过对齐熵来通过正则
→
PDF
7 months ago
ECCV
CoMER: 基于 Transformer 的手写数学表达式识别覆盖建模
本文提出了使用注意力精细模块的覆盖信息 Transformer 模型(CoMER),用于识别手写数学表达式,实验显示 CoMER 相对于当前最先进的模型提高了 0.61%/2.09%/1.59% 的表达式识别率,并在 CROHME2014/
→
PDF
2 years ago
街景到空中景象图像地理定位和方向估计的再探讨
本文研究了将查询街景图像与参考集中带有 GPS 标记的航空图像进行匹配的问题,并指出了图像对齐信息的被忽视问题,研究表明,基于度量学习技术的改进可以显著提高性能而无需利用对齐信息,同时使用 Grad-CAM 进行可视化来理解模型以及对齐信息
→
PDF
4 years ago
ACL
神经机器翻译的覆盖率建模
本文提出基于 coverage 的 NMT 模型通过维护一个 coverage 向量来跟踪 Attention 历史信息,帮助调整未来 Attention,从而显著提高了传统 attention-based NMT 的翻译和对齐质量。
PDF
8 years ago
Prev
Next