BriefGPT.xyz
Ask
alpha
关键词
parameter updating
搜索结果 - 5
关于奖励模型、参数更新和上下文提示的变换
我们展示了三种常用的适应工具的互换性,分别为参数更新、奖励建模和上下文提示,形成了一个三角形框架,建立了六个转换方向,每个转换方向都有助于实现各种应用。我们的工作为现有研究提供了一个整体观点,并提出了潜在的研究方向。我们希望我们的工作成为未
→
PDF
12 days ago
RanPAC:用于连续学习的随机投影和预训练模型
本文提出了一种简明有效的使用预训练模型进行 CL 的方法,它采用无需训练的随机投影仪和类原型累积技术,可避免遗忘问题,并且证明了与以前的方法相比,在不使用回访记忆的情况下,对于多个基准数据集,减少了最终错误率。
PDF
a year ago
我们是否可以通过上下文学习来编辑事实知识?
通过在不更新参数的情况下展示上下文,利用 in-context learning (editing) 的策略可以达到和梯度下降方法相当的 GPT 大型语言模型知识编辑效果。
PDF
a year ago
MM
使用二进制神经网络的通信高效联邦学习
该研究提出了一种使用二进制神经网络在联邦学习框架下进行训练的新方法,通过最大似然估计参数更新方案和理论推导,实现在无需聚合实值辅助参数的情况下,维持性能同时显著降低通信开销。
PDF
3 years ago
对话状态跟踪中联合优化状态操作预测和值生成
本文提出了一种基于 Transformer 的框架,将 BERT 作为编码器和解码器,通过共同优化操作预测目标和值生成目标来实现多领域对话状态跟踪,同时重复使用编码器的隐藏状态构建平面编码器 - 解码器架构来实现有效的参数更新,实验表明我们
→
PDF
4 years ago
Prev
Next