BriefGPT.xyz
Ask
alpha
关键词
sequential model editing
搜索结果 - 3
语音识别模型的终身训练的连续编辑
通过提出一种名为连续模型编辑的新方法,本研究解决了自动语音识别系统中的领域迁移问题,并实验证明相对于基准微调和其他深度学习算法,该方法在减少词错误率和提高识别效率方面取得了显著的优势。
PDF
11 days ago
ACL
DAFNet:大语言模型中序贴模型编辑的动态辅助融合
大型语言模型中的模型编辑任务,设计了动态辅助融合网络(DAFNet)以提升语义交互,并使用新构建的数据集 DAFSet 进行连续编辑,实验证明 DAFNet 在单轮和连续编辑任务中显著优于其他方法。
PDF
a month ago
ICLR
Transformer-Patcher: 一错必补的神经元
本研究提出一种被称为 Transformer-Patcher 的神经网络模型,能够通过简单地添加和训练最后一层前馈网络中的少量神经元,连续纠正长序列中的错误,达到了顺序模型编辑(SME)的最优表现,解决了工业环境中部署的模型如何快速准确地修
→
PDF
a year ago
Prev
Next