BriefGPT.xyz
大模型
Ask
alpha
关键词
model editing techniques
搜索结果 - 5
编辑批次大小越大越好吗?--- 基于 Llama-3 的模型编辑的经验研究
本研究重点针对最新的大型语言模型 Llama-3 进行了定向模型编辑分析。我们探讨了针对精确层次干预设计的流行模型编辑技术 ——ROME、MEMIT 和 EMMET 的有效性。通过对三种不同策略(顺序编辑、批次编辑和顺序 - 批次编辑)的
→
PDF
2 months ago
模型编辑的长篇评估
模型编辑评估中长文本生成的有效性及影响的新型评估方法(LEME)揭示了模型编辑方法的新维度,其中一些方法在有限范围内具有良好的一致性,但更容易出现事实偏移问题。
PDF
5 months ago
ACL
多语言语言模型中的跨语言编辑
在多语言的大型语言模型中,已有的模型编辑技术在跨语言的模型编辑范式下存在一定的性能限制,尤其是当涉及到不同语言脚本家族的语言时,需要进一步研究和发展跨语言模型编辑技术以应对这些挑战。
PDF
5 months ago
MPN: 利用多语言修补神经元进行跨语言模型编辑
提出了一种简单而有效的方法,使用多语言修补神经元来存储跨语言知识,以提升现有方法的跨语言编辑能力,并在两个数据集上进行实验证明其在跨语言编辑任务中表现出了提高的性能。
PDF
6 months ago
ACL
大型语言模型编辑错误检测:一个改进的细节基准
该研究扩展了现有的 CounterFact 基准来包含动态因素,并通过基于 KL 散度的度量衡量特异性,发现了模型编辑技术可能导致的大规模不良副作用,表明需要改进的特异性基准来识别和预防不良副作用。
PDF
a year ago
Prev
Next