BriefGPT.xyz
Ask
alpha
关键词
target model
搜索结果 - 6
投机式流处理:高速 LLM 推理无需辅助模型
Speculative Streaming 是一种单一模型的推测解码方法,通过将起草融入目标模型,将微调目标从下一个标记预测改为未来 n-gram 预测的目标,以在总结、结构查询和语义表示等多个任务中提高 1.8-3.1 倍的解码速度,而不
→
PDF
5 months ago
ICLR
大型语言模型的知识融合
通过知识融合的方法,将预先训练的大型语言模型相互结合,以提升目标模型的性能表现,实现在推理、常识与代码生成等多种能力上的改进。
PDF
6 months ago
AC-Norm: 通过仿射协作归一化实现的医学图像分析有效调整
通过 Affine Collaborative Normalization(AC-Norm)方法,本研究对医疗应用中有限注释数据的性能进行优化,在多个任务中改进目标模型的性能并提高模型迁移能力。
PDF
a year ago
基于词重要性熵的对抗文本检测
本文研究针对自然语言处理(NLP)模型的对抗攻击算法,发现攻击算法主要破坏文本中的单词重要性分布,基于此提出一种新的防御框架 TextDefense,利用目标模型的能力来检测对抗样本,不需要先验知识,并发现影响 TextDefense 性能
→
PDF
a year ago
领域迁移中的调整知识可视化
本文介绍了一种新的无监督域适应方法,通过图像翻译表达源模型与目标模型之间的知识差异, 使用该方法为目标模型生成源风格的图像,实现进一步调整目标模型,从而避免了访问源数据的需要。
PDF
3 years ago
ICML
一个形式化的框架来表征可解释性程序
我们提供了一个新颖的解释概念,其定义与目标模型有关,通过将其与准确性和鲁棒性等实际因素相联系,可以比较可解释程序的优劣,描绘了当前许多最先进的可解释方法的适用性。
PDF
7 years ago
Prev
Next