target model | BriefGPT - AI 论文速递

关键词target model

搜索结果 - 6

投机式流处理：高速 LLM 推理无需辅助模型
Speculative Streaming 是一种单一模型的推测解码方法，通过将起草融入目标模型，将微调目标从下一个标记预测改为未来 n-gram 预测的目标，以在总结、结构查询和语义表示等多个任务中提高 1.8-3.1 倍的解码速度，而不
PDF5 months ago
ICLR大型语言模型的知识融合
通过知识融合的方法，将预先训练的大型语言模型相互结合，以提升目标模型的性能表现，实现在推理、常识与代码生成等多种能力上的改进。
PDF6 months ago
AC-Norm: 通过仿射协作归一化实现的医学图像分析有效调整
通过 Affine Collaborative Normalization（AC-Norm）方法，本研究对医疗应用中有限注释数据的性能进行优化，在多个任务中改进目标模型的性能并提高模型迁移能力。
PDFa year ago
基于词重要性熵的对抗文本检测
本文研究针对自然语言处理（NLP）模型的对抗攻击算法，发现攻击算法主要破坏文本中的单词重要性分布，基于此提出一种新的防御框架 TextDefense，利用目标模型的能力来检测对抗样本，不需要先验知识，并发现影响 TextDefense 性能
PDFa year ago
领域迁移中的调整知识可视化
本文介绍了一种新的无监督域适应方法，通过图像翻译表达源模型与目标模型之间的知识差异，使用该方法为目标模型生成源风格的图像，实现进一步调整目标模型，从而避免了访问源数据的需要。
PDF3 years ago
ICML一个形式化的框架来表征可解释性程序
我们提供了一个新颖的解释概念，其定义与目标模型有关，通过将其与准确性和鲁棒性等实际因素相联系，可以比较可解释程序的优劣，描绘了当前许多最先进的可解释方法的适用性。
PDF7 years ago