关键词teacher model
搜索结果 - 37
  • ReffAKD: 资源高效的基于自编码器的知识蒸馏
    PDF3 months ago
  • 通过标签修订和数据选择改进知识蒸馏
    PDF3 months ago
  • 基于监督引导的零样本学习:一种无实际数据曝露的协同范式
    PDF4 months ago
  • 对抗稀疏教师:利用对抗样本防御基于蒸馏的模型窃取攻击
    PDF4 months ago
  • ACL迈向交叉标记器蒸馏:面向语言模型的通用逻辑蒸馏损失
    PDF4 months ago
  • 对大型语言模型对齐的 AI 反馈的关键评估
    PDF4 months ago
  • AAAI宽容专家的教师:与教师无关的无数据知识蒸馏
    PDF4 months ago
  • AAAI合作式知识蒸馏:一种学生无关的方法
    PDF5 months ago
  • 黑暗面的知识:基于熵重新加权的知识蒸馏,以实现平衡的知识传递
    PDF7 months ago
  • L2T-DLN:学习使用动态损失网络进行教学
    PDF8 months ago
  • 基于标记级关系图的知识蒸馏
    PDFa year ago
  • MERT:音乐声学理解模型及大规模自监督训练
    PDFa year ago
  • 短至长期轨迹预测知识蒸馏
    PDFa year ago
  • 不要盲目模仿老师:使用扰动损失进行知识蒸馏
    PDFa year ago
  • EMNLP通过知识选择改进预训练语言模型的知识蒸馏
    PDFa year ago
  • 知识蒸馏的多码本向量量化索引预测
    PDF2 years ago
  • EMNLP硬门知识蒸馏 —— 利用校准实现强韧可靠的语言模型
    PDF2 years ago
  • WWWPROD: 稠密检索的渐进式蒸馏
    PDF2 years ago
  • DiMS: 迭代非自回归变换器的多步精简
    PDF2 years ago
  • ACL针对段落检索的群体相关性标注
    PDF2 years ago
Prev