BriefGPT.xyz
大模型
Ask
alpha
关键词
language perplexity
搜索结果 - 3
重新思考大型语言模型剪枝:重构误差最小化的好处和陷阱
通过分割模型、顺序修剪、重构稠密对应模型的预测,及时合并稀疏子模型,本文首次提出了一系列重建技术,可以显著降低高复原误差,并发现最小化复原误差并非总是理想的,引入自动生成校准数据的策略以平衡复原和泛化之间的权衡,为剪枝大型语言模型的新方向提
→
PDF
11 days ago
低资源情境下,LLM 在关系抽取中的表现如何?综合评估
该研究构建了十个低资源语言的关系抽取数据集,并利用语言困惑度对翻译数据进行过滤,最后在这些数据集上评估了开源大型语言模型的性能。
PDF
15 days ago
ACL
UniTRec: 一个文本到文本统一变换器和联合对比学习框架,用于基于文本的推荐
本文提出了一种名为 UniTRec 的框架,它使用预训练语言模型来增强基于文本的推荐系统,其中该框架使用 Transformer 编码器和解码器来处理用户历史和候选文本,利用语言困惑度作为对比信号进行匹配,展现了 SOTA 的表现。
PDF
a year ago
Prev
Next