BriefGPT.xyz
Ask
alpha
关键词
web-crawled data
搜索结果 - 2
CVPR
MoDE: 通过聚类实现 CLIP 数据专家
使用混合数据专家(MoDE)方法提高神经网络 CLIP 在零样本图像分类任务上的性能,通过聚类学习多个数据专家,使用元数据与聚类条件的相关性确定权重进行模型集成。
PDF
2 months ago
ACL
通过预训练语言模型进行平行语料库过滤
本文提出了一种利用预训练语言模型过滤爬取数据中的噪声句对的方法,并利用 BERT 的多语言能力度量语句的平行性,使用生成预训练(GPT)语言模型作为领域过滤器来平衡数据领域,通过在 WMT 2018 平行语料库过滤共享任务上的实验以及本文所
→
PDF
4 years ago
Prev
Next