BriefGPT.xyz
Ask
alpha
关键词
filtering technique
搜索结果 - 2
关于端到端语音翻译过滤的案例研究
通过使用最简单的筛选技术可以从大量的嘈杂数据集中减少数据量,得到一组更易管理和干净的数据集,并且在多语言到英语语音翻译模型中使用这样的清洁数据集可以显著提高模型性能,平均提升 4.65 个 BLEU 得分。
PDF
5 months ago
SIGIR
基于 Web 锚点的无监督密集检索训练
本文研究了一种基于对比学习的无监督检索方法,应用于网络锚点文本,提出了一种去除非信息锚点的筛选技术,并展示了该方法的性能优于目前的先进方法,特别适用于搜索和问答任务。
PDF
a year ago
Prev
Next