BriefGPT.xyz
Ask
alpha
关键词
labelled training data
搜索结果 - 2
EMNLP
噪声自训练与合成查询的密集检索
使用新颖的带有合成查询的嘈杂自我训练框架,证明了神经检索器可以在没有依赖任何外部模型的情况下以自我进化的方式得到改进,实验证明我们的方法在常见领域(如 MS-MARCO)和领域外(即 BEIR)的检索基准上持续改进。进一步扩展该框架来进行
→
PDF
7 months ago
半监督序列自编码器语义解析
我们提出了一种新颖的半监督方法,应用于序列转换和语义分析。该方法包含基于生成模型的无监督成分,在该模型中,潜在的句子生成不成对的逻辑形式,我们将此方法应用于许多语义解析任务,重点关注训练数据标记不足的领域,并使用合成逻辑形式扩充这些数据集。
PDF
8 years ago
Prev
Next