BriefGPT.xyz
大模型
Ask
alpha
关键词
pseudo-training data
搜索结果 - 4
跨语言结构提取的上下文标签投影
通过使用 CLAP 方法,首先将文本翻译成目标语言,并使用翻译后的文本作为上下文对标签进行语境翻译,从而提高了翻译标签的准确性。在事件论证提取等结构提取任务上,CLAP 相较于其他方法在中文和阿拉伯语 ACE05 数据集上提高了 2-2.5
→
PDF
10 months ago
EMNLP
粗到细:基于粗糙标注数据的细粒度文本分类
该研究提出了一种基于粗到细粒度的分类,使用标签表面名称和预训练的生成式语言模型,生成虚假数据训练分类器并用于模型优化,实验证明在两个真实数据集上比零 - shot 分类改进了性能。
PDF
3 years ago
ACL
利用检索句子生成模板的方式提高无监督问答
我们提出了一种无监督训练 QA 模型的方法,该方法使用生成的伪数据训练,为 QA 训练生成问题,通过对相关检索到的句子应用简单模板,而非原始上下文句子来实现,从而使模型能够学习更复杂的上下文问题关系。 使用这些数据训练 QA 模型可在 S
→
PDF
4 years ago
AAAI
利用单语数据进行神经机器翻译模型的联合训练
本文提出了一种新方法,通过联合 EM 优化方法融合源语言和目标语言的神经机器翻译模型,以更好地利用单语数据来提高翻译质量,实验结果表明,相对于使用单语数据训练的强基线系统,该方法可以同时提高源到目标和目标到源模型的翻译质量。
PDF
6 years ago
Prev
Next