pseudo-training data | BriefGPT

关键词pseudo-training data

搜索结果 - 4

跨语言结构提取的上下文标签投影
通过使用 CLAP 方法，首先将文本翻译成目标语言，并使用翻译后的文本作为上下文对标签进行语境翻译，从而提高了翻译标签的准确性。在事件论证提取等结构提取任务上，CLAP 相较于其他方法在中文和阿拉伯语 ACE05 数据集上提高了 2-2.5
PDF10 months ago
EMNLP粗到细：基于粗糙标注数据的细粒度文本分类
该研究提出了一种基于粗到细粒度的分类，使用标签表面名称和预训练的生成式语言模型，生成虚假数据训练分类器并用于模型优化，实验证明在两个真实数据集上比零 - shot 分类改进了性能。
PDF3 years ago
ACL利用检索句子生成模板的方式提高无监督问答
我们提出了一种无监督训练 QA 模型的方法，该方法使用生成的伪数据训练，为 QA 训练生成问题，通过对相关检索到的句子应用简单模板，而非原始上下文句子来实现，从而使模型能够学习更复杂的上下文问题关系。使用这些数据训练 QA 模型可在 S
PDF4 years ago
AAAI利用单语数据进行神经机器翻译模型的联合训练
本文提出了一种新方法，通过联合 EM 优化方法融合源语言和目标语言的神经机器翻译模型，以更好地利用单语数据来提高翻译质量，实验结果表明，相对于使用单语数据训练的强基线系统，该方法可以同时提高源到目标和目标到源模型的翻译质量。
PDF6 years ago