BriefGPT.xyz
大模型
Ask
alpha
关键词
synthetic training samples
搜索结果 - 2
非流利的合成目标语言数据提高神经机器翻译
从有限的平行语料中生成合成训练样本,即非流利目标端句子能够在多语种机器翻译框架中有效地提高翻译性能,并且这种方法对原始训练语料的规模不敏感,从而使系统更鲁棒、产生更少的幻觉。
PDF
5 months ago
ACL
利用极其嘈杂的众包标注鉴别中文意见表达
本研究探讨了如何使用极其嘈杂的众包注释构建一个低成本的数据集,并通过注释器适配器模型和相关混合策略,提高了众包建模的准确性,结果表明众包在观点表达识别方面有很高的应用前景。
PDF
2 years ago
Prev
Next