BriefGPT.xyz
大模型
Ask
alpha
关键词
code-switched text
搜索结果 - 5
EMNLP
混合语文本数据的渐进情感分析
本研究提出了一种基于多语言变形器语言模型的框架,将区分资源丰富和资源贫乏语言作为参考来逐步从资源丰富语言的样本到资源贫乏语言的样本进行训练,来解决多语言情感分析中的跨语言学习问题。实验证明,该框架能有效帮助资源贫乏语言的样本训练。
PDF
2 years ago
ACL
从机器翻译到代码转换:生成高质量的混合语言文本
本文研究如何用神经机器翻译模型生成印地语 - 英语混合语种句子。通过预训练和使用合成数据来提高模型性能,生成的文本可用于数据增强,提高了语言模型任务和自然语言推理任务的性能,人工评估和客观指标的结果展现出了接近或优于印地语为母语的人群工作者
→
PDF
3 years ago
MM
端到端的混合语言模型用于自动语音识别
本文利用深度双向语言模型如 BERT 和其他机器翻译模型提出了一种提取单语文本的方法,以及探索从 ASR 模型中提取混合文本的不同方法,并通过比较混杂度和其他不同指标(如 WER)的结果与标准的双语文本输出来说明模型的稳健性。
PDF
4 years ago
EMNLP
使用双重 RNN 和相同源预训练的代码交换语言模型
该研究通过两种技术改善了代码混合文本的语言模型,提出了一个创新的循环神经网络单元和通过生成模型合成文本进行预训练的方法,实验结果显示,在汉英任务中我们的方法显著降低了困惑度。
PDF
6 years ago
双语模型用于混合语言语音识别
本文提出了一种针对双语混杂文本的语言模型的新方法,即双语言模型,该方法使用单一语言模型的结构来改进标准的双语言模型,并将两个互补的单一语言模型结合在一起,以概率切换模型进行切换。我们使用一种会话式汉英语音语料库评估了该方法的有效性,并证明了
→
PDF
7 years ago
Prev
Next