BriefGPT.xyz
Ask
alpha
关键词
polyphone disambiguation
搜索结果 - 5
外部知识增强的多音字消歧方法利用大规模语言模型
提出一种解决汉语多音字消歧问题的新方法,该方法基于大型语言模型和提示学习,包括三个模块:检索模块、生成模块和后处理模块。实验结果表明该方法在公共数据集 CPP 上优于现有方法,并对提示模板、训练数据规模和是否引入外部知识进行了实证研究。
PDF
7 months ago
汉语多音字消歧的回译式数据增强
本文提出了一种基于回译的数据增强方法,采用大量未标注的文本数据来解决中文多音字消歧问题,并设计了一种数据平衡策略来提高训练集中某些典型的多音字字符的识别准确性。
PDF
2 years ago
汉语多音字消歧的多音字 BERT
本文提出一种中文多音字 BERT 模型,通过从 354 个原中文多音字生成 741 个新的中文单音字,再将其添加到预训练的中文 BERT 中,使得多音字消岐任务能够转化为中文多音字 BERT 语言模型的预训练任务。实验结果验证了该模型的有效
→
PDF
2 years ago
Dict-TTS: 带有先验字典知识的学习发音文本转语音
本文提出了一种基于语义感知的生成文本到语音模型 Dict-TTS,该模型结合在线网站词典通过 S2PA 处理 module,实现了对多音字消除(polyphone disambiguation)的有效解决,同时提高了 TTS 系统的发音准确
→
PDF
2 years ago
g2pW:一种有条件的加权 Softmax BERT,用于汉语多音字消歧
提出了一种新的 g2pW 方法,使用可学习的 softmax 权重将 BERT 的输出与所需的多音字字符及其 POS 标记进行条件转化,无需使用额外的 POS 标记预训练模型。该方法在公共 CPP 数据集上的表现优于现有方法。
PDF
2 years ago
Prev
Next