BriefGPT.xyz
Ask
alpha
关键词
chinese plms
搜索结果 - 3
ACL
说文解字:重新思考中文语言预训练的词典和字形
CDBERT 是一种改进了语义理解的学习范例,它结合了语汇知识和汉字结构。该方法使用 Shuowen 和 Jiezi 两个核心模块,前者用于从汉字字典中获取最合适的意义,后者用于通过结构理解增强汉字的字形表示。通过在现代汉语理解基准 CLU
→
PDF
a year ago
汉语预训练语言模型中的分词粒度:字符、词语还是两者兼备?
本文提出了一种混合粒度的中文 BERT 模型(MigBERT),通过同时考虑字符和词来学习其特征表示,并在各种中文 NLP 任务上进行了广泛的实验以评估现有的 PLMs 以及所提出的 MigBERT,实验结果表明,MigBERT 在所有这些
→
PDF
a year ago
COLING
CLOWER:基于词和字符表示的对比学习的预训练语言模型
本文提出一种名为 CLOWER 的基于对比学习的 pre-trained Language Model,能有效地融合中文词汇的语义信息,提高下游自然语言理解任务的性能。
PDF
2 years ago
Prev
Next