提出了一种新的领域嵌入学习方法,通过元学习将过去领域的语料库利用起来来扩充当前领域的语料库,从而生成高质量的领域嵌入,从而提高下游 NLP 任务的性能。
May, 2018
该文介绍了一种新的方法,通过同时捕获情感语义和单词的域敏感性的信息来学习领域敏感且情感感知的词嵌入向量。实验结果表明,该模型在句子和词库级别上都提供了学习领域敏感和情感感知词嵌入向量的有效方法。
本文提出了一种从稀疏文本中训练领域特定词向量的新方法,它不仅利用领域文本,而且还利用领域词汇和语义关系。作者将不同类型的领域知识编码为文本注释,并开发了一种新的词注释嵌入算法,将这些文本注释与词嵌入相结合。作者已在两个网络安全文本语料库上对其方法进行了评估,并证明了它在学习领域特定词嵌入方面的有效性。
Sep, 2017
提出一种通过使用语言建模来学习领域感知特征嵌入,在多个实验中提高神经机器翻译性能的方法,该方法允许使用者指定特定领域的文本表示。
Aug, 2019
该论文探讨了一种无监督的方法,用于推导出一种通用的,跨语言的词嵌入空间,其中不同语言中具有类似语义的单词彼此接近。通过使用线性插值的一系列中间空间,该方法模拟了计算机视觉中的域流方法,以提高跨语言自然语言推理的性能。
Oct, 2022
本研究提出了一种无监督方法,学习特定领域的单词表示,以准确捕捉单词语义的领域特定方面,并使用所学习的单词表示进行域适应性处理,以在对多个不同领域对情感分类任务中获得最佳准确性,并显着优于现有基准。
May, 2015
该论文提出了一种将通用词嵌入的广度与领域特定词嵌入的特異性相结合的方法,通过使用规范相关分析 (CCA) 或相关的非线性内核 CCA 对应的单词向量进行对齐来形成称为领域自适应 (DA) 词嵌入,其评估结果表明,在用于标准或最先进的分类算法的输入特征时,DA 嵌入在情绪分类任务中显着优于通用和 DS 嵌入。
该研究提出一种基于批标准化和集成模型的域泛化方法,以在不同和未知的领域中提高机器学习模型的鲁棒性和分类准确性。
Nov, 2020
研究在数据量少的情况下,如何利用数据增强方法,将大规模预训练语料库中的词向量嵌入模型与特定领域语料库中的词向量嵌入模型相结合,以提高在抑郁语言检测任务中的表现,结果显示该数据增强方法可以显著提高模型性能。
Jun, 2021
本文提出了一种基于半监督学习的词嵌入方法,用于提高跨领域中文分词的性能,实验证明该方法在小样本领域中表现良好,可以优化分词结果,尤其是在分割具有特定领域名词实体的数据集时较为有效。
Mar, 2019