学习领域敏感和情感感知的词嵌入
该论文提出了一种将通用词嵌入的广度与领域特定词嵌入的特異性相结合的方法,通过使用规范相关分析 (CCA) 或相关的非线性内核 CCA 对应的单词向量进行对齐来形成称为领域自适应 (DA) 词嵌入,其评估结果表明,在用于标准或最先进的分类算法的输入特征时,DA 嵌入在情绪分类任务中显着优于通用和 DS 嵌入。
May, 2018
通过使用领域特定的词向量和标签传播框架,结合少量种子单词,创造与手动资源相媲美的精准的领域特定情感词典,用于量化情感在时间和社区之间的差异,并在此基础上,提出了历史情感词汇表和社区特定情感词汇表。
Jun, 2016
通过将领域适应问题视为嵌入投影任务,我们提出了一种新的方法,该模型可以将两个单域嵌入空间投影到一个双域空间,以预测情感分类,并在 20 个来源目标域对情感分类进行领域适应实验,并在高度背离的域中表现明显优于现有技术。
Jun, 2018
研究在数据量少的情况下,如何利用数据增强方法,将大规模预训练语料库中的词向量嵌入模型与特定领域语料库中的词向量嵌入模型相结合,以提高在抑郁语言检测任务中的表现,结果显示该数据增强方法可以显著提高模型性能。
Jun, 2021
本文提出了一种从稀疏文本中训练领域特定词向量的新方法,它不仅利用领域文本,而且还利用领域词汇和语义关系。作者将不同类型的领域知识编码为文本注释,并开发了一种新的词注释嵌入算法,将这些文本注释与词嵌入相结合。作者已在两个网络安全文本语料库上对其方法进行了评估,并证明了它在学习领域特定词嵌入方面的有效性。
Sep, 2017
本文介绍了基于 37,604 篇开放获取的社会科学研究论文构建和评估词向量模型。在评估中,我们比较了特定领域和通用语言模型在语言覆盖、多样性和语义关系方面的差异。我们发现,即使词汇表的大小相对较小,所创建的特定领域模型覆盖了社会科学概念的大部分,与更通用的模型相比,邻域更加多样化。在所有关系类型中,我们发现更广泛的语义关系覆盖范围。
Feb, 2023
提出一种新模型共同学习单词和语义嵌入,以解决现有方法无法区分单词不同含义的问题,利用大规模预料库和语义网络优化嵌入空间,并在各种任务中评估了该方法的优点。
Dec, 2016
本文探索对跨域情感分析任务采用对比学习方法,提出了一种修改后的对比目标,并在同一类的句子表示之间拉近,不同类的之间推远的方法,实验证明我们的模型在跨域和多域情感分析任务中都取得了最先进的性能,同时,可视化结果展示了知识转移的有效性,并通过对抗测试验证了模型的鲁棒性。
Aug, 2022