- EMNLPPromptBERT: 利用提示提高 BERT 句子嵌入
本文提出了一种新的对比学习方法 PromptBERT,用于改进句子表示的效果,在分析当前 BERT 句子嵌入的缺陷后,通过两种提示表示方法和三种提示搜索方法实现更好的句子嵌入,同时通过模板去噪技术,提出了一种新的无监督训练目标,大大缩短了有 - EMNLPPAUSE: 正向和淬火未标记句子嵌入
本文提出了一种名为 PAUSE 的模型,它通过部分标注数据集学习高质量的句子嵌入向量,并在各种基准测试任务上达到甚至超过当前最先进水平,尤其适用于工业场景下标注数据稀缺的情况。
- EMNLP面向抽取式文本摘要的多路复用图神经网络
我们提出了一种 Multi-GCN 模型来解决文本摘要中的问题,该模型结合了句子和词语之间的不同类型关系,并根据此模型提出了一个 Multi-GraS 模型进行提取性文本摘要。
- ACLDefSent: 使用定义句子生成句子嵌入
该研究提出了一种基于单词词典中定义句子的句子嵌入方法 DefSent,其在文本相似性和情感分析任务上相较于常规方法表现更好,以较小的代价拥有与大型 NLI 数据库相似的性能。
- BERT 和 ALBERT 句子嵌入在下游 NLP 任务中的表现评估
探讨了使用 BERT 和 ALBERT 进行 Sentence Embedding 的方式,并通过实验发现,对于 STS 和 NLI 数据集的任务,ALBERT 表现明显优于 BERT。
- KR-BERT:小规模韩语特定语言模型
本论文旨在训练适用于韩语的小型语言模型 KR-BERT,通过采用较小的词汇表和数据集、优化令牌化方法,提高了韩语语言现象的捕捉效率,实现了与大型语言模型相媲美甚至更优的性能。
- SBERT-WK:通过解剖基于 BERT 的词模型的句子嵌入方法
本文介绍了一种基于 BERT 的词模型的高质量句子嵌入方法 ——SBERT-WK,它通过对词表示所张成空间的几何分析,研究了深度上下文模型词表示的分层模式,并在语义文本相似度和下游监督任务中评估了其性能,实验结果表明 SBERT-WK 取得 - EMNLP利用离散余弦变换进行高效句子嵌入
本论文提出了使用离散余弦变换 (DCT) 压缩以保持顺序的单词序列来代替向量平均法进行句子嵌入。与向量平均法相比,这种方法更好地保留了句法信息,从而在与句法相关的分类任务中表现更好。
- ACLSTRASS: 基于句子嵌入的轻量高效提取式摘要方法
本研究介绍了 STRASS 方法来进行提取式文本摘要,其利用现有句子嵌入空间中的语义信息来选择最接近文档嵌入的句子并进行提取式摘要。同时,该方法在法国判例摘要数据集上进行了有效的训练和推断,表现良好。
- ACL走向句子无损编码
研究了自然语言压缩及特征嵌入的方法,提出了一种近乎无损的文本压缩方法,并在情感分析中测试表现良好。
- 单词和句子嵌入中的动词和论元结构转换
通过研究基于人工神经网络编码的句子语境和词汇形态,本研究构建了五个数据集并测试了模型的可靠性,结果显示该方法对于某些动词变化是可行的,但对于其他动词变化则难以提取细粒度的字面信息。
- 利用句子嵌入进行医疗问题回答
本研究提出了一个基于监督学习的框架,使用上下文自注意力和多尺度技术对句子进行编码,用于医学问答任务,通过两个评分策略(语义匹配评分和语义关联评分),该框架在医学考试和临床诊断电子病历等集成数据集上实现了显著的改进。
- AAAI使用注意力递归树嵌入句子的学习
本文提出了一种新的 Attentive Recursive Tree 模型,它可以根据任务动态地定位一个句子中的重要单词,在底向上进行句子嵌入的组成时,AR-Tree 可以内在地强调重要单词。通过一种端到端的加强训练策略,该模型在三个句子理 - BioSentVec: 为生物医学文本创建句子嵌入
这篇论文介绍了 BioSentVec,自然语言处理中用于句子嵌入技术的一种新方法,并且在医学文本挖掘与语义相似度任务中取得了优异表现。
- 动态自注意力:动态计算单词的注意力,用于句子嵌入
本文提出了动态自注意力(DSA)机制,以改善自注意力的单词权重问题,提高句子嵌入的表现,在 Stanford 自然语言推理数据集中创造了最新的最先进结果,并在 Stanford 情感树库中取得了相似的结果。
- COLING用广义池化增强句子嵌入
本篇论文探讨了推广汇聚方法以增强句子嵌入,我们提出了基于向量的多头自注意力池化方法,该方法包括广泛使用的最大池化、平均池化和标量自注意力池化作为特殊情况,该模型通过适当设计的惩罚项减少多头注意力中的冗余,并在自然语言推理、作者配置文件和情感 - ICLR一种结构化的自注意句子嵌入
本文提出了一种基于自注意力机制的句子嵌入模型,通过使用二维矩阵表示嵌入,并让每行矩阵分别关注句子中不同的部分,提高了可解释性。并在作者分析、情感分类和文本蕴含等三个任务中进行了模型评估,在所有任务中与其它句子嵌入方法相比表现出了显著的性能提 - 使用长短期记忆网络的深度句子嵌入:分析和在信息检索中的应用
本文提出了一种基于循环神经网络和长短时记忆单元的句子嵌入模型,该模型能够自动侦测句子中关键词和主题,从而进行网络文档检索等艰难的语言处理任务,并在性能上显著优于现有的先进方法。