pair2vec: 用于跨句子推断的组合词对嵌入

ACLOct, 2018

pair2vec: 用于跨句子推断的组合词对嵌入

pair2vec: Compositional Word-Pair Embeddings for Cross-Sentence Inference

Mandar Joshi, Eunsol Choi, Omer Levy, Daniel S. Weld, Luke Zettlemoyer

TL;DR通过最大化点对互信息来学习和使用单词对的嵌入表示，将这些表示添加到现有的推理模型的跨句子注意力层中，以取得更好的性能，特别是在对抗数据集方面。

Abstract

Reasoning about implied relationships (e.g., paraphrastic, common sense, encyclopedic) between pairs of words is crucial for many cross-sentence inference problems. This paper proposes new methods for learning and using embeddings of word pairs that implicitly represent background knowledge about such relationships. Our →

pairwise embeddings pointwise mutual information cross-sentence attention layer inference models adversarial datasets

发现论文，激发创造

针对深度组合模型的语法感知多义词嵌入

本研究详细介绍了一个基于丰富的单词嵌入的组成分布式框架，旨在促进句子中单词之间的交互，并使用环境中的句法信息来增强向量。研究结果表明，该框架在 MSRPar 任务上取得了具有代表性的结果。

Aug, 2015

句子嵌入的构成对比学习

通过最大化同一文本最小扰动嵌入之间的对齐，以及在更广泛的语料库中鼓励嵌入的均匀分布，基于对比学习的各种方法已被提出来从未标记的数据中学习文本表示。不同的是，我们提出最大化文本和其短语成分组成之间的对齐，考虑了此目标的多种实现方法，并详细阐述了每种情况下对表示的影响。语义文本相似性任务上的实验结果显示，与最先进的方法相当的基线改进。此外，本工作是第一个这样做而不需要额外网络参数或辅助训练目标的工作。

Jul, 2023

用于改写和文本摘要的语义句子嵌入

介绍了一种适用于高级自然语言处理的句子向量编码框架，该框架可以从编码器 - 解码器模型中提取具有相似向量表示的常见语义信息的句子 latents 表示。我们将句子表示的应用用于两个不同的任务 -- 句子复述和段落摘要，使其适用于常用的循环框架处理文本。实验结果有助于深入了解向量表示适用于高级语言嵌入。

Sep, 2018

显式配对词交互建模改善预训练 Transformer 在英语语义相似性任务中的性能

本研究使用 BERT 模型，通过引入显式的有限制的单词成对交互机制，提高了语义相似度和答案句子选择等 4 项任务的性能。

Nov, 2019

使用连续配对判别器学习语义句子嵌入

本文提出了一种获取基于句子嵌入的方法，通过引入约束来确保生成的近义词句子嵌入与原始句子嵌入相似，此方法在惯用数据集上的近义词生成和情感分析任务中要优于最先进的方法，并且是具有统计意义的。

Jun, 2018

最佳综合嵌入

本文介绍一种基于词嵌入组合方法，该方法旨在通过满足新向量与其组成部分的向量表示之间的距离一致且最小化来实现给定一组词的公平嵌入表示。该嵌入组合方法可适用于静态和上下文相关的词表示，适用于创建句子的表示，并学习不一定按序组织的词组的表示。我们理论上表征了这种表示存在的条件并推导了解决方案。我们在数据增强和句子分类任务中评估了该方法，研究了嵌入和组合方法的多种设计选择。我们展示了我们的方法在解决用于捕捉句子简单语言特征的探测任务方面的卓越效果。

Jun, 2024

贝叶斯段落向量

本文提出了一种基于神经网络的段落向量的新解释，基于概率论的方法可以通过后验不确定性来在监督学习任务中提升性能，进一步提高了段落向量的研究应用。

Nov, 2017

PairRE: 基于配对关系向量的知识图谱嵌入

我们提出了 PairRE 模型，能够处理复杂的关系以及编码多种关系模式（如对称 / 反对称、逆向和组合），并且能够进一步编码子关系，从而在链接预测任务上取得了最新的最好结果。

Nov, 2020

组合和非组合短语嵌入的自适应联合学习

本文提出了一种新的方法，通过自适应加权组成和非组成短语嵌入来学习短语嵌入，其中使用组成性评分函数量化每个短语的组成水平，并联合优化功能参数。在实验中，我们将自适应联合学习方法应用于学习及物动词短语的嵌入，并显示组成分数与动词 - 宾语组合的人类评分具有很强的相关性，明显优于以往的技术水平。此外，我们的嵌入在及物动词消歧任务上也优于以前的最佳模型。我们还展示了一种简单的集成技术，进一步提高了两项任务的结果。

Mar, 2016

PAIR：基于片段相似性关系提升密集型文本检索

该研究提出了一种利用查询中心和段落中心相似性关系（称为 PAIR）进行密集段落检索的新方法，同时引入了高质量的伪标记数据，通过两阶段训练过程，显著提高了检索性能。

Aug, 2021