研究使用问题 - 回答对来学习语义解析器,其中逻辑形式被建模为潜变量,并提出了一种新的语义形式 —— 基于依赖的组成语义学。该方法具有有利的语言学、统计和计算性质,并在两个标准语义解析基准测试中优于所有现有的最先进系统。
Sep, 2011
提出了一种在脉冲神经网络结构中实现复合分布语义、解决概念绑定问题的方法,利用标记图像进行词向量训练。
Jan, 2024
本文介绍了基于矢量表示的分布语义模型,扩展到短语和句子,提出了分类组合分布语义学理论框架,实现了短语和句子层面的言外推理,并通过实验论证了基于密度矩阵的熵距离在词语和短语、句子层面的言外推理可行性和优越性。
Dec, 2015
本文提出了用自动提取的近义例子替代手工注释进行组合模型训练的方法,同时开发了一种上下文感知的短语组成能力评分模型,实验结果表明这些方法可以用于提高机器翻译系统的翻译质量。
Jan, 2018
本研究详细介绍了一个基于丰富的单词嵌入的组成分布式框架,旨在促进句子中单词之间的交互,并使用环境中的句法信息来增强向量。研究结果表明,该框架在 MSRPar 任务上取得了具有代表性的结果。
Aug, 2015
提出了一种自然语言语义框架,使用向量对词语、短语和句子进行表示,基于理论分析,假设意义由语境决定。该方法可以推广向量加法、分量乘法和张量积等现有方法,并使用 lattice 结构描述语义之间的蕴含关系。
Jan, 2011
本文研究了分布语义学中的组合性问题,使用 Coek,Sadrzadeh 和 Clark 提出的范畴理论框架,将语法分析形式主义与分布语义表示法相结合,生成具体的组合式分布式模型,并展示它们在自然语言处理领域的有效性。研究的贡献包括将 DisCoCat 框架拓展到在句法和语义上,验证模型的优势以及提出了在本主题上应用范畴论的未来研究方向。
Nov, 2013
通过最大化同一文本最小扰动嵌入之间的对齐,以及在更广泛的语料库中鼓励嵌入的均匀分布,基于对比学习的各种方法已被提出来从未标记的数据中学习文本表示。不同的是,我们提出最大化文本和其短语成分组成之间的对齐,考虑了此目标的多种实现方法,并详细阐述了每种情况下对表示的影响。语义文本相似性任务上的实验结果显示,与最先进的方法相当的基线改进。此外,本工作是第一个这样做而不需要额外网络参数或辅助训练目标的工作。
Jul, 2023
文章介绍了一种可以精确和控制地针对句向量中的组合含义信息的方法,利用一个专门的句子生成系统,创建遵循特定句法、语义和词汇约束条件的带注释的大型句子集。实验表明,这种方法能够从多种现有的句子表示模型中提取有用的信息,有助于理解这些系统对句子信息的捕获能力。
Sep, 2018
通过基于多语种数据和联合嵌入的分布式假设扩展学习语义表示的新技术,学习出在跨语言上语义等价的句子之间高度对齐而在不相似的句子之间保持足够距离的表示。此方法不仅适用于单词层面,还可以对文档进行语义层面的表示学习。在两个跨语言文档分类任务上,我们的模型都能胜过之前的最佳成果,并通过定性分析和枢轴效应研究证明了我们学习到的语义表示合理且能够捕捉跨语言语义关系。
Apr, 2014