- 语义变化的两个定律:用分布式语义模型预测同义词的变化
本文提出了一个关于词对中同义词语义演变的权衡法则的评价框架,利用分布语义模型提供了证据并探讨了挑战,结果支持了不同化法则的主导作用。
- 看见优势:通过视觉衍生词嵌入更好地捕捉人类的语义知识
本文旨在利用图像丰富文本语义模型,以更好地捕捉词汇意义的认知方面,并通过大型启动实验展示在视觉基础词嵌入中添加视觉信息的预测性能更好,其中与人类单词相似性的相关性也更高,并展示了视觉基础嵌入可以捕捉到仅使用纯文本不能提取的信息。
- ACL用几何变换表示语法和组合
本研究旨在使用几何转换编码句法图,并探讨哪种几何转换更好地编码句法关系,以增强短语级合成中的句法情境化。
- ACL分布式语义学的目标是什么?
研究了当前语义模型在不同的语义问题上的表现,得出了将语言学观察应用于模型设计的重要性并指出未来进展需要在语言表达和计算可行性之间平衡。
- ACL无监督映射实现跨主题分布语义表示
本文提出了一种基于不同主题学习单词的多个分布式表示的分布式语义模型,该模型通过不同主题训练不同的 DSM,然后将每个基于主题的 DSM 对齐到一个公共向量空间,实现了最先进的上下文词语相似性任务,并且在 NLP 下游任务中表现出比单一原型模 - SIGIRDINFRA: 一个为计算多语言语义关联提供便利的一站式平台
DInfra 是一款计算十二种语言的多语言语义关联和相关性的基础设施,通过三种分布式语义模型(DSM),并提供一个易于使用的 Web 服务界面,用户可以轻松访问多种 DSMs 的比较结果,并使用 API 配置和访问 DSM 参数。
- 分布式术语集扩展
本文是一个对中心度和分类基于迭代术语集扩展方法在使用分布语义模型时的性能的短期实证研究。研究发现,在使用不同的分布模型和不同的术语集时,基于主动学习的分类方法始终优于基于中心度的方法。
- 利用蕴涵的分布式语义学学习上下位词的词嵌入
该研究提出了一种基于向量空间的框架来对词汇包容性建模的分布语义模型,利用伪短语中邻近的两个词向量提出了一种隐向量,并探究了模拟词作为证据或词作为后验分布的优缺点。实验表明,所得到的词嵌入模型优于之前预测词之间下义词关系的最佳结果。
- ACL利用偏移推理提高语义合成
文章介绍一种新的分布式推理方法,以解决基于计数的分布语义模型在任何文本集合中存在未观察到但可能存在的共现所带来的稀疏性问题,尤其是针对像 Anchored Packed Trees (APTs) 之类将共现的语法类型考虑在内的模型而言。该方 - ACL超类型遭受围攻:基于语言学的上位词检测方法
研究发现,基于语义分布的无监督测量方法可以用于上位词关系的自动识别,相对于有监督方法具有更高的鲁棒性。
- EMNLP数据规模和频率范围对分布语义模型的影响
本研究旨在探究数据规模和频率范围对分布语义模型的影响。比较了几种代表性模型在不同规模的数据和各种不同频率的测试项下的性能表现。结果表明,当数据规模较小时,基于神经网络的模型表现不佳,而在各种规模和频率范围的数据下,可靠性最高的模型是倒置分解 - ACL用 APSyn 测试向量余弦相似度估计
本研究旨在探究一种新的度量方法 APSyn,在相似度估计任务中表现出了高的竞争力,甚至与单词嵌入的结果报告相当,并解决了 Vector Cosine 的一些弱点。
- 组合分布式语义中的句子蕴含
本文介绍了基于矢量表示的分布语义模型,扩展到短语和句子,提出了分类组合分布语义学理论框架,实现了短语和句子层面的言外推理,并通过实验论证了基于密度矩阵的熵距离在词语和短语、句子层面的言外推理可行性和优越性。
- SimLex-999:使用真实相似度评估语义模型
SimLex-999 是评估分布语义模型的黄金标准资源,通过关注相似性,而非联想或相关性,改进了现有资源的评价方式以及提供了的具体和抽象的形容词、名词和动词对,具有良好的可塑性和更大范围的应用。此外,SimLex-999 可用于分析模型在不