语义歧义的因果结构
将词义模糊从词汇层面扩展到语篇模糊,通过基于 Bell-CHSH 场景的上下文建模,计算了数据集上的上下文性测量,并获得了更高比例的上下文模型,证明了有关 Winograd Schema 的自然语言处理挑战可以使用上下文建模。
Feb, 2024
本文研究荷兰语定语从句的结构歧义,通过研究基于语境的消歧任务,探讨前一句话的存在如何解决定语从句的歧义,应用此方法于两种句法分析结构,结果表明基于证明网的神经符号句法分析器比基于通用依赖的方法更容易纠正数据偏见,然而两种设定都受到相应的初始数据偏见的影响。
May, 2023
本文构造了类量子的语境性指称,利用 sheaf 论证明了 BERT 在自然语言语料库中发现了丰富的群体语境性例子,这些例子为未来研究和将量子计算扩展到自然语言处理提供了可能性。
Aug, 2022
我们的研究使用最新的上下文语言模型对词汇歧义的心理学理解进行了一系列模拟,发现它们捕捉了单义词、同音异义词和多义词之间的微妙有意义的区别,为现代心理学理解词汇歧义提供了量化支持,并提出了理解上下文信息如何跨不同时间尺度塑造词汇意义的新挑战。
Apr, 2023
本论文提出了一个基于语言学家注释的语言歧义数据集,并测试了预训练的语言模型在识别和分离歧义上的表现。结果表明,这是一个极具挑战性的任务,现有的模型正确率仅为 32%,本文挑战学术界重新认识语言歧义在自然语言处理中的重要性。同时,本文还展示了一个多标签自然语言推理模型如何帮助识别由于语言歧义而引起的虚假政治言论。
Apr, 2023
通过观察人工神经网络在解决交流任务时是否会出现类似的共同体结构,本研究旨在更好地理解共指结构在自然语言中的起源。研究结果显示,尽管存在增加歧义的可能性,带有共指结构的语言仍然可以被神经模型学习;共指结构在模型之间可以 “自然地” 出现,而不需要额外的约束;在说话者身上施加明确的效率压力会增加这些结构的普遍性。研究得出的结论是,在神经网络之间,某些语用结构可以直观地出现,而不需要明确的效率压力,但是说话者和听话者之间相互竞争的需求会影响它们出现的程度和性质。
Aug, 2023
通过研究 18 种不同语言中的单词,文章证明了词汇歧义的大小与上下文提供关于其信息量的相关性,从而推断有歧义的单词可以在上下文中被澄清,使其更好理解。
Oct, 2020
研究人类阅读园路效应时,提出的 surprisal 理论假设阅读者的速度减慢是由于句子中每个单词的不可预测性。但最近的研究表明,该假设低估了句法预测的影响。作者提出了计算句法预测能力的方法,并发现将其与词汇预测能力区分开来可以更准确地估计园路效应的影响。然而,即使这样,surprisal 仍然远远低估了人类阅读园路效应的影响。
Oct, 2022
提出一种可以模拟信息存在多重解释的多智体模态逻辑框架,通过不同语义捕获不同情况下智体对于信息二义性的设想,并论证 Aumann 定理在存在二义性时不成立,探究了假设公共优先(即没有二义性)和假设共同初始信念(即共享初始信念)之间的权衡。
Mar, 2012