- ACL通过对比解码增强大型语言模型中的上下文理解能力
大型语言模型在生成文本时常常不能充分整合输入上下文,过度依赖模型参数中的编码先验知识,导致生成的文本存在事实不一致或上下文不忠实的内容。本研究提出了一种新颖的方法,利用对抗性无关信息作为负样本,通过对比解码来增强生成过程中的强大上下文基础。 - 一种基于大脑皮层层次性事件回忆器的架构
该研究提出了一种新的机器学习方法,专注于复杂模式的无监督连续上下文依赖学习。论文的证明了该系统能够从原始数据中学习、识别和预测人类言语等复杂时间序列。
- COLING大规模语言模型的鲁棒可扩展模型编辑
利用 EREN(通过阅读笔记编辑模型)提出方法来提高大型语言模型的可伸缩性和鲁棒性,通过正确响应语法相似但语义无关的输入以及从多个修改中整合知识,优于现有技术。
- AAAIViSTec: 体育技术识别与战术分析的视频建模
为了解决目前手动注释和低层次注释方法在球拍运动视频中对战术理解的限制,我们提出了一个基于视觉数据和上下文洞察力相结合的视频球类运动技巧识别模型 ViSTec。我们的方法通过引入图形来显式建模球拍序列中的战略知识,并通过上下文归纳偏差增强技巧 - COLING生成模型的信实性在上下文迁移下的分析
本研究引入了一种知识增强生成器,旨在生成依托于上下文知识的信息,无论上下文如何变化。我们的研究重点探究在动态知识存在时生成型问答的忠实度,并分析其产生原因。我们提出了一种简单而有效的探测此类幻觉的方法,并发现所有模型都倾向于生成以往的答案作 - 随着文本增加,需求加大:推理时间训练有助于长文本生成
通过在长文本生成过程中使用临时的 Lora 模块来嵌入信息,我们的提出的方法 Temp-Lora 有效地保留上下文知识,提高了生成质量,同时降低了计算成本。
- EnrichEvent:为新兴事件提取丰富的社交数据和背景信息
社交平台是传播和讨论真实事件信息的关键平台,本研究提出了一种利用社交数据的词汇、语义和上下文表示来检测社交事件的框架,通过利用上下文知识在最早的阶段检测语义相关的推文并提高聚类质量,进而展示每个事件的演变变化。经过广泛实验验证了该框架在检测 - 基于预训练双变压器的时间感知二分图模型
本文提出了一种基于对偶 Transformer 结构,利用对预训练数据集的上下文信息进行对比学习来生成用户端和内容端之间双向映射的预训练方法,并在推荐任务中证明了该方法的有效性。
- COMET-M: 在复杂句子中推理多个事件
该研究提出了 COMET-M(Multi-Event),一个以事件为中心的常识模型,能够针对复杂句子中的目标事件生成常识推理,并通过 35K 人类撰写的推论数据集进行了实验验证,结果表明其在生成多事件推理方面具有优异的性能。
- ACL基于证据的事实核查的隐式时间推理
研究表明,利用时间信息可以对基于证据的事实检验的认证过程起到积极的正向影响,通过对构建共享时间轴的发布日期和时间表达式进行基础建设可以建立索赔和证据之间的时间关系,从而提供给基于循环神经网络(RNN)和转换器(Transformer)的分类 - DisentQA:使用反事实问答解开参数化和语境知识的混淆
该研究提出了一种新的 QA(Question Answering)模型范式,通过引入反事实数据增强的方式,使模型能够预测基于给定语境知识和基于参数化知识的两种答案,从而改善模型的鲁棒性和生成有用的无关答案。
- 基于知识图谱的上下文驱动视觉对象识别
通过将语境知识编码到知识图中,提高深度学习方法的鲁棒性,增强物体识别模型对于跨领域和真实世界场景的表现。
- 上下文感知的杂货提醒家庭机器人
本研究介绍了一种计算架构,结合了感知学习算法、记忆编码和学习的认知模型、预测缺失物品的推理模块和图形用户界面,并与 Fetch 移动机器人集成验证,以通过与用户的互动学习个性化上下文知识及长期预测家庭中缺失的物品。实验结果表明,机器人可以通 - 基于图神经网络编码的树约束指针生成模型在情境语音识别中的应用
本文提出了一种将图神经网络编码应用于基于树约束指针生成器的端到端语音识别系统中,以便用上文本知识中的偏见词,结果显示与原始模型相比,相对 WER 降低了约 15%。
- 基于树约束指针生成器的上下文 ASR 中减小偏置词误差
本文提出了一种基于 “TCPGen” 的端到端自适应语音识别模型,在训练和测试中引入外部语境信息和偏置词列表,并通过构建符号前缀树和优化偏置词错误率等手段,显著提高了长尾高价值词汇识别准确率,甚至在未出现在已知数据集中的词汇上也取得了较大的 - EMNLP语言模型压缩中的语言上下文提取
本文提出了一种新的语言表示学习的知识蒸馏方法,通过单词关系和层变换关系传递上下文知识,无需限制教师和学生的架构变化,验证了该方法在语言理解任务的各种架构和 DynaBERT 等自适应尺寸剪枝方法的挑战性基准上的有效性。
- 交互式论点配对的离散论点表示学习
本论文研究利用层次结构模型结合语境知识,提取相互持相反态度的帖子中互动的观点对,结果表明我们的模型能够有效地提取讨论的核心内容并超越现有模型的性能水平,从而证明了我们学习到的表示具有广泛的应用价值。
- 推文中的隐式实体链接
该文介绍了推特上隐含实体链接的问题并提出了解决方法,利用实体的事实和上下文知识来进行实体链接任务,并展示了隐式实体链接的重要性和相关价值,并公开了真实数据集以促进该新领域的研究。