- NeBuLa: 一个基于话语的 Minecraft 建筑师
将先前的上下文和非语言环境融入对话中,可改进语言到行动组件,本文展示了通过微调 LLM 来预测基于先前环境的行动,在 Jayannavar 等人 (2020) 任务上,我们的模型 NeBuLa 相比基准线将净行动 F1 分数提升了一倍。我们 - EMNLPDocNet: 归纳偏置检测模型中的语义结构
社交媒体正在成为新闻的主要入口,但由于人们的观点不同,新闻将存在偏见。本文探讨了新闻文章中经常被忽视的偏见检测方面:语义结构。我们提出了一种新颖的归纳式、资源有限的文档嵌入和偏见检测模型(DocNet),其性能超过了大型语言模型。我们还证明 - 通过结构条件语言生成注释 FrameNet
使用 FrameNet 形式主义,本研究探讨了通过生成新句子来保留给定语义结构的任务。我们提出了一个框架,通过过度生成和过滤的方法生成新的框架语义注释句子。我们的结果表明,基于丰富且明确的语义信息进行条件生成往往会产生高人工接受度的生成结果 - 操作潜空间
通过自我监督学习研究潜在空间的构建,支持语义有意义的操作;操作性潜在空间不仅展示语义结构,如聚类,还支持具有内在语义意义的常见转换操作。
- 学习视觉语义子空间表示进行命题推理
我们提出了一种基于核范数损失的新方法,用于学习既符合指定语义结构又有助于概率命题推理的视觉表征,最小化该方法编码了语义的谱几何在子空间格点上,可以用投影算子表示逻辑命题。
- MM魔幻标记:利用 LLM 维护文档外部标记
这篇论文研究了使用语言模型在文档中绑定元数据的方法,以实现自动标记和丰富注释的功能,并通过实验验证了系统的准确性和性能。
- EMNLP您是一位专业的语言标注专家”:LLMs 作为抽象意义表达分析器的限制
通过比较 GPT-3、ChatGPT 和 GPT-4 模型的分析结果,研究发现这些模型能够可靠地重现 AMR 的基本格式,并且通常能够捕捉到核心事件、论证和修饰结构,但模型的输出容易出现频繁和重大错误,从整体上来看,即使在演示中,模型也几乎 - 通过部分正交性揭示嵌入的含义
研究了语义结构如何编码在文本嵌入向量的代数结构中,通过引入语义独立性的概念和部分正交性作为相关代数结构,证明了部分正交性确实捕捉到了语义独立性,同时介绍了保持独立性的嵌入方法及其近似存在性的证明。
- 跨视频上下文知识的探索和利用,减少弱监督时序动作定位的歧义
通过在数据集中探索并利用跨视频的上下文知识,我们的研究提供了一种新方法来间接改善对细粒度行动模式的整体理解,并减少模糊性。通过提出一个端到端框架,我们的方法在几个数据集上得到了比最先进方法更好的表现。
- 基于本地引导语义结构的语言建模的经验充分下限
通过在词汇层面上构建语义结构的二元向量表示方法,研究并总结了一个基于神经组件和层次符号组件相互配合的语义引导语言模型在提高文本生成的可预测性和语言解释性上的表现所必须具备的条件,包括语义向量表示的维度,以及对这些表示结果涉及噪声和信号的分布 - 基于不规则分组解耦的语义结构图像压缩
本文提出了一种基于自定义组掩码将图像分解为多组不规则形状的方法,使得通过减少冗余内容的传输实现重大的比特率节省,并保证重建的可靠性。我们还提出了组独立变换的概念,通过提出的 GI Swin-Block 来实现,比现有技术表现出更好的性能。
- CodeKGC: 基于代码的生成式知识图谱构建模型
通过代码语言模型生成三元组以构建语义结构明确的知识图谱,并使用增强理由生成法提高知识提取能力,实验结果表明该方法在基准数据集上取得优异表现。
- Transformer 如何学习主题结构:迈向机制理解
本文研究 transformers 学习的机制和语义结构,揭示了 embedding 层和 self-attention 层如何编码语义结构,具体表现为同主题单词之间的嵌入内积和自注意力相对较高。
- CVPRUniHCP: 人类中心感知的统一模型
本文提出了 UniHCP,一个使用简化的端到端模式和平面视觉转换器架构,将广泛的以人为中心的任务统一起来的集成模型,通过在 33 个数据集上进行大规模联合训练,在多个领域和下游任务上直接评估优于强基线结果,在适应特定任务时,UniHCP 在 - EMNLP多语言语言模型预训练的语义知识多级蒸馏
本论文提出了一种新的多层次多语种知识蒸馏方法(MMKD),采用英语 BERT 中的丰富语义表征知识和师生框架来鼓励源 - 目标对之间的多个层次一致性和教师和学生模型之间的相关相似性,以提高预先训练的多语种语言模型的性能。在横跨语言的评价任务 - 一个语义分层图神经网络用于文本分类
本文研究了基于图神经网络的文本分类任务,提出了一种新的分层图神经网络模型(HieGNN),其在词级别、句子级别和文档级别分别提取相应的信息。实验结果表明与几个基准方法相比,我们的模型能够从样本中获得更多有用的分类信息。
- COLING基于语义结构的知识图谱问答查询图预测
本研究主要关注于如何从自然语言问题中构建查询图谱,提出了一种基于语义结构的 BERT 模型进行分析和预测,通过过滤噪声查询图,提高了问题解答的准确性。实验结果表明该方法比现有技术有更好的效果。
- CVPRHCSC: 分层对比选择编码
提出了一种新的对比学习框架 HCSC,可以通过构建并动态更新一组层次结构原型来表征图片数据中的层次语义结构,并且通过一种精心设计的对对选择方案来让图像表示更好地适应这些语义结构。在广泛的下游任务中,证明了 HCSC 优于现有对比方法,其重要 - 探索词语和关系的理论表示
该研究提出了一种理论方法,将词嵌入和知识图谱中的实体及其关系的几何形状联系起来,以便更好地理解它们的语义结构和性能。
- 跨模态检索的判别式监督子空间学习
本文提出了基于判别式监督子空间学习(DS2L)的异模检索方法,包括构建共享语义图以保留每种模态内的语义结构,引入 Hilbert-Schmidt 独立准则(HSIC)来保留样本特征相似性和语义相似性的一致性,同时引入相似性保持项以更好地保留