- G-Transformer 用于时间上的条件平均潜在结果估计
给医学个性化决策做出重要贡献的研究论文,提出了一种新的神经网络模型 G-transformer,用于基于观察数据对治疗效果的时间估计,该模型能够准确、低方差地预测条件期望效果,具有迭代回归和处理电子健康档案的能力。
- 面向几何感知的神经多目标组合优化 Pareto 集学习
通过基于超体积期望最大化的 Pareto 注意模型以及超体积残差更新策略,结合新颖的推理方法和局部子集选择方法,设计了一种名为 GAPL 的几何感知 Pareto 集学习算法,用于解决多目标组合优化问题,提高问题的分解能力和多样性增强。通过 - 基于语言模型的本体中新概念定位框架
使用语言模型将从文本中提取的新概念插入本体的任务中,我们探索了一种三步骤的方法:边缘搜索,边缘形成和丰富,边缘选择。在所有步骤中,我们提出利用神经方法,其中我们应用基于嵌入的方法和 BERT 等预训练语言模型的对比学习进行边缘搜索,并采用基 - EUGENE:可解释的无监督图编辑距离近似
本文提出了一种高效的代数无监督方法 EUGENE,它近似计算图的编辑距离,并产生对应的编辑路径,同时消除了对真实编辑距离的生成和数据特定训练的需求。广泛的实验评估表明,EUGENE 在各个基准数据集中始终排名最准确的方法之一,并且胜过大部分 - 神经多目标组合优化增强多样性
通过提出一种新的具有多样性增强的神经启发式方法,我们能够从多目标组合优化问题的不同视角产生更多的 Pareto 解,并在经典的多目标组合优化问题上取得了更高的多样性 Pareto 前沿和卓越的整体性能。
- DeSCo: 通用且可扩展的深度子图计数
设计了 DeSCo,一种可扩展的神经深度子图计数流水线,通过一次训练准确地预测任何目标图中查询计数和发生位置,在计数预测的均方误差方面,优于现有的神经方法,同时保持多项式运行时间复杂度。
- 使用卷积和记忆网络在维基百科表格上进行关系抽取
本文探讨了如何将神经方法运用在表格数据上,以提取实体之间的关系,并介绍了一种在卷积神经网络 (CNN) 和双向长短记忆网络 (BiLSTM) 的基础上构建的新模型,通过实验结果和综合分析,表明该模型在关系提取方面表现出色,是未来进一步研究的 - 历史英语语义相似性巨大数据集
该研究利用来自当地美国报纸的新数字化文章创建了一个巨大的语义相似性数据集,并利用深度神经方法检测了这些文章中的正面语义相似性对。该语义相似性数据集跨足了 70 年,包含近 400M 个正面语义相似性对,随着时间跨度的增加,将有助于将对比训练 - 运行时域损坏下的变分反事实预测
本文介绍了一种新的方法,通过领域适应和对抗域适应来对付运行时域损坏,提高反事实预测器的泛化性能。我们的 VEGAN 模型在标准数据集上表现优异,达到了个体水平的治疗效果估计。
- 基于神经解聚的城市时空数据综合
通过将粗糙、低分辨率地理单元的聚合城市数据细分,我们尝试合成细粒度、高分辨率的城市数据,并提出了三种改进方法以提高细分结果。
- 利用隐式逻辑限制在事件性知识图谱上进行复杂查询回答
本文研究基于事件中心知识图谱的深度神经网络复杂查询方法,提出了复杂事件查询回答(CEQA)框架,利用定理证明器填补实体中心查询系统无法推理的逻辑不确定性,实现了在具有时间维度的事件中心知识图谱上的准确推理。
- 通过提示 LLMs 学习可解释的风格嵌入
本研究使用提示技术,对大量文本进行文体分析,得到了一组可解释的文体表示方法 LISA embeddings,为解决当前使用神经网络进行文体表示学习所面临的可解释性困境提供了新的解决方案。
- 基于对比个性蒸馏的零样本个性化表格生成
研究采用零样本的方式进行个性化表格文本生成,提出了一种半监督方法,利用对比个性蒸馏实现个性化内容。该方法旨在提高文本信息生成的个性化表现,同时维持内容的真实性,实验表明该方法表现出色。
- 两种召回方式
本文提出模式模型和学习模型在精度和召回率方面的差异,并通过实验证明神经方法在 d-recall 方面确实表现更好,但在 e-recall 方面模式模型仍然显著更优。理想的方法应该同时考虑两种,如此理想应该体现在我们的评估中。
- WSDM面向依赖关系的实体对齐自训练
研究通过利用实体之间的依赖关系来改进自训练策略,从而实现在不需要大量标注映射的情况下,准确和有效地检测来自不同知识图谱的实体对齐。强调提高自我训练方法的正确率,同时建议在智能数据注释方面开展后续研究。
- ACL低资源多语言和零样本多说者 TTS
在这项工作中,我们将零样本语音克隆和多语言低资源语音合成的任务结合在一起。通过使用语言不可知的元学习(LAML)程序和对 TTS 编码器的修改,我们证明了一个系统可以学习在只有 5 分钟的训练数据下说一个新语言,同时保留了推断新学习语言中甚 - 通过神经图剪枝实现准确的子图相似度计算
本研究提出了一种基于神经网络的子图相似性搜索方法,结合了剪枝技术和注意力机制,通过将图剪枝转化为节点重标记的可微分问题,并设计了多头剪枝策略,有效地优化了子图编辑距离计算。在七个基准数据集上实现了最新的最优结果。
- 知识图谱中的归纳逻辑查询回答
研究使用图神经网络的归纳节点和关系结构表征方法对知识图谱中的新实体进行逻辑推理的方法,并实验发现归纳模型能够在推理时间内对未见节点进行推理,同时可以推广至训练天数 500%大的图表,表现出较高效率和效果平衡的特点。
- EMNLPASDOT:基于预训练语言模型的任意样本数据到文本生成
提出了 Any-Shot Data-to-Text (ASDOT) 方法,通过数据消歧和句子融合两个步骤,使用预训练语言模型实现灵活地进行零样本学习的数据文本生成,实验证明 ASDOT 能够显著提高生成效果。
- 濒危语言的文本规范化:以利古里亚语为例
本文提出一种有效的 Ligurian 文本标准化方法,利用基于变压器的模型实现了较低的错误率,并在公共数据集上公开发布了 Ligurian 语言的首个单语语料库。