- MPSTAN:基于族群分布的时空关注网络用于流行病预测
本文提出了一种新型的混合模型 —— 基于母体群体的时空注意力网络(MPSTAN),通过将多点流行病学知识与时空模型相结合并自适应定义不同点之间的相互作用来提高流行病预测的准确性。在两个代表不同流行病学演化趋势的数据集上的广泛实验表明,我们提 - ACL通过临床问卷学习实现简单灵活的精神障碍检测模型
研究了使用社交媒体的语言特征来检测心理健康问题,并提出了一种能够有效利用领域知识、可被应用于其他心理障碍以及能够提供可解释检测结果的模型。
- 基于领域知识的深度学习药物推荐
本文提出了一种集成领域知识和可观察临床表现的新型 DKINet 框架,用于药物推荐,并设计了一个基于知识的编码器和一个基于数据的编码器,以及一个明确的药物编码器,用于学习患者的纵向依赖关系,并在三个公开数据集上进行了广泛的实验。
- 将领域知识融入深度神经网络中用于离散选择模型
本文提出了一种框架,通过约束条件将领域知识和先验信念与机器学习相结合,以支持可解释的基于数据驱动的离散选择模型的开发,并通过案例研究展示了该框架的潜力。
- TrueDeep:一种少数据的裂纹检测系统性方法
通过结合领域知识和深度学习架构,我们演示了在少量数据的情况下可以获得类似的性能表现,我们的算法使用 23% 的数据就获得了和测试数据相似、多个盲数据集有显著更好的表现,其中选择基于知识的输入图像有显著的性能提升。
- 基于预训练语言模型的正则增强领域迁移主题分类:金融领域应用
本文探讨在 fine tuning 过程中采用正则表达式模式作为领域知识的特征以及注意力网络的应用,用于改善对下游文本分类任务的 fine tuning 效果。实验结果表明,相较于仅在特定领域文本上进行 fine tuning,采用这种方法 - 人类,人工智能和背景:理解最终用户对于实际计算机视觉应用的信任
本文通过对一款实际计算机视觉应用进行的定性案例研究,提出了关于信任人工智能的全面而细致的理解。我们发现,领域知识和情境是评估和决策的重要因素,用户普遍认为该应用程序值得信任,但进行了确认行为,对于某些高风险情境,则决定不采用该应用程序。
- GPT 用于半自动化数据科学:介绍 CAAFE 进行上下文感知的自动特征工程
通过利用大型语言模型,提出了 Context-Aware Automated Feature Engineering(CAAFE)方法,该方法可以在表格数据集中生成语义相关的功能。通过将此方法应用于 14 个数据集,可以提高 11 个数据集 - 医疗 SAM 适配器:为医学图像分割而适配的段落任意模型
本文提出了一种称为 Med SAM Adapter 的方法,它通过将医学特定领域知识与分析模型进行简单而有效的适应技术的集成,将 SAM 模型的强分割能力扩展到医学图像分割,在多种图像模态下优化 19 项医学图像分割任务,并超过各种已有的基 - System III: 使用领域知识进行学习以满足安全限制
提出了一种新颖的框架,在强化学习代理中引入领域知识以促进安全探索和提高样本效率,该方法在 OpenAI 的 Gym 和 Safety-Gym 环境中的任务中均表现出了更安全的探索和更高的样本效率。
- 领域掌握基准:评估大型语言模型整体领域知识的不断更新基准 -- 初步发布
本文介绍了一个包含十万条问题的中英混合数据集 DomMa,它是一个综合多领域、大量数据的评测系统,目的是用于测试大型语言模型在领域语言理解方面的能力,并提出了更适合大型语言模型的评测设计。
- 炼铁炉分类器设计中融入领域知识
本研究提出了一个整合领域知识的分类模型框架,此框架利用黑匣子模型来描述高炉系统,使得可以在工业应用中实现更加准确地分类并识别出 “important samples”,提高高炉系统控制的精度和效果。
- 语义化数据科学的愿景
本文讨论了当前数据科学和机器学习自动化解决方案的重要缺陷,并设想如何利用语义理解和推理与数据科学自动化的新工具相结合,以帮助保持一致且可解释的数据增强和转换。另外,我们还讨论了语义如何在处理与信任、偏见和可解释性相关的挑战方面以一种崭新的方 - KDD使用周边上下文和时间演化增强的行内引文分类
本文提出了一个名为 3Cext 的数据集,通过使用邻近的上下文句子来分析文章之间的对比和暗示关系,提出了基于 Transformer 的神经网络 PeriCite,能更好地融合周边句子和领域知识来进行文章内的引文分类任务,并在 3Cext - 在线偏好中的积极奖励学习
为了实现机器人在不同环境和人类偏好中的适应性,本研究提出了在线稀疏二元偏好查询的方法,通过设计查询和决定何时呈现查询来最大化查询结果的信息价值,从而使得机器人能够快速适应实际应用场景并减轻人类专家的负担,在模拟,人类用户研究和真实机器人实验 - 利用领域知识提高 POMDP 信念估计
使用 Jeffrey 的规则和标准化,将领域专业知识整合到部分可观察马尔科夫决策过程中概率信念更新的新方法,表明领域知识可以减少数据需求,提高使用强化学习的 POMDP 策略学习的性能。
- AAAIGLUECons:一种用于约束条件下学习的通用基准
本文介绍了一项新的基准测试,共包含九个任务涵盖自然语言处理和计算机视觉等领域,该测试旨在系统评估外部知识约束整合方法的效果,通过一组扩展的评估标准分析各种模型的性能,为相关研究挑战提供了框架和指导。
- KAER: 为实体解析而设计的知识增强预训练语言模型
本研究提出了一种名为 KAER 的新框架,该框架使用外部知识增强预训练语言模型的实体解析性能,并在多个数据集上实现了更好的表现,尤其是在 “脏数据” 上表现更加健壮。
- 基于领域约束的弱监督学习可扩展技术
提出了一种使用符号域知识作为约束条件的新型可扩展端到端管道,用于学习神经网络以弱监督方式对未标记数据进行分类。该方法尤其适用于数据由不同组(类)组成且适合于聚类友好型表示学习的设置,并且可以通过同时考虑多个训练示例来重新制定领域约束以采用有 - EMNLP面向知识密集型文本 - 结构化查询语义解析的公式化知识方法
本文使用新的中文基准数据集 KnowSQL,提出了使用公式化知识库作为领域知识支持的重新分组(ReGrouP)框架来解决文本到 SQL 的知识密集问题,并在 KnowSQL 数据集上实现了 28.2%的整体性能提升。