- 通过世界动态建模提升智能体学习能力
通过自动化动态学习框架 DiVE 指导的大型语言模型在 Crafter 环境中能够做出决策,实现与人类玩家相当的奖励。
- 从文本到洞察:用于材料科学数据提取的大型语言模型
基于大型语言模型,本文综述了材料科学中的结构化数据提取方法,并提出了未来的研究方向,为利用语言模型进行数据驱动的材料研究提供了基础资源。
- 资产定价中的归因方法:是否考虑了风险?
通过分析资产定价领域的领域知识,我们研究了多个与资产定价有关的公理。我们证明了 Shapley 值和综合梯度在保留大多数公理时,都不能满足全部公理。通过大量的分析和实证例子,我们展示了如何使用归因方法来反映风险,并指出在何种情况下不应使用归 - DogeRM: 通过模型合并为奖励模型提供领域知识
通过模型合并将领域知识整合到通用奖励模型中,提高了对齐大型语言模型的性能。
- 结构约束图的生成建模
通过引入特定的边吸收噪声模型和新的投影算子,ConStruct 是一种允许硬约束图扩散模型以包含特定属性(如平面性或非循环性)的新框架。它在合成基准和属性现实数据集中展示了多功能性和最先进的性能,例如在数字病理学图数据集中,利用平面性的提出 - 利用领域知识探索 UMAP 投影的镜头函数
基于 Mapper 和 STAD 的灵感,本文针对 UMAP 提出了三种类型的镜头函数,用于领域知识引导的交互式探索,以实现将高维数据投影到二维空间并显示隐藏模式的目的。通过使用镜头函数,分析人员可以根据问题调整投影,揭示不可见的模式,并通 - 概率电路的人类联合学习的统一框架
基于概率电路,借助领域知识进行参数学习的新型统一框架,能够有效高效地优化数据驱动学习方法,并在多个基准和真实数据集上取得优异性能。
- 为预测用户设计预测软件:赋权非专业人员创建和理解自己的预测
我们研究了预测软件的设计,以赋予非专业用户使用最先进的预测方法,嵌入其领域知识,并建立对生成的预测的理解和信任,为非专业用户提供了三个主要考虑因素:(1)安全的逐步方法,促进因果关系的理解和信任;(2)支持人类推理友好组件的白盒模型;(3) - 基于注意力驱动的多智能体强化学习:增强专家指导的决策
利用领域知识和基于注意力机制的政策机制,该论文介绍了一种增强多智能体强化学习(MARL)的替代方法。该方法通过将领域专业知识纳入学习过程,简化了协同行为的开发,从而减少了与 MARL 通常相关的复杂性和学习开销,使代理能够集中于复杂任务的关 - ACL探寻咨询对话:领域知识与大型语言模型
提出了一个系统的方法,用于检验领域知识和大型语言模型在代表危机辅导员与求助者之间的对话时的表现,结果表明领域知识和语言模型生成的特征能够更好地描述咨询对话。
- 具备领域知识先验的贝叶斯神经网络
通过变分推理,提出了一种将通用形式的领域知识(通过损失函数表示)整合到贝叶斯神经网络先验中的框架,使得后验推断和抽样具有高效性,以提升预测性能。
- AAAI本体增强的索赔检测
我们提出了一个基于本体增强模型的句子级主张检测方法,通过将来自知识库的本体嵌入与 BERT 句子嵌入相融合,对 ClaimBuster 和 NewsClaims 数据集进行主张检测。我们的本体增强方法在这些小型非均衡数据集上展示出了最佳结果 - 领域知识和多模态对智能分子性质预测的影响:一项系统调查
综合审视和数量分析基于各种基准的最新深度学习方法,我们发现融合分子信息不仅能提高分子属性预测回归和分类任务的准确性,还能通过同时利用 1 维和 2 维信息的 3 维信息大幅增强分子属性预测进展,在药物研发中具有重要指导意义。
- AFS-BM:通过二进制掩码实现自适应特征选择提升模型性能
我们研究了机器学习中一个非常关键的问题,即特征选择,针对该问题存在的挑战,我们提出了一种叫做 “自适应特征选择与二进制掩蔽” 的方法,该方法通过联合优化实现了同时进行特征选择和模型训练,并能够在训练过程中动态地适应特征的重要性变化,从而显著 - ConSequence: 为电子健康档案生成合乎逻辑约束的序列进行综合
通过运用领域知识和约束条件,ConSequence 模型能够高效地生成电子病历,满足完整的时间和空间约束条件,同时不影响运行性能和生成质量。
- 基于知识的自动机器学习架构
该论文提出了一种以知识驱动的自动机器学习架构,用于管道和深度特征的合成,旨在使自动机器学习过程可解释,并在管道和特征的合成中利用领域知识。该架构探索了几个创新理念:首先,以统一的方式构建管道和深度特征;其次,通过一个共享的知识系统进行合成, - 贝叶斯搜索中的领域知识注入
这篇论文提出了 DKIBO,即一种贝叶斯优化算法,用于调整搜索空间中的探索,它能够融合领域知识。通过利用一个额外的确定性代理模型,我们提出了一种简单的方法来融入获取函数中的结构化知识,以丰富高斯过程的近似能力,以此纠正采样的不足,并在材料设 - rTisane: 将数据分析的概念模型外部化,提高与领域知识的互动,并改进统计模型质量
统计模型应准确反映分析师关于变量及其关系的领域知识,本文通过一个实证研究和控制性评估,提出了 rTisane,一个用于表达概念模型的领域专用语言(DSL),帮助分析师更深入地参与和准确地表达他们的假设,从而获得符合分析意图并更好适应数据的统 - EMNLP对法律判决预测的大型语言模型的全面评估
研究了大型语言模型在法律领域的应用,通过设计基于大型语言模型的实用基准解决方案,并在法律判决预测任务上测试,发现类似案例和多项选择选项对大型语言模型的领域知识回忆至关重要,同时也揭示了信息检索系统在某些情况下超过了大型语言模型与信息检索系统 - AAAIDKEC: 领域知识增强的电子健康记录多标签分类
通过融合领域知识与文本特征,DKEC 算法以标签关注机制为基础,在医学诊断预测领域取得卓越表现,尤其对于少样本类别具有显著优势,并有助于小型语言模型取得与大型语言模型相当的性能。