- 使用卷积神经网络实现基于域泛化的 12 导联心电图分类
本研究阐明不同医院数据库之间存在的领域泛化问题,并提出一种在深度神经网络架构中利用提取的信息和捕捉信号基础结构的方法,用于对 12 导联心电图进行异常分类。我们采用 ResNet-18 作为骨干模型,并从网络的多个中间卷积层中提取特征。通过 - DICE: 用生成模型实现高效数据临床事件抽取
通过引入 DICE,一种强大而高效的、面向临床文本的、用于事件抽取的生成模型,结合领域专家提供的描述来提高在低资源情况下的性能,该模型通过学习辅助提及标识任务来定位和绑定生物医学提及,并将其作为触发器和参数候选人引入相应的任务中,结果表明 - OntoMerger:一个本体集成库,用于消除重复并连接知识图谱节点
OntoMerger 是一个 Python 本体论集成库,其功能是从异构数据集构建的知识图谱中消除重复节点,可以应用于各种本体论和知识图谱,本文在实验生物医学知识图谱上介绍了其功能。
- 为等同性和包含关系本体匹配提供友好的生物医学数据集的机器学习
为解决 Ontology Matching 中评价体系不全的问题,该研究提出了五个新的医学本体匹配任务,并且提出了一个全面的评价框架,对机器学习和非机器学习的匹配系统进行了评估。该研究的资源已经公开发布在 OAEI 2022 的 BioML - 本体重用:本体设计的真正考验
通过自然语言处理和网络分析等方法,对 30 个生物医学本体和计算机科学本体的质量进行研究和改进。该研究提出了多种潜在问题的检测方法,重点关注本体间交叉引用的问题,并探讨了本体的多样化重复使用对于本体质量的改进至关重要的观点。
- 装饰范例:一种简单的生物医学关系抽取提示设计方法
本文探讨在生物医学领域中的关系抽取问题,研究使用集成学习的方式能否提高在 ChemProt 数据集上的预测结果,结果展示了基于掩码的抽取方法有潜力在该特定领域关系抽取任务中取得优异的性能。
- AAAI生物句间关系抽取的神经结构
本文介绍了一种基于深度学习的跨句子关系抽取模型,以生物医学领域中的生化事件为例,探讨如何自动给生化事件赋予其所处的生物体系背景,并提出了两种不同的神经网络模型分类器,结果表明,该模型精度比传统机器学习模型更高,特别是在跨句子关系抽取方面的难 - 知识图谱嵌入在药物发现中的性能理解
该研究探讨了五个知识图谱嵌入模型在两个以药物发现为导向的公共知识图谱上的预测表现,并发现模型性能受训练设置、超参数选择、模型参数初始化种子以及数据集的不同分割等因素的显著影响。作者强调,为确保未来工作的完全可重现性和公正比较,应将这些因素与 - ACLQA-GNN: 用语言模型和知识图谱进行问答推理
该研究提出了一种新模型 QA-GNN,通过关联系统知识图和语言模型,实现对问题与答案之间的共同推理,并取得了在常识和生物医学领域 QA 测试中优于现有模型的表现。
- 你的生物医学命名实体识别模型如何推广到新实体?
本文系统地分析了生物识别模型的三种识别能力:记忆,同义词泛化和概念泛化,并发现现有模型在识别同义词和新的生物概念方面存在局限性,这表明他们的泛化能力被高估了。作者调查了模型的失败案例,并确定了识别未见过的生物词汇的几个困难。最后,作者采用基 - 基于注意力机制的 Transformer 用于微结构细胞实例分割
本文介绍了一种基于注意力机制的细胞检测变换器 (Cell-DETR), 该方法可直接进行端到端实例分割,具有快速准确的实现分割性能,并可提高后验数据处理的实验信息输出,实现在线监测实验和封闭回路最优实验设计等功能。
- ICML化学专利自然语言处理的词嵌入
本研究显示,与生物医学相关的字嵌入还不如化学专利字嵌入表现良好。同时,使用上下文嵌入产生合理性能的预测模型,用于这个领域的相对较小的标准示例。
- BioALBERT: 一种简单而有效的预训练语言模型,用于生物医学命名实体识别
提出一种在大规模生物医学语料库上训练的具有生物医学上下文依赖命名实体识别能力的领域特定语言模型 —— 生物医学 ALBERT,并在 8 个不同的医学 NER 基准数据集上展现出极高的性能表现,该模型可供未来研究使用。
- Stanza Python NLP 库中生物医学和临床英语模型包
本文介绍了 Stanza Python NLP 库的生物医学和临床英语模型包,这些模型包通过将 Stanza 的完全神经架构与各种开放数据集以及大规模无监督的生物医学和临床文本数据相结合,为生物医学和临床文本提供了准确的句法分析和命名实体识 - ACL生物医学知识图谱嵌入的基准与最佳实践
利用知识图谱嵌入学习方法,探索在 SNOMED-CT 知识图谱中学习生物医学知识表征的能力,提供性能测试及最佳实践,并强调利用知识图谱多关系特性学习知识表征的重要性。
- BERT 在生物医学文本挖掘中的多任务学习的实证研究
研究了一种多任务学习模型,应用于生物医学和临床自然语言处理任务中,结果表明该模型相比于目前的 transformer 模型,在生物医学和临床领域的表现分别提高了 2.0% 和 1.3%,并进一步展示了任务间的相互关系。
- EMNLP利用知识图谱将领域知识融入医疗自然语言推理
本文研究如何将医学语言模型(BioELMo)的结构与医学任务中可用的知识图谱(UMLS)进行融合,通过实验验证结论表明融合策略不仅仅是可以改善 MedNLI 数据集上的 BioELMo 模型的基线表现,而且在医疗领域的任务中也导致了最前沿的 - 基于 BERT 的生物医学实体标准化排名
本研究中,我们提出了一种实体归一化架构,通过微调预训练的 BERT/BioBERT/ClinicalBERT 模型,并使用三种不同类型的数据集进行了广泛的实验,评估了预训练模型用于生物医学实体归一化的有效性。我们的实验结果表明,最佳微调模型 - 深度情境化的生物医学缩写扩展
本文介绍了一种名为 DEep Contextualized Biomedical Abbreviation Expansion(DECBAE)模型,该模型通过普通医学期刊摘要,利用简单启发式方法自动收集 950 个模棱两可的缩略语的上下文, - 生物医学图像字幕化调查
本文首次回顾讨论了医学图像字幕生成中的数据集、评估措施和现有技术,并提出了两种基准测试方法,其中强方法在一个数据集上的表现超出了所有现有技术系统。