- VICatMix:离散生物医学数据的变分贝叶斯聚类与变量选择
在精准医学中,生物医学数据的有效聚类是至关重要的,它可以实现对患者或样本的准确分层。我们提出了 VICatMix,一种用于聚类分类数据的变分贝叶斯有限混合模型,其在训练中使用了变分推断(VI),从而在保持高准确性的同时优于竞争对手的效率。V - 深度学习在生物医学图像分类中使用自动标签与手动标签同样有效
研究探讨在何种情况下可以采用自动标签来训练深度学习模型进行癌症组织切片图像分类,结果发现具有 10% 噪声标签的自动标签可以获得竞争性模型,而应用 Semantic Knowledge Extractor Tool (SKET) 算法生成的 - 孟加拉语生物医学数据的自动语音识别
该研究提出了一个专门针对孟加拉生物医学数据开发的自动语音识别(ASR)原型系统。该系统针对孟加拉语和西利特语两种重要方言,培训和评估了两个流行的 ASR 框架,旨在为数字健康应用创建可部署的健康领域 ASR 系统,从而提高非技术用户在医疗保 - L-SFAN:面向疼痛行为检测的轻量级空间关注网络
通过引入 L-SFAN,一种轻量级的卷积神经网络架构,结合 2D 滤波器设计来精确捕捉来自动作捕捉和表面肌电图传感器的数据的时空相互作用,我们提出了一种改进型模型,通过定向全局池化层和多头自注意机制来优先考虑关键特征以更好地理解慢性下腰痛, - 利用类别和特征质心增强降维散点图
通过使用由降维得到的 x 和 y 坐标来计算类别质心和特征质心并将其叠加在散点图上,本研究解决了将 x 和 y 轴的含义解释复杂性的问题,展示了这种方法在三种神经遗传疾病表型数据中的应用及类别质心和特征质心的添加如何增加散点图的可解释性。
- 大语言模型时代的生物医学人工智能
AI 在生物医学领域的应用包括使用大型语言模型来处理生物医学数据,如文本数据、生物序列和脑信号,并面临着可信性、个性化和多模态数据表示等挑战。
- 差分隐私合成数据是否导致合成发现?
通过评估 Mann-Whitney U 检验在差分隐私合成生物医学数据上的 I 型和 II 型错误,本研究旨在确定在隐私保护合成数据上进行的统计假设检验是否可能导致测试的有效性丧失或功效降低。
- 利用种群层上下文来利用群组内变异性进行病理检测
通过引入人口层面的上下文并运用图论方法,将其整合到自动编码器的潜在编码中,本研究提出了一种称为 PopuSense 的改进模块,以捕捉生物医学数据中卷积模型可能忽略或平滑的额外组内变异。在对比度和纹理为基础的图像上进行的实验表明,PopuS - 用疾病轨迹图表示基于结果驱动的高阶依赖关系
通过将机器学习技术应用于生物医学数据,我们提出了一种方法,能够在图中准确编码给定结果的风险因素组合,并且相较于其他方法,这种网络编码了关于 2 型糖尿病向多种结果的进展更多的信息。
- STREAMLINE:一个面向生物医学的自动机器学习流水线,应用于检验基于摄影特征对 OSA 预测在国际睡眠中心的实用性
使用 STREAMLINE 方法,这项研究探索了基于摄影的表型特征在预测阻塞性睡眠呼吸暂停(OSA)中的应用价值,结果发现摄影特征在预测中重度 / 严重 OSA 方面提供了额外的价值,但没有超越传统人口统计学、并发症和症状特征在预测 OSA - 混合专家隐式神经压缩模型
用深度神经网络中参数对数据进行压缩的隐式神经表示(INR)是一种有前景的数据压缩技术,提出了一种基于专家组混合理论的新型隐式神经压缩方法 MoEC,通过自动分配 INR 给场景中的 3D 点,可以自适应地找到最佳分区并在海量多样的生物医学数 - 时间尺度网络:用于时间序列数据的浅层神经网络
通过结合传统的离散小波变换的转换和扩张序列,利用卷积神经网络和反向传播方法,我们提出了一种最小化、计算效率高的时间尺度网络,它可以同时学习多个时间尺度的特征,用于序列分类,并且具有显著减少参数和操作的优势。在心房功能障碍检测和癫痫预测方面表 - 用于生物医学远程监督关系抽取的句子包图形建模
我们介绍了一种新颖的基于图的框架,用于缓解远程监督关系抽取中的关键挑战,并展示了其在生物医学数据领域的效果。特别地,我们提出了一种针对实体对引用的句子包的图视图,它可以通过信息传递的方式聚合与实体对相关的句子包中的信息。所提出的框架缓解了远 - 从大型语言模型到知识图谱:癌症生物标志物发现
开发了一个基于领域知识图谱和语义推理的癌症特定生物标志物发现和交互式问答系统,使用生物医学数据、领域本体论、信息提取方法以及大型语言模型进行知识图谱的构建和更新。
- 应用转移欧几里德对人类和小鼠创伤性脑损伤脑电图中的种内和种间协变量漂移进行降低
本文介绍了一种转移学习技术,Transfer Euclidean Alignment,用于解决在临床应用中部署机器学习模型时由于主体间的高度变异性而面临的挑战。通过在各种基于规则的经典机器学习模型以及基于 EEGNet 的深度学习模型上进行 - 基于可靠性的在多模式生物医学数据挖掘中的归纳拟合预测的噪声训练标签清理
我们提出了一种基于可靠性的训练数据清洗方法,利用归纳性依从预测 (ICP) 计算的可靠性度量来纠正大量嘈杂的训练数据中的标签错误和异常值,验证了该方法在三个分类任务中的有效性,显示出显著的分类性能提升,无需过多精心策划的训练数据。
- 基于压缩机的房颤检测分类
用压缩器为基础的文本分类方法应用于房颤检测的任务,通过应用正规化压缩距离于 RR 间期序列和 k - 最近邻分类器的配置,以及最优窗口长度,我们取得较好的分类结果,该方法在生物医学数据和连续的随机序列中具有应用潜力。
- 机器学习在疾病诊断中的最新进展:几十年的系统调查、比较和挑战
计算机辅助诊断是一个快速发展的医学成像研究领域。本文综述了在计算机辅助诊断中应用机器学习和模式识别的算法,以检测包括肝炎、糖尿病、肝病、登革热和心脏疾病在内的多种疾病,以提高疾病检测的精确性和支持决策过程的客观性。
- CamemBERT-bio: 一款对健康更为有益的美味法语语言模型
通过对一部分医学文献的预处理和机器学习,研究团队提出了一种针对法语生物医学领域的语言模型 CamemBERT-Bio,并且该模型在实体识别任务上的 f1 分数相较之前有了 2.54 的提升。
- 生物医学领域的知识图谱嵌入:它们有用吗?探究链接预测、规则学习和下游多药治疗任务
本研究旨在探讨基于知识图谱的嵌入算法在生物医学领域的应用和性能,发现在 BioKG 等生物医学知识图谱上运用知识图谱嵌入模型可以提高准确性,并有望在实际的病理学研究和药物配伍等方面得到应用。