提出一种新的张量分解方法: 稀疏分层- 特克 (Sparse H-Tucker),用于解决稀疏和高阶数据张量的问题。该方法的嵌套采样技术解决了传统的层次特克方法中所存在的可扩展性问题,此方法更快,更节省空间,并且能够构建一个可解释的疾病层次结构,并且已在真实的医疗保健数据集上进行了广泛的测试。
Oct, 2016
通过提出SPARTan方法,我们得以解决PARAFAC2运算大规模、稀疏数据时的效率问题。在通过真实病例进行的评估中,我们发现SPARTan在表现上胜过了过去的实现,并以高效的方式获得了对于复杂医学病例下几位小患者的临床意义刻画及其时间进化路径的结果。
Mar, 2017
本文介绍了一种新的方法——SUSTain,将实值矩阵和张量分解扩展至数据的值为整数的情况,该方法可以处理病历数据以提取患者表型,并获得了良好的结果。
Mar, 2018
文章综述了自然语言处理在电子健康记录领域的应用,重点介绍了计算表型学方法,包括基于关键词搜索和基于规则的系统等算法,以及监督式机器学习模型、深度学习和非监督式学习等最近受到关注的算法。同时文章指出在病历中特征关系的处理、模型可解释性和推广性等方面仍有待解决的问题。
Jun, 2018
本文提出了一种计算框架,称为Patient2Vec,以学习可解释的深度纵向电子健康记录数据表达,并将其应用于实际患者信息以预测未来住院情况,该方法展现出明显的预测性能优势。
Oct, 2018
利用基于深度学习的无监督框架从电子健康记录中提取患者表现,为下一代个体化医学提供指导。通过将病人轨迹转换为低维潜在向量来对1,608,741例患者的电子病历进行了综合分析,发现ConvAE可以生成导致临床有意义的见解的患者表示形式。
Mar, 2020
本文研究了对于电子健康记录中的时间序列医疗数据进行聚类的方法,发展了基于深度学习的方法,利用新的损失函数,以相似的未来结果进行聚类,超过现有的基准测试,提出了可制定具体行动的信息用于临床决策。
Jun, 2020
本研究提出一种LAbel-efficienT incidenT phEnotyping (LATTE)算法,旨在通过使用病程数据中的先前训练的语义嵌入向量作为先验知识,并使用反向传播和半监督联合学习,从而准确注释临床事件的时间,从而提高电子健康记录(EHR)数据支持真实世界证据(RWE)研究的可靠性。通过在三个分析中进行评估,在所有设置中,LATTE相对于基准方法(如SAMGEP和RETAIN)均获得了实质性的改进。
May, 2023
通过研究对医院入院的最初几个小时进行聚类分析,提取生命体征数据,确定患者表型与病理生理特征及结果,以支持早期临床决策,对分析重现性和与生物标志物的相关性使用了一个规模较大的数据集。
Jul, 2023
该论文介绍了一种名为SWoTTeD的方法,它是一种用于发现隐藏的时间模式的新方法,该方法通过集成多个限制和正则化来提高提取的时间表型的解释性。
Oct, 2023