Feb, 2018

将复杂性嵌入数据表示而非模型:异质医学数据案例研究

TL;DR本文提出使用语义嵌入方法,将原始、杂乱的临床数据直接与下游学习架构耦合,以实现最小化预处理。我们从捕捉和编码数据表示中的复杂数据依赖性的角度考虑这一步骤,而不是在模型中实现,该方法允许使用快速,轻量级和简单的模型进行下游处理,对于没有机器学习专业知识的研究人员非常有用。我们通过三个典型的临床预测任务证明了高度压缩的嵌入数据表示捕获了大量有用的复杂性,尽管在某些情况下,压缩并非完全无损。