基于神经语言模型的可共享合成临床记录自动生成技术的研究
通过对真实临床记录进行去识别并生成合成临床记录,我们发现合成数据表现出与真实数据相似的隐私问题,从而引发了合成临床记录是否可以成为敏感真实记录更好替代品的进一步研究的问题。
Jan, 2024
通过合成数据生成技术来提升临床文档编制的方法,生成高质量的合成文本以准确和高效地改善现有的文档工作流程,进而改善病患护理、减少行政负担和提高医疗系统效率。
Jun, 2024
该研究旨在找到评估临床笔记网络风险的有效方法。通过使用不同的分类器开发几个模型,发现 SVM 分类器使用 Word2Vec 特征的最大 F1 分数为 0.792,可用于识别可能包含敏感信息的区域,并用于提高临床笔记完全去识别的识别。
Mar, 2022
构建一个自动化系统以去识别超过十亿条临床笔记,通过使用混合的基于上下文的模型体系结构,在可靠且链接的匿名文档方面提供实用的解决方案。
Dec, 2023
本研究的目标是解决临床报告去识别化的问题,以允许访问数据以进行研究,同时确保患者隐私。作者通过使用深度学习模型和手动规则,对临床文件进行伪匿名化,取得了 0.99 的 F1 评分,并分享了相关代码和指南。
Mar, 2023
自动化临床文本匿名化有潜力在保护患者隐私和安全的同时促进医疗数据的广泛共享,本论文提出了基于大型语言模型的新评估指标,并通过与基准技术的比较研究证明了大型语言模型在临床文本匿名化领域的可靠性,为可信的临床文本匿名化铺平了道路。
May, 2024
本文基于深度上下文词嵌入和变分的 Bi-LSTM 模型,使用最新的自然语言处理技术,实现从临床记录中去除个人身份信息的任务,以两个黄金标准数据集为基础,并证明该架构在性能上达到了最先进的水平,同时在没有使用字典或其他知识源的情况下, 收敛速度更快。
Oct, 2018
该研究基于人工神经网络模型,提出了一种无需人为特征设计和规则的自动化病历去识别系统,其在两个数据集上的表现优于现有系统,支持使用 ANNs 进行病例记录的去识别。
Jun, 2016