COLINGMar, 2024

从嘈杂音频转录中提取生物医学实体

TL;DR自动语音识别(ASR)技术是将口语转录为文本的基本技术,广泛应用于临床领域,包括简化医学转录和与电子健康记录(EHR)系统集成。然而,ASR-NLP 领域仍存在挑战,尤其是当转录中含有噪音时,导致自然语言处理(NLP)模型的性能显著下降。本论文介绍了一个新颖的数据集,BioASR-NER,旨在填补生物医学领域 ASR-NLP 差距,重点提取不良药物反应和 Brief Test of Adult Cognition by Telephone(BTACT)考试中实体的提及。我们的数据集提供了近 2000 个干净和有噪音的录音。针对噪音挑战,我们提出了一种使用 GPT4 的创新的文本清理方法,并研究了零样本和少样本方法。我们的研究进一步进行了错误分析,揭示了转录软件中的错误类型、GPT4 的纠正和 GPT4 面临的挑战。本论文旨在促进对 ASR-NLP 差距的更好理解和潜在解决方案,最终支持改进的医疗文档化实践。