- 口语文本中的实体识别
我们研究了基于 BERT 模型的多种训练策略,旨在从口语化文本中识别出医疗领域的症状,并通过一系列实验发现了与这些训练策略相关的模型行为模式,提出了有效识别口语化文本中实体的训练策略设计原则。
- 语义处理技术综述
本综述分析了语义处理的五个任务:词义消歧、指代消解、命名实体识别、概念提取和主观性检测,并研究了相关的理论研究、先进方法和下游应用。同时,我们还对不同的语义处理技术进行了比较,并总结了它们的技术趋势、应用趋势和未来方向。
- 将字典融入神经网络结构从社交媒体中提取 COVID-19 医疗概念
将字典信息结合神经网络架构用于自然语言处理,从在线医学论坛中提取与 COVID-19 相关的多个概念,并通过监督模型在论坛数据上达到 90% 的宏观 F1 分数,研究表明将小领域字典用于深度学习模型可以改进概念提取任务。
- Parmesan 教育数学概念提取
我们开发了一个原型系统 Parmesan,用于在上下文中搜索和定义数学概念,以帮助不熟悉数学概念的研究人员,该系统依赖于自然语言处理组件,包括概念提取、关系提取、定义提取和实体链接技术,并提供了两个修订后的数学语料库。
- 基于概念的大语言模型深度学习
本文讨论大型语言模型在概念导向深度学习方面的应用,以及利用多模态语言模型进行概念提取、图谱提取和概念学习等方面的研究。同时,本文认为,虽然 LLM 在概念导向深度学习方面的应用颇具价值,但作为人工智能聊天机器人的应用, 它更具有实用价值。
- 工业 4.0 中可扩展的概念抽取
本文研究并应用概念提取技术到工业 4.0 场景中,提出了一种新颖的计算概念重要性的过程,可以在工业中帮助理解卷积神经网络(CNNs)的预测过程,成功地从工业案例中提取出与每个任务相关的概念。
- 从一张图像中提取多个概念
本文提出了一种文本场景分解任务,并介绍了一种基于掩模增强的输入方法和一个新颖的两阶段自定义过程,用于针对生成图像中的特定概念进行微调,并使用多种自动度量标准和用户研究,验证了该方法的有效性。
- ACL基于知识引导提示的因果感知概念提取
本文提出一种基于结构性因果模型 (SCM) 的知识引导提示,以减轻 PLM 提取过程中的概念偏见,并在多语言知识图谱数据集上展示了该提示的有效性。
- ECLAD:使用局部聚合描述符提取概念
通过 CNN 激活图像素聚合的表示,提出了一种新型的自动概念提取和定位方法,并基于图像的像素注释,引入了一种验证过程来减少人工干预,从而超越了现有方法。
- EMNLP多分类环境下上下文同义词自监督检测:表型注释应用案例
本研究提出了一个自我监督的预训练方法,利用浅层匹配的数据进行训练,能够检测出上下文同义词,该方法在稀疏多类设置(超过 15,000 个概念)中应用于从电子病历中提取表观信息,并通过数据增强技术解决类稀疏问题,实现了无监督表观概念注释的新 S - SIGIR科学文献中新兴概念的高精度提取
本文提出了一种基于无监督方法的科学文献概念提取方法,通过挖掘后续论文中引用某篇文章的数量,提高了从计算机科学论文语料库中提取概念的精确度,Precision@1000 为 99%。
- ACL在临床领域进行联合去标识化和概念提取,缩小差距
本研究聚焦于在医疗领域中对自然语言处理的实际应用,通过研究数据的自动匿名化对概念提取的影响,探究得到同时考虑隐私信息保护和概念提取的最新解决方案。结果表明提出的多任务模型 F1 值达到了 96.1% 和 88.9%,取得了当前最先进的技术水 - 利用上下文嵌入增强临床概念抽取
本研究旨在研究新的语言表示方法(如 ELMo,BERT)在医疗概念提取方面的应用,比较这些方法与传统词嵌入方法(word2vec,GloVe,fastText)的性能表现,并探讨将这些表示方法应用于医疗任务的可能性。研究结果表明,基于大型医 - COLING双向 LSTM-CRF 用于临床概念提取
本文提出了一种基于循环神经网络和通用词嵌入初始化的的概念抽取方法,通过 2010 i2b2/VA 参考语料库的实验结果表明,该方法胜过当前所有最新的方法,并且在 2010 i2b2/VA 挑战赛中的最佳战绩中名列前茅。
- COLING用于临床概念提取的双向 LSTM-CRF 模型
本文采用双向 LSTM 和 CRF 解码结合通用词嵌入抽取患者临床记录中的概念,以达到与排名前列的系统相媲美的 2010 年 i2b2 / VA 基准标准语料库实验结果。