计算形态学的最新进展:综述
通过调查计算形态学在低资源语言中的应用、提出在现有技术的基础上对原始文本进行语言形态学理解的挑战并进行实证研究,展示在设计的两个新模型的辅助下,现有的技术可以在一定程度上完成任务,但仍有很大的提升空间,解决此任务将大幅提高形态学资源的语言覆盖度。
Mar, 2022
本文通过提出一种基于句子层面的形态学,并创建了一个新的、基于句子层面的多语言数据集 MightyMorph,得出基于句子层面的变形、重新变形和分析任务比基于单词水平的任务更具挑战性,同时提供一种方便的界面与语境化语言模型(LMs)相接,评估这些模型中编码的形态学知识和它们用于形态学任务的可用性,为跨语言神经形态的研究打开了新的视野。
Feb, 2022
通过将词汇学特征添加到 LSTM 和 BERT 模型中,我们比较了多种语言中命名实体识别、依赖解析和评论过滤任务的基线和改进模型表现,结果显示,根据所添加的特征的质量和任务的不同,这些特征对于 LSTM 的 NER 和 DP 任务表现提升效果较好,而不太适用于 CF 任务;对于 BERT,只有在高质量特征时才会对 DP 表现有所改善,而且相对于强大的多语言 BERT 模型,语言特异性 BERT 变体的改善程度较小。
Nov, 2020
本研究应用神经序列到序列模型解决 NLP 中复杂词形派生问题,并介绍派生范式完成任务。基于优于非神经基准线 16.4% 的结果,我们的神经模型学会了各种派生模式。但是,由于派生性构词涉及语义、历史和词汇考虑,因此未来需要更多工作来实现和生成机制的性能平衡。
Aug, 2017
本综述分析了语义处理的五个任务:词义消歧、指代消解、命名实体识别、概念提取和主观性检测,并研究了相关的理论研究、先进方法和下游应用。同时,我们还对不同的语义处理技术进行了比较,并总结了它们的技术趋势、应用趋势和未来方向。
Oct, 2023
本文通过实证研究,考察了在六种不同的语言上,使用不同的形态学特征开发上下文词形还原器对下游表现的影响,并发现:(i)为词形还原器提供细粒度的形态学特征在训练时并不那么有益,即使对于词汇连接语言;(ii)实际上,现代上下文词表示似乎隐式地编码了足够的形态信息,以获得无需查看任何明确形态信号的良好上下文词形还原器;(iii)最佳的领域外词形还原器是使用简单的 UPOS 标签或者没有训练形态学的模型;(iv)目前的词形还原评估实践并不足以清晰地区分模型之间的差异。
Feb, 2023
深度学习和自然语言处理在构造语法研究中产生了强大的模型,通过训练填空问题,显示了对丰富的语言信息和结构化知识的访问,本文旨在探索计算方法和构造语法研究之间的协同关系,并提供了深度学习模型的综合概述,以促进这两个领域的研究者之间的合作。
Aug, 2023
提出了一种基于自动内存学习语言(词汇)任务的自然语言处理的性能导向方法,讨论了其对计算词汇学的影响,并描述了该方法在音韵学、形态学和句法中对许多词汇获取和消歧任务的应用。
May, 1994
形态学分析是表型药物发现中的一项有价值的工具。最近的发展使得高通量自动成像得以捕捉单细胞水平上细胞或生物体对干扰的广泛形态学特征。机器学习和深度学习在图像分析方面的显著进展有助于对大规模高内容图像进行高通量分析,从而推动了复合物的作用机制研究、药物重用、对细胞形态动力学的表征以及对新型治疗药物的发展。本综述全面概述最近形态学分析领域的进展,总结形态学分析流程、介绍多种基于特征工程和深度学习的分析策略,并引入公开可获取的基准数据集。我们特别强调深度学习在此流程中的应用,包括细胞分割、图像表征学习和多模态学习。此外,我们还阐述形态学分析在表型药物发现中的应用,并强调了该领域面临的挑战和机遇。
Dec, 2023