该研究提出了一个系统化的框架,旨在更好地服务于使用自然语言处理系统的用户。该框架考虑了语言和文化之间的区别,以及跨文化和多元文化对 NLP 的影响,并调研了现有的和潜在的策略。
Mar, 2022
语言技术在大语言模型的引入下取得了巨大进展,但在社交环境感知方面仍存在挑战,需要将社交意识融入自然语言处理模型以增强应用的自然性和安全性。
May, 2024
自然语言处理(NLP)旨在通过计算机科学领域的技术来分析文本,适用于医疗、商业和教育领域的应用。本文回顾了近期在教育领域解决问题方面的 NLP 的最新进展,介绍相关背景,提出 NLP 在教育领域的分类体系,并基于该体系讨论任务定义、挑战以及相应技术。随后展示了该领域中的一些现有演示,并给出未来方向的结论。
Jan, 2024
该论文调查了自然语言处理中方言的重要性,描述了不同方言数据集和方法,对方言的研究超过了仅仅方言分类的工作,对构建具有公平性的语言技术有重要意义。
通过对 ACL Anthology 中的研究论文进行系统分类和分析,我们提供了自然语言处理领域的研究概况、学科分类,分析了最近的发展,并总结了我们的发现并强调了未来工作的方向。
Jul, 2023
本篇论文总结了近年来自然语言处理 (NLP) 的抗干扰性研究,并就技术、度量标准、嵌入、基准等维度深入探讨了该领域中存在的问题和待解决的方向。
Jan, 2022
NLP 领域正在经历一系列颠覆性的变化,该研究旨在通过深入了解过去来塑造我们的未来。通过对 26 位 NLP 研究人员进行长篇采访,我们研究了影响 NLP 领域的因素,包括文化、激励和基础设施。我们的访谈对象发现该领域存在循环模式,同时也出现了历史上没有先例的新变化,包括基准文化和软件基础设施的变化。通过对 ACL 文集中的引用、作者和语言使用进行定量分析,我们进一步支持了这一讨论。最后,我们讨论了 NLP 领域未来的共同愿景、关切和希望。我们希望这项对过去和现在的研究能够引发对我们社区内隐含规范的明确讨论,并更加有意识地塑造未来。
Oct, 2023
本文介绍了一种从庞大的非结构化语料库中提取高质量文化相关调优数据集的新型流程。通过自我生成流程识别文化概念和触发指令,并与通用指令调优数据集相结合,我们的模型展示出了较强的识别和理解区域文化细微差别的能力,从而增强了其推理能力。我们在新加坡、菲律宾和美国三个地区开展了实验,取得了高达 6% 的性能改进。我们的研究为直接从非结构化数据中提取文化指令调优集开辟了新的途径,并为未来在该领域的创新设立了先例。
本论文通过文献综述提出了一个分类法对 NLP 中的泛化研究进行了表征和理解,并对超过 400 篇论文进行了分类,提出了评估标准以及对未来研究方向的建议,并发布了一个动态可探索的结果页面,以期将最先进的泛化测试成为 NLP 领域的新常态。
Oct, 2022
本文综述了自然语言处理在编程方面的研究,并从推理模型到最新竞争级模型全面调查了现有的相关工作,具有技术类别的完整性,方便查找和比较未来的工作。
Dec, 2022