NLPExplorer:探索自然语言处理论文的宇宙
TweeNLP 是一个集合 Twitter 自然语言处理(NLP)数据的平台,提供可视化和探索功能,旨在为 NLP 社区提供一个集体记忆单元,支持多项功能,包括 TweetExplorer,可按主题探索推文,为会议和研讨会提交截止日期建立时间线,并将 NLPExplorer 科学文献搜索引擎与研究论文相关的推文整合在一起。
Jun, 2021
科学文献搜索是一种探索性方法,现有的科学文献搜索系统通常限于基于关键词的查询搜索,我们提出 NLP-KG 系统,支持在不熟悉的自然语言处理 (NLP) 领域探索研究文献,并提供语义搜索、调研论文检索、研究领域层次图和聊天接口等功能,以帮助用户全面地探索和理解不同领域之间的关系、NLP 中的陌生概念以及找到相关的研究文献。
Jun, 2024
通过对 ACL Anthology 中的研究论文进行系统分类和分析,我们提供了自然语言处理领域的研究概况、学科分类,分析了最近的发展,并总结了我们的发现并强调了未来工作的方向。
Jul, 2023
NLPeer 是第一个伦理资源资料来源跨领域的超过 5k 篇论文和 11k 篇来自五个不同论文场馆的审稿报告,它建立了统一的数据表示,并且增加了富元数据和版本信息,这项工作为 NLP 及其他领域的同行评议的系统性、多方面、以证据为基础的研究铺平了道路。我们将 NLPeer 公开提供。
Nov, 2022
应用自然语言处理方法,利用三种无监督模型 (Latent Dirichlet Allocation、Word2Vec 和 Transformer) 分析大规模特定主题科学文章的能源相关内容并实现文本的信息提取和知识发现,同时展示了能源材料研究中潜在的主题和概念,并开发了文档分类方法以加速能源研究和材料开发工作。
Feb, 2024
本研究提出了一种针对未知类别的科学文献的文本分类的新方法,使用自然语言处理技术。该研究利用预训练的语言模型(特别是 SciBERT)从 ArXiv 数据集的摘要中提取有意义的表示。文本分类使用 K-Means 算法进行,并根据 Silhouette 得分确定最佳聚类数。结果表明,所提出的方法比传统的 arXiv 标签系统更有效地捕捉主题信息,从而改善了文本分类。该方法为科学研究文献快速增长的领域提供了更好的导航和推荐系统的潜力。
Sep, 2023
自从采用 Transformer 架构以来,自然语言处理(NLP)已经显著发展。Transformers 催生了预训练大型语言模型(PLMs)。在多个任务中,NLP 系统的性能有了巨大提升,有些情况下甚至超过了人类。然而,事实仍然是,在预训练时,更好质量的数据集能够让 PLMs 在各个任务中取得更好的性能。为了满足特定需求,NLP 研究者继续创建新的数据集,而本研究旨在揭示这些数据集中所挖掘的趋势和见解,并向未来有意策划数据集的研究者提供有价值的建议。
Mar, 2024
自然语言处理(NLP)旨在通过计算机科学领域的技术来分析文本,适用于医疗、商业和教育领域的应用。本文回顾了近期在教育领域解决问题方面的 NLP 的最新进展,介绍相关背景,提出 NLP 在教育领域的分类体系,并基于该体系讨论任务定义、挑战以及相应技术。随后展示了该领域中的一些现有演示,并给出未来方向的结论。
Jan, 2024
LexNLP 是一个面向法律和监管文本的自然语言处理和机器学习的开源 Python 包,提供文档分析、信息识别、实体提取、特征转换、无监督 / 监督模型构建等多个功能,其中包含 18 种结构化信息提取以及预训练模型,并可适用于学术研究和工业应用。
Jun, 2018