NNOSE: 最近邻职业技能提取

ACLJan, 2024

NNOSE: Nearest Neighbor Occupational Skill Extraction

Mike Zhang, Rob van der Goot, Min-Yen Kan, Barbara Plank

TL;DR通过使用多个数据集和语言模型检索相似技能，我们提出的 NNOSE 方法能够有效地提取职业技能并在跨数据集设置中提高性能。

Abstract

The labor market is changing rapidly, prompting increased interest in the automatic extraction of occupational skills from text. With the advent of English benchmark job description →

labor market occupational skills datasets skill extraction language models

发现论文，激发创造

越南职位列表中职业技能检测的实用方法

本文提出一种实用的方法来在职位列表中检测技能，该方法将任务视为一个排名问题，通过提取短语并与短语上下文的语义相似性进行排名，并进行技能短语的最终分类，从而在小数据集中比实体识别模型表现更好。

Oct, 2022

远程监督技能提取负采样策略设计

本研究提出了一种基于远程监督的技能提取系统，结合 ESCO 分类法和多种负采样策略提高提取技能的性能，并引入手动注释的基准评估数据集，以促进该任务的进一步研究。

Sep, 2022

作为内置零迁移 ESCO 技能匹配器的大型语言模型

The paper presents an end-to-end zero-shot system for skills extraction from job descriptions based on large language models, achieving promising results on skills extraction against the ESCO framework without human annotations.

Jul, 2023

使用弱监督从职位发布中提取技能

利用弱监督技术中的技能提取，结合欧洲技能、能力、资格和职业分类法，使用潜在表示法在职位广告中发现类似的技能标签，相对于基于令牌级别和语法模式的基准测试，该方法显示出强正信号。

Sep, 2022

通过自然语言处理进行计算机工作市场分析

利用自然语言处理技术从职位描述中提取相关信息，包括解决训练数据的稀缺性、标注指南的缺乏以及从职位广告中提取有效信息的不足等挑战，最终通过引入抽取方法和多个数据集相辅相成的检索增强模型来提高整体性能，并将提取到的信息置于特定分类体系中。

Apr, 2024

利用大型语言模型进行极端多标签技能抽取训练

通过使用大型语言模型，本研究提出了一种成本有效的方法来生成准确、全合成的技能提取的标签数据集，并提出了一种对比学习策略，证明其在任务中的有效性。在三个技能提取基准测试中，我们的结果显示，与仅依赖于远程监督的字面匹配的先前发布结果相比，R-Precision@5 提高了 15 至 25 个百分点。

Jul, 2023

基于深度学习的计算机就业市场分析：对职位发布中技能提取和分类的调查

近年来，自然语言处理（NLP）取得了显著进展，使得计算机行业市场分析领域有了快速发展。本调查旨在提供深度学习方法、数据集和特定于 NLP 驱动的技能提取和分类的术语的全面概述，填补这一新兴领域的不完全评估。我们对公开可用数据集的详细分类解决了关于数据集创建和特征的信息缺乏的问题。最后，对术语的关注解决了目前对重要概念（如硬技能和软技能）和技能提取和分类相关术语缺乏一致定义的问题。

Feb, 2024

在职业市场领域利用大型语言模型重新思考技能提取

通过在 6 个统一化技能提取数据集上使用大语言模型（LLMs）的少样本学习能力，我们研究了上下文学习的使用，以克服手动注释数据的高依赖性对这些方法的泛化能力的限制。我们展示了 LLMs 能够更好地处理在技能提取任务中句法复杂的技能提及，尽管在性能上不及传统监督模型。

Feb, 2024

SkillSpan: 英文职位招聘中的硬技能和软技能提取

介绍了 SKILLSPAN 数据集和相应的注释指南，比较了不同语言模型的性能，结果表明，在职位发布领域进行连续预训练和领域适应处理可以显著提高技能提取的性能。

Apr, 2022

从含噪技能标签中学习职位名称相似度

该论文提出了一种无监督表示学习方法，使用嘈杂的技能标签训练作业职称相似性模型，证明其在文本排名和工作归一化等任务中非常有效。

Jul, 2022