- 它们是否指的是 ' 我们 '? 解释不同群体偏见中的指代表达
通过在英语体育评论中对隶属群体内外言论(群体偏见)的模型,本文揭示了在社会现象如刻板印象延续和隐性偏见中可能存在的微妙差异。为了大规模分析群体间变化,我们使用 LLMs 进行自动标记,并发现一些 LLMs 最佳工作方式是在评论时使用语言描述 - EMNLP用 LEMMING 实现联合词形还原和词形标注
LEMMING 是一个模块化的对数线性模型,它同时建模了词形还原和标注,并支持任意全局特征的整合。它可通过带有金标准标签和词元注释的语料库进行训练,无需依赖形态学词典或解析器。LEMMING 在六种语言的基于令牌的统计词形还原中创造了新的最 - 透过标注实现解析
该研究探讨了如何将基于上下文的分析方法转化为标注流程,并通过实验证明:推导树的线性转化和其与输入序列的对齐是实现精确标注标记的最重要因素。
- WSDM关系三元组抽取的简单而有效的双向框架
本文提出了一种基于双向抽取框架的标记关系三元组抽取方法,该方法在联合提取主体和关系的同时从两个方向抽取实体对,并通过共享编码器组件实现特征互补和提升,使用双仿射模型为每个实体对分配所有可能的关系,在多个基准数据集上验证其性能和有效性,此外, - SIGIR面向信息检索的项目标记:基于三分图神经网络的方法
通过构建一个查询 - 项目 - 标签三元组图和优化完整标签预测和部分标签完成两种情况的标签预测问题,我们提出了一种基于异构图神经网络的 Item Tagging 模型,证明在信息检索方面,该模型的性能优于现有的多标签分类方法。
- ACL从依赖解析树中提取无头 MWEs: 解析、标注和联合建模方法
对于平面结构的多词表达式(flat-structure MWEs),识别标记比解析更准确。使用提出的联合解码算法,结合解析和标记策略,可以获得更高的准确性,其提高来自解析器和标记器之间的特征共享。
- ICML音乐分类与标记中的零样本学习和知识迁移
本研究探讨零样本学习在音乐分类和标记任务中的应用,提出了将音频和标记空间映射到单一语义空间并进行知识传递的方法,以验证其在不同音乐语料库中的泛化能力。
- EMNLP基于注意力神经树解码的结构化多标签生物医学文本标记
本文提出了一种基于序列到序列学习的模型,用于将非结构化文本与本体树中的任意数量术语进行标记,并在自动分配 MeSH 术语给生物医学摘要的重要任务上,优于现有方法。
- 一种改进的基于短语的学生课程反馈注释和摘要方法
本研究旨在探索一种新的方法从大量的学生反馈中提取摘要短语,通过基于短语的注释和突出显示方案,将其汇总成一组要点,以及用一种新的度量标准衡量这些短语是否满足学生的最迫切需求。
- 堆栈传播:用于语法的改进表示学习
使用 POS 标签作为学习表示的正则化器,提出了一种称为 “stack-propagation” 的学习模型,该模型可以应用于依赖分析和标注,其测试结果比最先进的基于图形的方法更加准确。
- 网络视频标签细化和定位的数据驱动方法
本文介绍了一种自动视频标注的方法,该方法可以增加用户提供的标签数量,并将其临时本地化,将标签与关键帧关联起来。我们的方法利用用户生成的标签和 web 来源中的集体知识,以及上传到社交网站和 web 来源的关键帧和图片的视觉相似性。与需要为每 - 随机超图及其应用
论文研究了社交网络中新兴的复杂图结构,以及 folksonomy 这种用户、资源和标签三重结构,提出了一个数学模型,用于计算其结构特征,研究发现多标签应用会导致该模型与实际网络存在一定的偏差。