细粒度观点挖掘与公共卫生的弱监督注意力网络

Sep, 2019

细粒度观点挖掘与公共卫生的弱监督注意力网络

Weakly Supervised Attention Networks for Fine-Grained Opinion Mining and Public Health

Giannis Karamanolakis, Daniel Hsu, Luis Gravano

TL;DR采用弱监督的多示例学习方法，在细粒度的情感分类任务中使用新的Sigmoid注意力机制聚合函数，提高了分类性能，并在公共卫生应用中具有重要意义，可识别食源性疾病情况并提高识别率

Abstract

In many review classification applications, a fine-grained analysis of the reviews is desirable, because different segments (e.g., sentences) of a review may focus on different aspects of the entity in question. However, training supervised models for →

发现论文，激发创造

利用大量弱监督数据进行多语言情感分类

本文提出了一种新的多语言情感分类方法，使用了大量的弱监督数据训练多层卷积网络，通过在多种语言数据集上进行充分的评估，证明该方法的优异性能，达到了同类研究的最高水平。

Mar, 2017

细粒度Twitter情感分析的多任务学习

该研究提出了一种基于递归神经网络的多任务学习方法，能够有效地处理与情感分析相关的多个分类任务，并在优化细粒度情感分类问题中实现了领先的结果。

Jul, 2017

多示例学习网络用于细粒度情感分析

本文从多实例学习的角度考虑了细粒度情感分析的任务。我们的神经模型通过文档情绪标签进行训练，学习预测文本片段的情感，如句子或基本话语单元(EDUs)，不需要对片段级别进行监督学习。我们引入了基于注意力机制的极性评分方法，用于确定正面和负面的文本片段，并提出了一个新的数据集，称为SPOT（作为片段级别极性注释的简称），用于评估MIL样式的情感模型，结果表明，比多个基准线有了更好的性能表现，而一个评估研究表明，EDU级别的意见提取产生的摘要比基于句子的替代方案更为信息丰富。

Nov, 2017

基于注意力机制的深度多示例学习

本文提出了一种基于神经网络的置换不变聚合运算符，并展示了其在多个MIL数据集上的实验表现，特别是在两个真实组织病理学数据集上的表现，同时保持了可解释性。

Feb, 2018

收集意见: 方面提取会见情感预测，并且它们均受弱监督

文中介绍了一种从在线产品评论中进行意见摘要的神经框架，该方法是知识瘦身的，只需要轻量级的监督，包括产品领域标签和用户提供的评分。方法结合了两个弱监督组件（一个偏向提取器和一个基于多实例学习的情感预测器），从多个评论中识别显著观点并形成提取式摘要。研究介绍了包括六个不同领域的产品评论的训练集以及具有黄金标准方面注释、显著标签和意见摘要的人工注释开发和测试集的意见摘要数据集。自动评估显示该方法相对于基线的显著改进，大规模研究表明根据多个标准，人类评判员更喜欢该方法的意见摘要。

Aug, 2018

利用少量关键词通过弱监督联合训练进行细粒度方面检测

本篇论文的主要研究是关于使用弱监督训练出纯文本的粒度级别用于用户生成的评论的细粒度方面分类器，并提出了基于学生-教师模型和迭代协同训练的方法来改进模型表现，对商品评论和餐厅评论的六个数据集，该方法模型的绝对f1值平均提升了14.1个百分点。

Sep, 2019

方面-类别情感分析的多实例多标签学习网络

提出一种面向方面类别情感分析的多示例多标记学习网络（AC-MIMLLN），将句子视为袋子，单词视为实例，并将表示方面类别的单词作为关键实例。在三个公共数据集上的实验结果证明了AC-MIMLLN的有效性。

Oct, 2020

仅使用英文注释检测多语言的食源性疾病投诉

本研究提出了一种跨语言学习方法，通过机器翻译构建人工训练文档，训练出多语言分类器，从而实现在多语言文档中进行食源性疾病的早期探测，具有很好的应用前景。

Oct, 2020

基于注意力机制的多实例学习的食物图像分类和分割

提出了一种无需像素级注释进行食物图像分类和语义分割模型训练的弱监督方法，该方法基于多实例学习和基于注意力机制的方法，实现了食物类别的分类和语义分割，并在FoodSeg103数据集上进行了实验验证和探索了注意力机制的性能特性。

Aug, 2023

CICLe：大规模多类食品风险分类的一致上下文学习

污染或掺假食品对人类健康构成重大风险，我们提供了一个包含7,546个短文本的数据集，描述公共食品召回通知，通过机器学习和自然语言处理自动检测食品风险，并基于数据集进行了基于逻辑回归的tf-idf表示的模型性能比较，最终提出了一种基于Conformal Prediction的LLM-in-the-loop框架，提高基础分类器的性能，并降低了能源消耗。

Mar, 2024