细粒度观点挖掘与公共卫生的弱监督注意力网络
本文提出了一种新的多语言情感分类方法,使用了大量的弱监督数据训练多层卷积网络,通过在多种语言数据集上进行充分的评估,证明该方法的优异性能,达到了同类研究的最高水平。
Mar, 2017
本文从多实例学习的角度考虑了细粒度情感分析的任务。我们的神经模型通过文档情绪标签进行训练,学习预测文本片段的情感,如句子或基本话语单元(EDUs),不需要对片段级别进行监督学习。我们引入了基于注意力机制的极性评分方法,用于确定正面和负面的文本片段,并提出了一个新的数据集,称为SPOT(作为片段级别极性注释的简称),用于评估MIL样式的情感模型,结果表明,比多个基准线有了更好的性能表现,而一个评估研究表明,EDU级别的意见提取产生的摘要比基于句子的替代方案更为信息丰富。
Nov, 2017
本文提出了一种基于神经网络的置换不变聚合运算符,并展示了其在多个MIL数据集上的实验表现,特别是在两个真实组织病理学数据集上的表现,同时保持了可解释性。
Feb, 2018
文中介绍了一种从在线产品评论中进行意见摘要的神经框架,该方法是知识瘦身的,只需要轻量级的监督,包括产品领域标签和用户提供的评分。方法结合了两个弱监督组件(一个偏向提取器和一个基于多实例学习的情感预测器),从多个评论中识别显著观点并形成提取式摘要。研究介绍了包括六个不同领域的产品评论的训练集以及具有黄金标准方面注释、显著标签和意见摘要的人工注释开发和测试集的意见摘要数据集。自动评估显示该方法相对于基线的显著改进,大规模研究表明根据多个标准,人类评判员更喜欢该方法的意见摘要。
Aug, 2018
本篇论文的主要研究是关于使用弱监督训练出纯文本的粒度级别用于用户生成的评论的细粒度方面分类器,并提出了基于学生-教师模型和迭代协同训练的方法来改进模型表现,对商品评论和餐厅评论的六个数据集,该方法模型的绝对f1值平均提升了14.1个百分点。
Sep, 2019
提出一种面向方面类别情感分析的多示例多标记学习网络(AC-MIMLLN),将句子视为袋子,单词视为实例,并将表示方面类别的单词作为关键实例。在三个公共数据集上的实验结果证明了AC-MIMLLN的有效性。
Oct, 2020
本研究提出了一种跨语言学习方法,通过机器翻译构建人工训练文档,训练出多语言分类器,从而实现在多语言文档中进行食源性疾病的早期探测,具有很好的应用前景。
Oct, 2020
提出了一种无需像素级注释进行食物图像分类和语义分割模型训练的弱监督方法,该方法基于多实例学习和基于注意力机制的方法,实现了食物类别的分类和语义分割,并在FoodSeg103数据集上进行了实验验证和探索了注意力机制的性能特性。
Aug, 2023
污染或掺假食品对人类健康构成重大风险,我们提供了一个包含7,546个短文本的数据集,描述公共食品召回通知,通过机器学习和自然语言处理自动检测食品风险,并基于数据集进行了基于逻辑回归的tf-idf表示的模型性能比较,最终提出了一种基于Conformal Prediction的LLM-in-the-loop框架,提高基础分类器的性能,并降低了能源消耗。
Mar, 2024