用于推特健康提及分类的多种语言模型训练的新方法

Apr, 2022

用于推特健康提及分类的多种语言模型训练的新方法

A Novel Approach to Train Diverse Types of Language Models for Health Mention Classification of Tweets

Pervaiz Iqbal Khan, Imran Razzak, Andreas Dengel, Sheraz Ahmed

TL;DR本文提出了一种新的方法，使用对抗训练和对几个级别的 transformer 模型中的推文示例的表示进行高斯噪声扰动生成对抗性示例来训练语言模型，以进行卫生提及分类。添加噪声到较早的层有助于提高模型性能，而添加中间层的噪声会降低模型性能。最后，在最终层添加噪声比在中间层添加噪声表现更好。

Abstract

health mention classification deals with the disease detection in a given text containing disease words. However, non-health and figurative use of disease words adds challenges to the task. Recently, adversarial trainin

health mention classification adversarial training language models transformer models contrastive loss

发现论文，激发创造

利用对抗性对比训练提高推文健康提及分类

该论文利用对抗性训练和对比损失提高了医疗提及分类的性能，并通过解释性人工智能对结果进行分析。

Mar, 2022

提升社交媒体内容中健康提及检测的语言模型能力的独特训练策略

通过随机加权干扰和对比学习策略培训语言模型，并提出元预测器以区分社交媒体文本中的非健康和健康相关类别，实验证明该策略提高了语言模型的性能，元预测器在三个基准数据集上优于现有的健康提及分类预测器。

Oct, 2023

通过对抗训练来改善神经语言模型

使用对抗训练机制可以更好地规范神经语言模型中的过度拟合问题，增加嵌入向量的多样性并提高在机器翻译领域的性能。

Jun, 2019

生成自然语言对抗样本

通过黑盒基于人口的优化算法生成有迷惑性的语义和语法类似的对抗样本，不仅能提高情感分析和文本蕴涵模型的错误率，还能在 20 名人类注释者中得到 92.3% 的标签正确分类。进一步讨论了对抗训练作为一种防御的尝试，但未能产生改进，说明了这种对抗样本的强大和多样性。我们希望此研究能够鼓励研究人员追求提高自然语言域下深度神经网络的鲁棒性。

Apr, 2018

通过自我增强和对比学习提高社交媒体文本中的疾病检测

该研究提出了一种新的方法，将对比学习与语言模型相结合，通过自我增强方法改进模型的表示，并在与各种疾病相关的社交媒体数据集上取得了显著的改进。

Apr, 2024

社交媒体上个人健康提及检测的多任务学习

采用多任务学习框架，通过使用情感检测作为辅助任务，利用相关任务中可用的标注数据来提高社交媒体文本中个人健康体验检测的性能，从而显著提高了个人健康提及检测任务的范围与强大状态下的基线相比。

Dec, 2022

医学中大型语言模型的对抗攻击

大型语言模型（LLMs）在医疗应用中的整合为医学诊断、治疗建议和患者护理方面的进步提供了有希望的前景，然而，LLMs 对敌对攻击的易受攻击性构成了重大威胁，可能导致敏感医疗环境中的不良结果。本研究调查了 LLMs 在三个医学任务中面临的两种类型的敌对攻击的易受攻击性。利用真实的患者数据，我们证明了开源和专有的 LLMs 在多个任务中容易受到操纵。这项研究进一步揭示了针对特定领域任务的模型微调需要更多的敌对数据以实施有效的攻击，特别是对于更强大的模型而言。我们发现，虽然整合了敌对数据不会明显降低医学基准测试中的整体模型性能，但它确实会导致微调模型权重的明显变化，这表明检测和对抗模型攻击的潜在途径。这项研究强调了在医疗应用中确保 LLMs 安全有效部署的迫切需求，需要健全的安全措施和防御机制来保护 LLMs。

Jun, 2024

在硬标签黑盒设置中生成自然语言攻击

该研究提出了一种决策式的攻击策略，利用基于人口统计的优化算法，通过仅观察目标模型预测的前一标签，制作出可信且语义相似的对抗性例子。与先前文献中提出的攻击相比，在高度限制的情况下，成功率更高，被替换单词比例更低。

Dec, 2020

针对生物医学自然语言处理任务的对抗性样本

本文介绍了在医疗领域中使用模型的预训练词嵌入的成功，讨论了 BERT 语言模型在核心领域中的效果，并提出了三种不同的对抗策略并评估模型性能，结果发现模型效果被显著降低，通过使用对抗性样本可以显著提高模型性能和鲁棒性的实验，并希望该实验能够激励更多对具备更强鲁棒性的模型的投入和评估。

Apr, 2020

会话蕴含任务的对抗攻击与防御

在这项研究中，我们将对抗性攻击结果视为模型的一个新（未见过的）领域，并将防御问题转化为如何提高模型在这个新领域的鲁棒性。我们关注会话蕴含任务，其中多轮自然语言对话是前提，通过对变换模型进行微调以预测给定对话的假设是真还是假。我们采用同义词交换作为攻击方法，并实施了一些微调策略，并提出了嵌入扰动损失作为提高模型鲁棒性的方法。最后，通过讨论自然语言处理中现实世界的对抗攻击，展示了我们工作的重要性。

May, 2024