- FLatS:基于特征的似然比分数的原则性异常检测
通过似然比来测量测试样例 x 的 “OOD-ness”,本文主张基于似然比的新型 OOD 检测方法 FLatS,提出了一种优于现有方法的模型,该模型能够作为一个通用框架,通过整合 “out-distribution” 密度估计 $p_{ou - 通过检索增强的大型语言模型增强金融情感分析
在金融情感分析领域,传统的 NLP 模型受到参数大小和训练数据范围的限制,以及简洁的财经新闻文本缺乏上下文的问题,而无法很好地泛化和提高准确性。为了解决这些挑战,本研究引入了一种基于检索增强的大型语言模型(LLMs)框架,该框架包括一个指导 - MBR 从始至终:通过极小贝叶斯风险的视角探讨现代生成技术
最小贝叶斯风险(MBR)解码是一种选择机器学习系统输出的方法,不是基于最高概率的输出,而是基于多个候选项中具有最低风险(预期误差)的输出。本文首先介绍了该方法和最近的文献,证明了一些最近的方法可以被写成 MBR 的特例,为这些方法的性能提供 - 要求规范化的自然语言处理:如何得出新方法?
自然语言处理在需求工程中的半自动化规范化过程中起着重要作用,提供了更好的辅助,并可适用于特定用例和领域。
- 因果自解释的 D - 分离
最小条件依赖性(MCD)准则是一个新颖的框架,用于揭示自然语言处理模型的因果理性,并通过最小化输入的未选择部分与目标标签在选择的理性候选项上的条件依赖关系来选择标签的所有原因。经验证,MCD 相比以往基于 MMI 的方法改善了 F1 得分高 - 通过自适应的自然语言处理模型选择和基于临床专家规则的分类器改进 VTE 的识别 —— 来自放射学报告
通过采用深度学习和自然语言处理模型的新方法组合,结合数据增强、自适应预训练 NLP 模型选择和基于临床专家 NLP 规则的分类器,可以有效提高未结构化(自由文本)放射学报告中静脉血栓栓塞(VTE)的识别准确率。实验结果表明该模型的有效性,对 - 利用自然语言处理对食品系统本体进行组织分类
利用自然语言处理方法识别组织实体的分类任务,实现与食物系统本体论的知识图谱构建和整合,研究结果表明 NLP 模型在分类任务上表现良好,且可以广泛应用于其他分类问题。
- 论文蒸馏:探究 NLP 模型中偏见对仇恨言论检测的影响
对自然语言处理模型中的偏见对仇恨言论检测任务的影响进行了研究,探讨了解释性、冒犯性刻板印象偏见和公平性三个方面。研究发现表明,除非我们开始将社会科学纳入对自然语言处理模型中的偏见的研究中,否则我们无法有效地克服对现有模型中的偏见的度量和减轻 - ParaFuzz: NLP 中一种基于可解释性技术的检测有毒样本的方法
本研究提出了一种创新的测试时毒样本检测框架,依靠模型预测的可解释性,并关注输入的语义含义,旨在解决当前检测机制对于隐蔽型后门攻击(如基于风格的攻击)的局限性。通过采用 ChatGPT 及模版工程问题来执行触发词去除任务,并结合模糊测试技术发 - KDD生物临床 BERT、BERT Base 和 CNN 预测药物评论满意度的性能比较
开发自然语言处理(NLP)模型,分析患者的药物评价并准确分类为积极、中性或消极满意度,以减轻医护人员工作量并对患者生活质量提供更深入的洞察,这是治疗效果的关键指标。研究实施和评估了几个分类模型,包括 BERT 基础模型、Bio+Clinic - 全息智能语音助手 (HIVA)
本研究提出了全新的 Holographic Intellectual Voice Assistant(HIVA) 系统,以其三维虚拟形象、语音交互等方式,为人们提供个性化、真人化的大学服务,其自然语言处理技术和模型,进一步提升了用户体验。
- 大型语言模型作为注释器:在最小成本下增强 NLP 模型的泛化能力
研究使用大型语言模型对输入进行注释以提高自然语言处理模型的泛化性,并提出一种基于模型预测得分差异的采样策略来重新训练模型,证明在分类和排名任务中取得了显著的精度提高。
- 基于非反事实扩充的稳健性方面情感分析
本文提出了一种使用嘈杂但代价效益高的数据增强模型来提高 NLP 模型在情感分析任务中的鲁棒性的方法,并通过实验证明这种方法对标准和鲁棒性特定的数据集都有显著的改进,同时在 ABSA 鲁棒性基准测试中创造了新的 state-of-the-ar - 分类器解构: 针对文本分类模型的数据重构攻击
本文提出了一种名为 Mix And Match 的新型有针对性数据重构攻击,强调了考虑分类模型中的数据重构攻击与隐私风险的重要性,并提供了有关可能泄漏的见解。
- LLM 认知能力的高效测量:自适应测试视角
提出了一种采用自适应测试框架评估大型语言模型的方法,该方法可以根据模型的表现动态调整测试问题的难度,从而更准确地估计模型的能力,使得大型语言模型可以与人类进行比较,同时该方法可以使用更少的问题,从而更加高效。对 ChatGPT 等 6 种模 - 自然语言处理中社会人口统计信息偏差调查
本篇论文调查了 209 篇关于自然语言处理模型中的偏差的论文,提出了社会人口统计学偏见的定义,并确定了研究偏见的三个主要类别:偏见类型,偏见度量和去偏见。作者总结说,目前的去偏见技术是肤浅的,不能真正消除偏见;最后提供了未来工作的建议。
- 针对罗马尼亚讽刺检测和情感分析的对抗胶囊网络
基于对抗可训练和胶囊网络的调优,提出了一种优化了的自然语言处理模型,可用于罗马尼亚语的讽刺检测和情感分析任务,对已有方法进行了超越,准确率高达 99.08%。
- 使用预训练语言模型和大型语言模型评估 ESL 语音的短语断点
本文介绍了使用预训练语言模型(PLMs)和大型语言模型(LLMs)评估 ESL 学习者语音短语分割的方法,并展示了通过使用 PLMs 减少标注数据依赖并提高性能,以及验证 ChatGPT 在这个领域有进一步提高的潜力。
- ACL多模态自然语言处理中语义模糊问题的处理
本文探讨了语义欠规范的现象在智能系统处理语言时的影响,并分析了多模态系统和人类掌握这种现象的能力。作者呼吁开发者重视该现象,以提升与人类用户交互的语言技术。
- ACL电子健康记录进展笔记中患者活跃诊断和问题总结的 ProbSum 2023 共享任务概述
本研究介绍了 BioNLP Workshop 2023 发起的一个共享任务 —— 问题列表摘要 (ProbSum),目的是吸引未来的研究努力建立自然语言处理模型,用于实际的诊断决策支持应用,由此生成相关且准确的诊断结果将有助于提高医疗服务的