- 基于 ASR 转录的语音情感识别:关于词误率和融合技术的全面研究
使用不同词错误率(WERs)的 ASR 转录对 IEMOCAP,CMU-MOSI 和 MSP-Podcast 等已知语料库进行 SER 性能评估,同时提出了一个统一的 ASR 错误抗干扰框架,并与最佳表现的 ASR 转录进行比较,实现了更低 - GuideWalk:增强学习的异构数据融合 —— 多类文档分类案例
通过基于有意义的句子的图结构的嵌入方法,在大规模异构数据中高效提取信息,特别是文本数据的处理和分类问题中,展示出与其他算法相比显着更好的分类性能。
- CVPRPairAug:增强图像 - 文本配对在放射学中的应用
我们设计了一种 Pairwise Augmentation (PairAug) 方法,旨在同时增强医学图像和文本数据,通过 Inter-patient Augmentation (InterAug) 分支生成使用合成的放射学报告的放射学图像 - 大型语言模型(或人类)可以蒸馏文字吗?
调查大型语言模型在文本提炼中的潜力,利用不同架构和训练方法的语言模型识别和去除目标变量信息,以保留其他相关信号,并揭示这些模型在计算社会科学研究中处理文本数据时的优势和局限性。
- COLING通过决策边界感知的数据增强在低资源环境中提高效果和鲁棒性
该研究提出了一种基于决策边界的数据增强策略,利用预训练语言模型来提高鲁棒性;该技术首先将潜在特征接近决策边界,然后通过重构生成一个带有软标签的模糊版本,并建议使用中点 K 采样来增强生成句子的多样性。通过大量实验证明了该增强策略与其他方法相 - 通过基础模型 API 生成差分隐私合成数据 2: 文本
我们提出了一种名为 Aug-PE 的增强版 PE 算法,应用于文本的复杂情境,通过 API 访问大型语言模型,生成差分隐私的合成文本,实验证明 Aug-PE 可以产生具有竞争性效用的差分隐私合成文本,从而便捷地在隐私保护的语言模型应用中提供 - ACLTEncDM:理解语言模型编码空间中扩散模型的属性
本文介绍了一种名为 TEncDM(Text Encoding Diffusion Model)的新方法,通过在语言模型编码空间中训练模型,使用基于 Transformer 的解码器和自条件机制,实现了文本生成任务中优于现有非自回归模型的效果 - HQA-Attack: 面向文本黑盒硬标签高质量对抗攻击
在黑盒硬标签文本对抗攻击中,提出了一种名为 HQA-Attack 的简单而有效的框架,可以在有限的查询预算下生成高质量的文本对抗样本,具有高语义相似性和低扰动率。
- 文本图上的分层知识蒸馏用于数据有限的属性推断
通过构建图文本进行少样本学习,以提高社交媒体文本数据中属性推理的性能。
- 通过异常值检测优化增强情感分析结果
通过使用 Deep SVDD 算法识别和处理主观标签中的异常值,以提升分类效果。研究结果表明,在大多数情况下,删除异常值可以改善结果,并且大型语言模型 DeBERTa v3 可以捕捉到复杂模式从而提高性能。
- 来自其他语言的专有名词音译的聚类
通过使用机器学习技术和数学相似度方程,我们提出了一种针对专有名词的拼写变异进行聚类的方法,可以显著减少人工标注的工作量,从而降低了数据清洗和格式化的需求。
- 利用电子健康记录进行因果推断的文本数据挖掘
使用大量患者记录和治疗历史的文本数据,可以在临床数据的全部阶段中以最小的额外工作量支持因果推断,通过三种方式利用文本数据增强经典匹配分析,改善缺失数据的模拟值的准确性、增强匹配过程的合理性,并结合文本变量来估计易于解释的基于文本的治疗效应。 - 社会公益的对手:利用对抗攻击保护个人属性隐私
本文提出了一种名为 Adv4SG 的新型文本领域对抗性攻击方法,旨在通过一系列词汇扰动来保护社交媒体上的个人属性隐私,有效地降低基于自然语言处理技术的属性推断攻击的影响。
- CQE: 全面数量提取器
本文提出了一种基于依赖解析和单位字典的数量提取框架,它能够高效地检测数值和单位的组合、数量变化的行为以及数量所关联的概念,并对检测到的数量进行适当的标准化和规范化。使用新颖的数据集进行评估,我们展示了基于开源框架的方法优于其他系统,并且是目 - Bipol: 一种新型的 NLP 多轴偏见评估指标和可解释性
引入了 bipol,这是一种具有可解释性的新度量,用于评估文本数据中的社会偏见。通过评估两个受敏感术语频率和模型分类影响的过程,我们使用 SotA 架构创建了新模型来检测多个方面的偏见,并评估了两个流行的 NLP 数据集 (COPA 和 S - 一种基于审慎的联合声音和文本解码器
提出一种新的两阶段端到端的语音识别模型,通过训练配对数据和未配对文本数据的组合来提高 ASR 性能,称为 Deliberation-JATD,它结合了 Deliberation 的拼写校正能力和 JATD 的未配对文本数据使用,实现了在多个 - ICLR非洲停用词项目:整理非洲语言的停用词
该研究的目标是研究非洲语言中的常用词以便进行信息检索和自然语言处理,同时在该研究中介绍十种非洲语言的停用词收集进展以及未来计划。
- 使用整合的文本 - 梅尔频谱生成器进行端到端语音识别的纯文本领域自适应
这篇论文提出了一个端到端的自动语音识别系统,可以使用带有转录的语音数据、纯文本数据或两者的混合数据进行训练。该系统通过使用文本数据可显著提高在不同领域的 ASR 模型的准确性,在扩展 ASR 模型中引入 TTS 块从而创建梅尔频谱图,该块包 - 社交媒体帖子的情绪检测
研究使用传统机器学习技术和深度神经网络模型在社交媒体文本数据中识别情绪,并构建一个双向长短记忆神经网络(BiLSTM)和双向门循环单元(BiGRU)的集成模型,其中 BiGRU 模型表现最佳,准确率达 87.53%。此结果将有助于开发一个可 - 利用支持性文本数据启动有限转录的自动语音识别系统开发
本文研究发现,使用不同数量的文本数据进行训练和 fine-tune transformer model 可以降低自动语音识别(ASR)的 word error rate,其中 lexicon 对于改善 ASR 性能没有多大作用,而使用必要量