- SincVAE: 一种使用 SincNet 和变分自编码器改进脑电图数据异常检测的新方法
利用半监督的方法,使用一种名为 SincVAE 的新型深度学习方法,该方法通过训练特定的带通滤波器阵列作为变分自编码器的第一层,从而改进了脑电图数据中的癫痫发作检测,并能够在前癫痫期早期发现癫痫发作,并在后癫痫期对患者进行监测。
- 基于预训练语言模型的样本高效主动学习自训练
使用半监督的方法(self-training)从未标记的数据中获取伪标签来改善运用主动学习进行文本分类的效率,通过进行广泛的实验,提出了一种新的有效的 self-training 策略(HAST),并在四个文本分类基准数据集上进行了评估,仅 - 朝着端到端的半监督表格检测与语义对齐匹配转换器
通过 SAM-DETR 引入半监督方法,实现了目标查询和目标特征之间的精确对齐,从而在表的识别方面显著降低了误报率,并在复杂文档中表现出较高的性能,提供了更加高效准确的表格检测。
- SSFlowNet: 基于伪标签的点云半监督场景流预测
SSFlowNet 是一种半监督的场景流估计方法,通过混合有标签和无标签的数据,优化标签成本和模型训练精度之间的平衡,主要通过创新地使用伪标签降低对大量标记数据的依赖,并强调点云的几何结构以及引入空间记忆特征来学习顺序时间帧上点之间的几何关 - 基于 LLM 伪标签的半监督学习提升抽取式摘要生成
使用半监督方法解决在有限标记数据场景下的提取式文本摘要任务,提出了一种基于 GPT-4 的基于提示的伪标签选择策略,通过使用 LLM 评估和生成伪标签,改进了不同数据集上的 ROUGE-1 指标 10-20%,减少了无标记样本数量。
- 神经常微分方程的半监督学习:一种教师 - 学生模型方法
我们提出了 TS-NODE,这是首个使用 NODE 对动态系统进行半监督建模的方法,它通过生成廉价的合成伪轨迹来扩大状态空间中的探索,解决了由于缺乏真实系统数据而产生的挑战,并在教师 - 学生模型下根据学生的反馈来纠正教师模型。TS-NOD - 野外环境下面部照片 - 素描互译的半监督循环生成对抗网络
本文介绍一种半监督方法,即带有噪声注入策略的 Semi-Cycle-GAN (SCG),用于解决面部照片素描翻译中的配对数据集小且缺乏多样性以及来自不匹配照片 - 素描数据集所带来的隐写学现象等问题。实验证明 SCG 在公共基准测试中具有竞 - 推荐系统的数据增强:使用最大间隔矩阵分解的半监督方法
探讨了数据增强和细化最大边际矩阵分解的方面,提出了一种基于自训练的半监督方法,通过迭代使用高置信度的预测评级来增加训练数据和移除不确定的条目,从而改善基线方法的性能。
- 半监督跨模态注重力异构软件系统异常检测
该研究通过系统化的研究,发现了结合日志和度量数据来检测系统异常更加有效,提出了基于异构数据的端到端半监督方法 Hades,并通过大量模拟数据和华为云数据集的评估结果,证明了模型在检测系统异常方面的有效性。
- SOLD:僧伽罗语攻击性语言数据集
本研究针对斯里兰卡使用人数超过 1700 万的 Sinhala 语,开发了一个手工注释的数据集 SOLD,和一个更大的半监督数据集 SemiSOLD,用以改进机器学习模型鉴别 Sinhala 语的具有攻击性的语言的能力。
- 使用变分自编码器和单类支持向量机进行半监督结构损伤检测
本篇论文提出了一种半监督方法,其中利用数据驱动方法的人工神经网络 (ANNs) 在未受损结构条件下训练以检测结构损伤,然后采用变分自动编码器 (VAE) 近似无损数据分布和单类支持向量机 (OC-SVM) 区分使用从 VAE 信号重建提取的 - 社交媒体疫苗态度检测中立场和方面主题的分离学习
本文提出了一种新的半监督方法 VADet 用于检测疫苗态度,该方法通过主题建模学习无标记数据的主题信息,再用少量手动注释的样本进行微调。实验结果表明,该方法能够学习到立场和方面主题,且在立场检测和推文聚类方面优于现有的基于方面的情感分析模型 - 基于原型动量对比学习的自监督文本无关说话人验证
本研究针对发音者验证(SV)探索了自我监督表示学习方法,其中,提出了一种动量对比学习框架的简单对比学习方法(SimCLR),使用排队机制的 MoCo 说话人嵌入系统来维护大量负面例子,通过波形的变形处理方法等方式以规范化两个随机部分的内在发 - EMNLPBERT 与否:比较针对任务与任务不可知的半监督序列标注方法
本文探讨了如何有效地利用未标记数据 —— 通过探索任务特定的半监督方法 Cross-View Training (CVT),并将其与任务不可知的 BERT 在包括领域和任务相关的英语数据的多个设置中进行比较。CVT 使用较轻的模型结构,并表 - ACL双语词典感应中的半监督非等距嵌入空间
该论文提出了一种半监督的双语词汇识别方法(BLISS),该方法使用了一个新的中枢过滤技术,可以放松两个嵌入空间同构假设,利用有限的对齐双语词汇表和更大的未对齐词汇表,实现了令人瞩目的效果。
- NIPS使用两阶段半监督方法检测开放领域对话中的攻击性内容
本文提出了一个两步骤的半监督方法来从公共资源中引导大规模数据,以自动检测敏感语言,展示该方法在公共标注数据集和所提出的半监督数据集上显示出的优异表现和泛化能力,无需为敏感类别提供显式标签,从而在 Twitter 和 Toxic Wikipe - ACL双向语言模型的半监督序列标注
本文探讨了一种半监督的方法,通过添加双向语言模型的预训练上下文嵌入到 NLP 系统中用于序列标注任务,相比其他转移学习或添加标记数据和任务特定词典的方法,在命名实体识别和块分割等任务上实现了最先进的结果。
- 使用上位词子序列进行分类学归纳
本文提出了一种新颖的半监督方法,用于从输入词汇表中识别领域分类体系。该方法使用了一种基于概率的框架来提取上位词子序列,通过实验证明在四种语言中,作者的方法优于目前最先进的分类体系识别方法,并且在输入词汇中有噪声的情况下表现出很好的鲁棒性。
- ECCVSSHMT: 用于电子显微镜图像分割的半监督层次合并树
本文提出一种基于区域的半监督分割方法,通过一个可微的无监督损失函数和贝叶斯模型结合有监督信息,可以在仅用 3%到 7%的完整标签数据子集的情况下实现与全标签方法相当的表现并显著优于仅相同标签子集的有监督方法。
- 弱标注语义视频物体分割的半监督域适应
该论文提出了一种半监督方法来适应经过标记的图像数据训练的 CNN 图像识别模型到目标域,利用 CNN 学到的语义证据和视频数据的内在结构进行视频语义对象分割,显式地建模并补偿从源域到目标域的领域转移,并展示了我们的方法在具有挑战性的数据集上