- 用随机性对抗随机性:使用延迟集成和噪声插值减轻微调的优化不稳定性
利用集成、噪音正则化和模型插值技术,我们提出了一种名为 DENI(Delayed Ensemble with Noisy Interpolation)的新型缓解策略,它既具备高效计算的特点,又能有效克服细调整中的不稳定性问题。通过在 3 种 - 改进的凸分解与集成和布尔基元
通过引入少量负相关基元和利用集成方法来改进几何重构和修复过程,从而显著提高描述场景的准确性。
- 特征融合提升分类效果:结合 Dempster-Shafer 理论和多个 CNN 架构
使用 Dempster-Shafer 理论构建的集成模型解决深度学习中的不确定性问题,通过特征提取、信任度计算、融合和效用计算等步骤,该方法在 CIFAR-10 和 CIFAR-100 数据集上进行的实验展示了显著的分类准确性提升,相较于最 - CNER: 一个命名实体关系分类工具
CNER 是一个用于提取西班牙语命名实体之间语义关系的工具集合,采用基于容器的架构,集成不同的命名实体识别和关系提取工具,拥有用户友好的界面,可以轻松输入文本或文件,便于流程化分析。该工具在西班牙语自然语言处理任务中展示了机器学习技术的有效 - 液体集成选择用于持续学习
连续学习旨在使机器学习模型能够在数据分布不断变化的情况下不忘记已学知识。通过训练集合中的每个成员于不同相关子集,使整个集合相比于单纯模型能够获得更高准确率且遗忘更少的问题。我们解决了在给定数据上选择哪些模型应该学习,哪些模型应该进行预测的问 - 当下词干化方法的比较:爱沙尼亚语的案例研究
本研究评估了三种不同的爱沙尼亚词形还原方法 —— 基于生成字符级模型、基于模式的单词级分类模型和基于规则的形态分析。根据我们的实验结果,一个明显较小的生成模型在所有基于 EstBERT 的基于模式的分类模型中一致表现更好。此外,我们观察到三 - ACL跨越 LLM 集成中不同词汇之间的鸿沟
通过词汇对齐方法,将不同的语言模型通过集成的方式进行整合,并在生成过程中动态修正和增强输出,以提高集成模型的效果和性能。
- AILS-NTUA 参加 SemEval-2024 任务 6: 高效模型调优用于幻觉检测和分析
我们在 SemEval-2024 的 Hallucinations 和相关可观察生成错误的任务上提交了 SHROOM,要求进行流畅过度生成幻觉的二元分类。通过微调预训练模型和自然语言推理模型,并将这些模型进行集成,取得了 77.8% 和 7 - 多散布低曲率模型融合的集成对抗防御
通过降低攻击的可转移性,我们的研究试图增强集成模型的多样性,特别关注在曲率的影响下训练多个更多样且具有低曲率的网络模型,从而提高对各种攻击的鲁棒性。
- 可靠的不确定性与便宜的神经网络集成:工业零件分类的案例研究
本研究比较了单一神经网络、深度集合和三种高效神经网络集合的性能,结果表明批量集合是一种性价比高且与深度集合相比在不确定性和准确性方面表现更好的替代方案。
- 基于集成的无监督非连续性短语结构分析方法
我们提出了一种新的集成方法来处理无监督的不连续句法分析问题,通过对现有的不连续解析器的多次运行进行平均预测,稳定并提升性能。同时,我们还提供了对于不同二进制和连续性设置下的树平均的综合计算复杂性分析,以及一种高效的精确算法来解决这个任务,实 - 通过组合小语言模型提炼大型语言模型
我们提出了一种简单易行的方法,通过将大型语言模型(LLMs)与良性和小型语言模型(SLMs)集成,从未经筛选的数据的负面影响中净化 LLMs,以提高其性能并减轻版权侵权、数据污染和隐私侵犯等问题。经过综合实验证明,该方法能有效保持 LLMs - 多个合成数据集上集成模型的偏差 - 方差分解
通过推导多个合成数据集使用的偏差 - 方差分解,我们的理论预测多个合成数据集对于高方差的下游预测器特别有益,并给出了在均方误差和 Brier 得分情况下选择合适数量合成数据集的简单经验法则。在多个真实数据集和下游预测器上评估集成的性能,结果 - SQT - std Q-target
Std Q-target 是一种保守的,基于单一关键的 Q 公式:Q 网络标准差,在强化学习中解决过高估计的偏见问题,我们将 SQT 应用于 TD3/TD7 代码并在七种常见的 MuJoCo 和 Bullet 任务上与最先进的 actor- - 基于语法的演化方法实现领域操作符和集成多样性的自动化工作流组合
自动机器学习,自动工作流组合,EvoFlow,基因操作符,集成
- Lp 范数约束的单类分类器组合
通过建模集合的稀疏性 / 均匀性,本研究提出了一种解决一类分类器融合问题的方法,即通过线性集合模型中的权重学习。利用 Frank-Wolfe 算法,有效地解决了提出的凸约束优化问题,并通过多个数据集的评估证明了其优势。
- GenCast:基于扩散的中期天气集成预测
基于机器学习的概率天气预测模型 GenCast 在 1 度分辨率下可以比传统的集合系统更准确地预测天气,并展示了良好的可靠性和物理一致性。
- 多进程数据分类
本文研究了如何通过并行训练不同超参数的分类算法来减少执行时间,并使用 Python 多进程来测试这一假设,通过集成所有进程的预测来提高准确性。结果表明,集成方法提高了准确性,多进程减少了执行时间。
- 推进语言建模的最新研究成果
我们提出了一个简单的框架来改善语言建模的泛化性能,该框架不仅发布代码,还发布了在开发集和测试集上的概率结果,从而可以轻松将新模型加入到集成模型中。这种方法有助于确定新提出的模型是否确实对当前基线模型具有补充作用,同时也促进了思想的多样性,并 - 探究基于权重扰动的深层神经网络应用于虹膜攻击检测
对深度神经网络 (DNNs) 进行参数扰动敏感性分析,使用权重和偏差参数对 VGG、ResNet 和 DenseNet 三种 DNN 架构进行实验,以改进虹膜攻击检测的性能,参数级集成平均提高 43.58% 和 9.25%。