model training | BriefGPT - AI 论文速递

关键词model training

搜索结果 - 164

具有灵活架构的联合学习
传统的联邦学习方法对计算和通信能力不同的客户端的支持有限，导致模型训练的低效和潜在的不准确性。本文引入了具有灵活架构的联邦学习算法（FedFA），允许客户端选择适合其资源的网络架构，通过层嫁接技术和可扩展聚合方法，实现了客户端贡献的统一集成
PDF18 days ago
GraphStorm: 为工业应用而设计的一体化图机器学习框架
GraphStorm 是一个端到端的解决方案，提供可扩展的图构建、模型训练和推理，并具有易于使用、适用于海量数据集和扩展性强的特性。
PDF22 days ago
ACL视频语言理解：模型架构、模型训练和数据视角的综述
本文综述了视频 - 语言理解系统的关键任务、相关挑战以及模型架构、模型训练和数据观点等方面的方法，并进行了方法间的性能比较，提出了未来研究的有前景的方向。
PDF23 days ago
Hi5：零人工标注的 2D 手部姿态估计
提出一种新的大规模合成手部姿态估计数据集 Hi5 以及一种新的廉价方法来收集高质量合成数据，无需人工注释或验证。在计算机图形学的最新进展下，利用具有多样性性别、肤色和动态环境和摄像机移动的高保真度 3D 手部模型，我们的数据合成流程可以精确
PDFa month ago
EdgeSync：通过自适应连续学习加速边缘模型更新以应对视频数据漂移
通过使用远程服务器不断训练和调整轻量级模型，EdgeSync 筛选样本以考虑及时性和推理结果，从而提高实时视频分析系统的质量，并且通过测试数据集的评估，相比于现有方法提高了约 3.4%，相对传统方法提高了约 10%。
PDFa month ago
考虑不确定性的辅助异常评估与预期异常后验
通过填补现有方法缺失的空白，提出了预期异常后验（EAP）方法，一种基于不确定性的评分函数，通过量化异常检测器的总不确定性来衡量辅助异常的质量，在图像和表格数据的 40 个基准数据集上的实验证明，EAP 在大多数情况下优于 12 种适应数据质
PDFa month ago
无标记的逆向鉴定补充了对生物实验中个体昆虫主体的重新鉴定
引入新颖的无标记反向识别动物的概念和实用技术，以补充传统的前瞻性纵向行为研究方法。研究中提出了通过模型训练实现反向识别，以提高资源效率，减少手动标注工作和计算资源投入。
PDFa month ago
EPL：深度人脸识别的实证原型学习
在这篇论文中，我们将原型学习定义为每个类别中样本特征的期望，并使用数据集中的现有样本设计经验性原型。然后，我们提出了一种自适应更新经验性原型的策略，该策略基于样本特征与经验性原型之间的相似性。此外，我们提出了一种经验性原型学习（EPL）方法
PDFa month ago
从未分割的医学图像中的弱监督贝叶斯形状建模
通过点云监督，提出了一种弱监督的深度学习方法来预测统计形态模型的构造，从而提高模型的训练可行性。
PDF2 months ago
提升 RAC 可访问性：利用数据集和 LLMs
通过构建 RAC 数据库和利用大语言模型的先进技术，本研究致力于简化哥伦比亚航空法规 (RAC)，提高其可被理解和获取的能力，从而减少对专家咨询的依赖。
PDF2 months ago
添加效应辅助学习
两阶段协作学习架构，利用隐私保护假设检验筛选有用数据，然后通过迭代模型训练和有限的摘要统计信息传输，实现与中心化数据相同的理论和数值效果。
PDF2 months ago
自动检测大型语言模型中的不充分训练标记
我们通过分析 Tokenizer、基于模型权重的指标和启发式技术的结合，开发了一种有效的方法，用于自动检测在分词器词汇表中存在但在模型训练中很少或完全不存在的问题标记，我们的发现证明了这些标记在各种模型中的普遍存在性，并为改善语言模型的效率
PDF2 months ago
显著性的精细优化：基于显著性的生物特征攻击检测模型训练
融入人类感知智能到模型训练能增强在难度较高的生物特征任务中的泛化能力，如攻击检测和合成样本检测。本文研究了不同的显著性粒度水平，通过使用简单但有效的显著性后处理技术，在数个卷积神经网络中实现了增强的攻击检测和合成人脸检测的泛化能力。
PDF2 months ago
点在上下文中的理解：通过上下文学习理解点云
通过引入 Point-In-Context（PIC）框架，利用 in-context learning 解决 3D 点云的任务，同时提出了增强版 PIC-S，通过动态上下文标签和额外的上下文对提高模型性能和泛化能力。
PDF2 months ago
WWW消费不确定性下新下载移动游戏花费的协同增强预测
通过提出一个稳健的模型训练和评估框架，以标准化支出数据以降低标签变异性和异常值，并确保建模过程的稳定性，该论文介绍了一种协同增强模型，旨在预测用户游戏消费而无需依赖用户标识，从而确保用户隐私并实现在线训练，通过在融合用户偏好和游戏特征之前分
PDF3 months ago
少数精华：加速和增强数据重新加权与核心集选择
我们介绍了一种新颖的方法，通过核心子集选择进行重新加权，从而在计算时间和模型性能方面实现了优化，从而实现了计算效率和模型准确性之间的平衡。实验结果证实了这种方法的有效性，突出了它作为可扩展和精确的模型训练解决方案的潜力。
PDF3 months ago
基于剪枝和恢复的联邦学习
在异构环境中，提出了一种新颖的联邦学习训练框架，考虑了真实环境中客户端的各种网络速度差异。该框架集成了异步学习算法和修剪技术，有效解决了传统联邦学习算法在涉及异构设备的场景中的低效问题，同时解决了异步算法中某些客户端训练不充分和过时问题。通
PDF4 months ago
LocalRQA: 从生成数据到本地训练、测试和部署检索增强型问答系统
Retrieval-augmented question-answering systems combine retrieval techniques and large language models, while LocalRQA is
PDF4 months ago
使用聚类进行语言模型训练的平衡数据采样
在这篇论文中，我们提出了一种名为 ClusterClip Sampling 的数据采样策略，利用数据聚类来平衡训练数据的文本分布以获得更好的模型训练效果。通过基于聚类结果对训练过程中的常见样本和罕见样本进行平衡，以及引入重复剪裁操作来减轻由
PDF4 months ago
数据用于预测对智能能量存储中模型预测控制性能的影响
利用历史建筑能源数据，研究了简单的线性多层感知器模型在多建筑能源系统模拟中提供与先进模型相当的预测精度，并具有更高的数据效率和泛化能力。通过使用变点分析对训练数据进行筛选，同时提高了预测精度和数据效率。重用模型和使用三个月的数据训练的模型平
PDF4 months ago