- ICML文本序列化与传统表格机器学习范式的关系
最近的研究探讨了语言模型如何在表格机器学习任务中用作特征表示和预测的方法,通过使用文本串行化和有监督的微调技术,我们评估了这些新兴的语言模型技术与传统模式在表格机器学习中的适用性和可靠性,并调查了数据表示和整理方式对预测性能的影响。结果显示 - CVPR动态频道采样用于卷积神经网络的选取或混合
给定挑选或混合(Pick-or-Mix,PiX)模块,用于动态通道抽样,我们证明它可以有效地优化卷积神经网络(ConvNets)的性能,并在网络缩放和通道剪枝应用中取得最新的成果。
- 知识图谱构建中的不确定性管理:一项调查
建立知识图谱是个具有挑战性的任务,因为需要处理提取知识中的不确定性,并且需要解决数据的可靠性和冲突问题,同时还需要确保知识图谱的质量。
- PyTorch-IE:信息提取的快速可重现原型设计
信息抽取(IE)旨在从非结构化或半结构化文档中导出结构化表示。本研究提出了 PyTorch-IE,一种基于深度学习的框架,旨在实现 IE 模型的快速、可重复和可重用的实现。PyTorch-IE 提供了灵活的数据模型,能够通过集成来自各种数据 - CORE-BEHRT:一种经过精心优化和严格评估的 BEHRT
通过优化 BERT 模型的关键设计选择和数据表示方式,研究表明改进数据表示方法以及架构和训练协议可以显著提高基于 BERT 的电子健康档案模型的性能,从而为未来的相关工作奠定了坚实的基础。
- DailyMAE:朝着一天内预训练掩膜自编码器
本研究提出了有效的训练方案,以降低数据加载瓶颈和维持预训练性能,实现了高效的自监督学习训练,为更广泛的可访问性和推动自监督学习研究的进展铺平了道路。
- 通过尺度不变的数据预处理使聚类算法能够检测不同密度的聚类
利用 ARES 变换的数据预处理方法可以使聚类算法对数据表示更加鲁棒,并能够检测不同密度的聚类;实证结果表明,在广泛范围的真实数据集上,经过 ARES 转换后的聚类产生更好且更一致的结果。
- 基于随机电阻存储的深度极值学习机的统一视觉处理
通过硬件软件的协同设计,我们提出了基于随机电阻存储器的深度极端点学习机,实现了高效统一的点集分析,比传统系统节省了大量能源并降低了训练成本,为各种数据模态和任务提供了节能高效的边缘人工智能解决方案。
- 寻找加速神经场培训的数据转换
通过研究数据变换对神经场训练速度的影响,特别关注像素位置置换如何影响 SGD 的收敛速度,我们发现随机置换像素位置可以显著加快训练速度。分析表明,随机像素置换消除了易拟合的模式,促进了早期的优化,但阻碍了细节的捕捉。
- 细致的 VQ-VAE
我们提出了一种新的方法,通过整合注意力残差编码器(AREN)和残差像素注意层来增强 VQVAE 模型的能力。我们的研究目标是改善 VQVAE 的性能,并保持实际参数水平。AREEN 编码器被设计为在多个级别上有效运作,适应不同的架构复杂性。 - 超越准确性:评估嵌入表示能力以保持结构和上下文信息
通过结合分类、聚类和 t-SNE 基于邻近性分析的评估方法以及优化技术(如贝叶斯优化)来量化嵌入式数据在捕捉结构和上下文信息方面的有效性,本文旨在提出一种衡量嵌入式数据表现能力的方法,从而为研究者和实践者选择适用的嵌入式模型提供数据支持和辅 - PyGraft:配置生成模式和知识图的便捷化
PyGraft 是一个 Python 工具,用于生成高度定制的、领域无关的模式和知识图谱,以解决在教育或医学等数据敏感领域中公共数据集不足的问题,并促进基于图的机器学习等领域中模型性能和泛化能力的综合评估。
- 深度神经网络架构中的数值系统:综述
本篇论文综述了替代数字系统对于提升深度神经网络计算效率的重要性,讨论了使用这些系统所面临的挑战和相应的解决方案,并突出了各种数字系统在 DNN 性能上的影响和各种设计方面。
- 在竞争环境下,改进的贝叶斯风险可能导致社会福利的减少
本研究分析了在多家模型提供商竞争市场环境下,机器学习模型的规模对预测准确度的影响,并发现在某些情况下,即使提高数据表示质量可以减少贝叶斯风险,但整体而言也会导致跨用户的总体预测准确性下降。
- DeepSI: 语义交互的交互式深度学习
本文提出了 DeepSI_finetune 框架,将交互式深度学习方法整合到人机交互分析流程中,通过人机交互与深度学习之间的反馈循环来学习用户和任务特定的表示,结果显示比基本使用深度学习作为预处理功能的最新技术更准确地捕捉用户的复杂心理模型 - 在紧张注释预算下分析文本表示:度量结构对齐
通过引入评估文本数据表示优劣的度量标准,本研究探究了数据表示在紧急标注预算下对学习成果的影响。研究表明,数据表示依据任务需求的结构对齐程度越高,模型对标注预算的依赖性较低、对少样本数据的学习效果更优。
- 良性自编码器
该研究证明了通过压缩数据维度以实现数据表示和压缩的有效性,并提出了一种普遍适用于非凸问题的优化算法(BAE),使得压缩模型输入有利于模型性能,并提出了一种用于计算 BAE 的高效算法,测试表明 BAE 能够提高模型在各类数据中的性能,并提高 - ECCVSelectionConv: 针对非矩形图像数据的卷积神经网络
本论文提出了一种新的结构化图卷积算子,可以复制二维卷积权重,将传统 CNN 训练的能力转移到新的图网络,从而可以处理非矩形数据,不需要在大型数据集上进行领域特定的训练。作者还展示了将预训练图像网络应用于分割、风格化和深度预测等多种数据形式, - 构建公平训练数据集的自适应采样策略
本文提出一个数学模型以创造具有代表性的数据来解决机器学习模型在非代表性数据集上产生的问题。我们将数据集创建问题形式化为一个约束优化问题,并提出了一种灵活的方法,它包含模型构建者和其他利益相关者的偏好,以及学习任务的统计特性。此外,我们证明, - 3D 物体检测模型和方法的调查与系统化
本文对近十年来 3D 物体检测领域涉及的输入数据、数据表示、特征提取和实际检测模块等全流程进行了全面的调研,系统化分类并给出相应的实用框架。