- 特征表示对光子神经网络准确性的影响
通过研究多种编码策略的效果,开发了数学框架以分析特征组合对光子神经网络的性能和学习能力的影响,并通过选择最优编码方法,在 Iris 数据集上取得了相比其他编码技术更高的精度提升,突破了不进行特征组合的网络性能。这些发现凸显了在规模或功率受限 - 基于令牌加权的 RNN-T 模型用于学习有缺陷的数据
使用基于标记权重的 RNN-T 准则来缓解音频识别中的转录错误,并且在半监督学习中使用该方法可以显著提高准确性。
- LLaMA-Reg: 使用 LLaMA 2 进行非监督式医学图像配准
使用预训练的大型语言模型提取医学图像的深度特征来改善图像的注册准确性,实验证明了大型语言模型在医学图像注册任务中的巨大潜力。
- 城市环境中的越南场景文本检测的集成学习
提出了一个简单而高效的整合学习框架用于越南场景文字定位。通过结合多个模型以提高预测准确性的整合学习方法,旨在显著提升在具有挑战性的城市环境下的场景文字定位性能。通过在 VinText 数据集上的实验评估,我们提出的方法相对于现有方法在准确性 - SpikeNAS:一种用于脉冲神经网络系统的快速、内存感知的神经架构搜索框架
SpikeNAS 是一种新颖的内存感知神经架构搜索(NAS)框架,用于 SNN,能够在给定的内存预算下快速找到适当的 SNN 架构,提高准确性并满足内存受限的 SNN 系统的需求。
- 通过信息保留实现 LLMs 的精确 LoRA 微调量化
该论文提出了一种新颖的 IR-QLoRA 技术,通过信息保留实现了对量化 LLMs 的高精度,综合实验证明 IR-QLoRA 能显著提高 LLaMA 和 LLaMA2 系列的准确性,在 2-4 位宽下与现有方法相比,4 位 LLaMA-7B - 行动识别的泰勒视频
通过使用 Taylor 视频格式和运动提取函数,我们能够高效地从视频中提取动作,并得到具有竞争力的动作识别准确性。
- 基于不确定性的选择性问题回答语言建模
我们提出了一种自动化的大语言模型(LLM)转换方法,可以产生能够在每个预测中估计不确定性的具有不确定性感知能力的 LLM。我们的方法与模型和数据无关,计算效率高,不依赖外部模型或系统。我们在选择性问答环境下评估了转换模型,即尽可能回答问题同 - 关于大型语言模型 “令人惊讶可能” 的回答的真实性研究
在这篇研究中,我们调查了类似于 Bayesian Truth Serum 的标准对 LLMs 的回答的相关性,并假设在一定条件下,根据这一标准最大化奖励的回答应该比仅最大化后验概率的回答更准确。通过使用包括 TruthfulQA 基准和开放 - 学习对分布变化鲁棒的最优分类树
基于混合整数规划技术,我们提出了一种学习鲁棒分类树的方法,通过问题转化和约束生成的解决方法,在公共可用数据集上展示了最差情况准确率提高了 12.48%,平均情况准确率提高了 4.85%。
- Fuzzy-NMS:在 NMS 中使用模糊分类改善 3D 物体检测
通过引入模糊学习到非极大值抑制(NMS)中,我们提出了一种新的广义 Fuzzy-NMS 模块,以实现对候选边界框的更细致过滤,通过模糊分类方法将体积和聚类密度相结合,优化适当的抑制阈值并减少 NMS 过程中的不确定性,通过对 KITTI 和 - 通过近似对角化为长序列的状态空间模型提高鲁棒性
在这篇论文中,我们提出了一个用于解决机器学习中的病态对角化问题的通用、稳定的 “扰动 - 然后对角化” (PTD) 方法,并基于此方法引入了 S4-PTD 和 S5-PTD 模型。通过对不同初始化方案的传递函数进行理论分析,我们证明了 S4 - 深度学习模型实现的血细胞分类
人体血液细胞分类对于疾病识别至关重要,通过使用卷积神经网络和迁移学习技术,本研究提出了一种新的基于卷积神经网络的框架,成功实现了对血液细胞的准确分类,并在所采用的数据集上达到了 99.91% 的准确率。
- 更高效的手动审核自动转录的表格数据
本文介绍如何将机器学习应用于历史数据的转录,其中高精度的方法仍需人工查证与修正,因此作者提出了更高效的评审流程,并以挪威 1950 年的人口普查数据为例,验证了一种自动化转录与人工修正相结合的方法。
- 基于直接学习的深度脉冲神经网络综述
本文综述了基于直接学习的深度脉冲神经网络研究,重点讨论了提高准确性、提高效率和利用时间动态的方法,并进一步分类和总结。同时,展望了未来研究中可能面临的挑战和趋势。
- 稀疏神经网络学习激活函数
本研究提出了一种新的方法,即 Sparse Activation Function Search(SAFS),结合了调整稀疏网络激活函数和独立的超参数优化(HPO)来提高稀疏神经网络的预测准确率。通过在多个数据集和深度神经网络模型上进行实验 - 图像字幕有时传达的信息超过其所能看到的图像
本研究探讨了图像字幕生成器将原始图像信息转化为文本时信息的损失程度,并通过对比使用标准图像分类器和仅使用文本分类器进行的灾难图像分类任务的结果来评估了几种图像字幕生成模型,表明在某些情况下文本分类器可以比标准图像分类器实现更高的准确度,同时 - 稀疏 Iso-FLOP 变换以最大化训练效率
通过引入一种基于单一超参数的稀疏 Iso-FLOP 变换族,本文试图使用稀疏性提高密集模型的准确性和 FLOP 效率,实现不更改任何训练超参数而在计算机视觉和自然语言处理任务中获得显著的提高,例如 ResNet-18 在 ImageNet - 低位视觉 Transformer 的无振荡量化
研究了量化感知训练中的重量振荡,发现可学习缩放因子会加剧重量振荡,并因此提出三种技术有效地减轻重量振荡并在 Imagenet 上显著提高了准确率。
- 自编码器重建图像中消除轮廓误差的方法
本文提出了一种基于自监督双网络的方法来生成图像的边缘信息,并使用扩张算法差分地消除重建图像中的误差来提高重建图像的准确性,从而分离异物和噪声,使其在更实际的场景中得到可视化。