- 大规模分布式深度学习的资源分配和工作负载调度研究
大规模分布式深度学习中,资源分配和工作负载调度的高效策略是实现高性能深度学习的关键。本综述调查了 2019 年至 2024 年间关于大规模分布式深度学习的资源分配和工作负载调度策略的文献,并通过探索不同类型的资源、调度粒度和性能目标,以及实 - CVPRUVEB:面向实际水下视频增强的大规模基准和基线
通过构建第一个大规模高分辨率的水下视频增强基准 (UVEB),我们能够更有效地促进水下视觉的发展,并且我们提出的第一个有监督的水下视频增强方法 UVE-Net 通过充分利用水下视频的降质信息,实现了更好的视频增强效果。
- MM基于两阶段生成模型的电信软件系统测试代码生成
提出了一种自动化测试生成的框架,利用历史电信网络数据训练时间序列生成模型来生成测试案例输入数据,并结合自然语言编写的测试描述生成测试脚本,从而有效地生成全面的测试案例数据输入和有用的测试代码。
- 应用于野火科学的大规模非光滑最大熵模型的高效一阶算法
介绍了一种优化算法,有效地训练了大规模、非光滑的最大熵模型,通过考虑西部美国的野火数据集,结果显示与野火发生的物理模型和以往统计分析结果相符,并且性能超过现有算法一个数量级。
- 批量大小不变的 Adam
提出了一种批量大小不变的 Adam 版本,用于大规模分布式环境,在这种环境中,小批量被分割成微批次并在工作节点之间分配。
- LiGNN:领英上的图神经网络
LinkedIn 在大规模部署的 Graph Neural Networks Framework 中提出了 LiGNN,通过一系列算法改进如图形结构设计、冷启动解决方案和邻居采样优化,实现了在 LinkedIn 图表上大规模训练的速度提升, - 规模化即是所需:利用 JAX 加速强化学习训练自动驾驶强化策略
通过大规模强化学习应用于自动驾驶,分析了在实验规模逐渐扩大时由此产生的策略表现以及对策略表现的主要影响因素。
- AAAIGLOP:学习全局分区和局部构建以实时解决大规模路由问题
提出了 GLOP(Global and Local Optimization Policies)方法,该方法使用分层框架有效扩展到大规模路由问题,同时利用导数和非导数神经启发式算法以实现高性能和高可拓展性。
- 关于精简数据集的多样性和真实性:一种高效的数据集精简范式
用于大规模真实数据集的数据集压缩方法 RDED 能够在短短 7 分钟内将完整的 ImageNet-1K 压缩为每类只有 10 张图像的小型数据集,并在单个 RTX-4090 GPU 上以 42% 的 Top-1 精度实现了显著的性能提升(而 - 大规模多机器人组装规划的自主制造
移动自主机器人在制造过程中具有改革性潜力。我们提出了一个完整的算法堆栈,用于解决制造中的挑战,并能够在几分钟内为成千上万个零部件设计复杂的装配计划。
- EMNLP大规模多角度意见总结与多样化评论子集
本研究提出了 SUBSUMM,一种用于大规模多角度意见摘要的监督式摘要框架,实验证明该框架能够从数百个输入的评论中生成正面、负面和结论性摘要,并且深度分析表明评论子集的先进选择和两阶段训练方案对提高摘要性能至关重要。
- Qwen-VL: 具备多功能能力的前沿大规模视觉语言模型
介绍了 Qwen-VL 系列,这是一组大规模视觉语言模型,旨在感知和理解文本和图像,以提高多模态人工智能的性能。
- 大规模云数据库的实时工作负载模式分析
阿里巴巴负载挖掘器 (AWM) 是一种用于发现复杂大规模工作负载中工作负载模式的实时系统,通过对用户请求记录的 SQL 查询模式进行编码和发现,基于发现的模式优化查询处理,在云数据库上优化查询处理。
- WWW大规模推荐系统的个性化兴趣探索
该研究提出了一种适用于大规模推荐系统的探索框架,通过探索用户利益与行为,缓解推荐流程中普遍存在的 “热门内容” 问题,提高探索视频推荐中的优化率。
- 基于推荐系统的大规模多目标优化方法
本研究提出了 VMORS 方法,将 100,000 到 500,000 维度的大规模多目标优化问题转化成适于推荐系统处理的问题,使用 Thompson 抽样推荐最适合不同用户(解决方案)的进化方向(项目),以在可接受的时间内在非常大的搜索空 - 大规模知识图谱嵌入的硬件不相关计算
开发了一种基于 DASK、Pytorch Lightning 和 Hugging Face 框架的知识图谱嵌入计算框架,能够以硬件无关的方式计算大规模知识图谱的嵌入表示,并提供了一个开源版本的框架以及一个具有超过 11.4B 参数的预训练模 - 从小做起,追求卓越:对大规模知识图谱嵌入的超参数优化
本论文讨论知识图谱嵌入模型的超参数优化方法,提出了一种高效的多保真度算法 GraSH,并在大规模知识图谱上实现了最新的成果。
- CVPR大规模三维语义分割中的野外多视角聚合学习
本文提出了一种端到端可训练的多视角聚合模型,利用 3D 点的视角优势,从任意位置拍摄的图像中合并特征,将标准 2D 和 3D 网络相结合,不需要着色、上网格或真实深度图,我们在 S3DIS 和 KITTI-360 数据集上取得了新的最佳效果 - ECCVMegBA:基于 GPU 的大规模束调整分布式库
本文介绍了 MegBA—— 一种基于 GPU 的分布式大规模相机捆绑优化库,相较于目前现有的 Ceres、RootBA 和 DeepLM 等大规模相机捆绑优化库,它在一些大规模测试中表现出了更高的性能,可以提供巨大的聚合内存,可以自动划分大 - 大规模深度学习优化:综述
本文概述了在大规模深度学习中如何优化模型的准确性和效率,讨论了优化中使用的算法、大批量训练中出现的泛化差距问题,并回顾了最新的解决通信负担和减少内存占用的策略。