- 自动驾驶中的鲁棒性感知 3D 物体检测:综述与展望
在现代自动驾驶领域中,感知系统是不可或缺的,它可以准确评估周围环境的状态,从而实现知情预测和规划。本研究重点研究了感知系统的鲁棒性、准确性和延迟性在实际情况下的评估,通过对基于摄像头、LiDAR 和多模态的 3D 物体检测算法进行全面评估, - Physio: 一种基于 LLM 的物理治疗顾问
本文介绍了一种名为 Physio 的基于聊天的应用程序,它可以进行初步诊断并引用可靠的健康来源来支持所提供的信息。此外,Physio 还可以借助外部知识数据库为症状缓解推荐康复锻炼和非处方药。通过结合这些功能,Physio 可以利用语言处理 - TigerBot:一个开放的多语言多任务 LLM
TigerBot 系列的大型语言模型通过在数据、训练算法、基础设施和应用工具方面的进一步发展,实现了有意义的性能提升,成为领先的学术和工业基准模型,并以开放源代码的方式向社区发布模型,以实现 LLM 领域中的实际应用。
- 深度学习时代的植物病害识别数据集:挑战与机遇
该研究提出了一种信息丰富的分类系统,用于描述可能的植物病害数据集,并提出了几个未来的方向,如创建挑战导向的数据集和在实际应用中部署深度学习,以实现良好的性能。此外,总结了已有的相关公共 RGB 图像数据集。
- 适用于通用图像恢复的 Prompt-In-Prompt 学习
基于 Prompt-In-Prompt 学习的图像修复模块(PIP)可以通过高效、易用的方式提升现有的图像修复模型,在图像去噪、去雨、去雾、去模糊和低光增强等多个任务上展现出卓越性能,且具备可解释性、灵活性和潜在的真实世界应用潜力。
- 扩展应答集编程与有理数
该论文旨在扩展 ASP 以处理非整数,通过使用有理数近似法实现了 reproducibility 和 declarativity,并提出了对应的 ASP-Core-2 标准的定义语义和实现。这一工作有望成为 ASP 语言更具表达力和多功能性 - 图上的大型语言模型:综合调查
通过对大型语言模型在图形上的应用的详细技术和潜在场景进行系统回顾,我们总结了大型语言模型在纯图、文本丰富图和文本配对图中的优缺点,并讨论了其在真实世界应用中的方法以及开源代码和基准数据集。最后,我们提出了这一快速发展领域的潜在未来研究方向。
- 基于深度学习的现实世界焦点叠加
使用 94 个高分辨率的原始图像序列进行训练,该研究首次引入了适用于现实世界应用的焦点叠加的深度学习算法,且在处理长时间序列时与现有商业解决方案相媲美,同时对噪声更具容忍度。
- 使用 GPU Tensor Cores 的可扩展张量学习 CP 分解
我们提出了 Exascale-Tensor,这是一种压缩基于张量分解的框架,用于支持超大规模张量分解,并通过实验证明了其可扩展性和有效性。
- 了解邻居:智能家居中有效的传感器数据人体活动识别的基于图的方法
通过学习传感器之间的显式共同触发关系,我们提出了一种新颖的图导向神经网络方法,该方法通过将离散的输入传感器测量映射到特征空间,应用注意机制和节点嵌入的分层汇聚,在 CASAS 数据集上进行实验证明了我们提出的方法在智能家居人体活动识别方面优 - 面向现实感知系统的基于物理模型的数据去噪
通过加入物理约束,我们设计了一种基于物理的去噪模型,能够提高实际应用中的传感器性能,而无需准确的干净数据作为训练依据,从而实现对成本较低的嘈杂传感器数据的实时去噪处理,达到与高成本替代方法相近的结果,提供更准确的传感器系统所需的高效、经济的 - 斯坦福 - ORB: 三维物体逆向渲染实际世界基准
我们引入了 Stanford-ORB,一个新的真实世界的 3D 物体逆向渲染基准。我们通过提供一个新的真实世界的数据集,并使用该数据集建立了首个全面的真实世界评估基准,评估对象逆向渲染任务在野外场景的性能,并比较了各种现有方法的表现。
- ReLM:利用语言模型提升化学反应预测
利用语言模型将化学知识编码进图神经网络,提高了现实世界化学反应预测的准确性。
- 安全体育场:统一的安全强化学习基准
这篇论文介绍了一个名为 Safety-Gymnasium 的环境套件和一个名为 Safe Policy Optimization 的算法库,其中包含了 16 种最先进的安全强化学习算法,旨在促进安全性能的评估和比较,并推动强化学习在更安全、 - 模型基强化学习的多时间步模型
模型驱动的强化学习中,通过使用多时间步目标训练一步预测模型来解决一步预测误差在轨迹增长时的累积问题,实验证明指数衰减权重能显著提高长期视野得分,尤其在嘈杂环境下,展示了该方法在实际应用中的潜力。
- 零尾图像恢复中的经典反卷积和特征提取的应用
借助深度学习和经典迭代退卷积算法,本文提出了一种新颖的非盲目退卷积方法,通过预训练网络提取输入图像的深度特征,并结合迭代的 Richardson-Lucy 退卷积步骤,最终通过零样本优化过程获得高质量重建图像,加速重建并减少对计算资源的需求 - 新闻故事理解中的视频时间轴建模
本研究提出了一个新颖的问题,即视频时间轴建模,目的是通过一组与特定主题相关的视频创建与视频相关的时间轴,从而促进对所讲述故事的内容和结构的理解。通过构建一个现实的基准数据集 YouTube-News-Timeline,并提出了一套量化指标来 - 循环时序修正图网络
用递归神经网络对时态图的邻居进行汇聚,以获取来自每个节点的完整邻居信息,从而提供具有卓越的理论表达能力和在真实应用中的最先进性能,其中在一个真实世界的电子商务数据集上,相比于现有模型的 2 层模型,平均精确度显著提高了 9.6%。
- 图中社区检测的综述
复杂网络中的社区结构及社区检测方法的综述,涵盖了图的算法和现实应用领域。
- 学习基于评分的人类辅助灵巧抓取基元
提出了一种新的人机辅助灵巧抓取任务,该任务旨在训练一个用于控制机器人手指来辅助用户抓取物体的策略。通过提出 Grasping Gradient Field(GraspGF)和基于历史的剩余策略,解决了用户意图多样性和物体几何形状的挑战,实验