- 腔镜手术视频中的动作识别
在这项研究中,我们设计并评估了一个 CNN-RNN 架构以及一个定制的训练 - 推理框架,以应对腹腔镜手术行动识别中的挑战,包括动作持续时间变异、烟雾、血液积聚、快速相机运动、器官移动、物体阻挡等相关内容扭曲,以及不同照明和视角引起的手术场 - 通过程序生成探索人类计划的层次结构
人类的行为具有层次性,通过将任务分解为子任务或将抽象行为分解为具体行为而产生。本文通过观察人们生成具有明确层次结构的行动序列的程序,探究人们如何形成层次结构的计划,并发现人类在计划时对效用最大化和最小描述长度两个指标敏感,但同时具有超越最小 - 语法性别对分布语义的影响:因果视角
语义对于语言中的性别确定有多大影响是现代语言学和认知科学中一个研究热点领域。本研究提出了一个新的因果图模型,共同表示名词的语法性别、意义和形容词选择之间的相互作用。研究结果表明,虽然名词的性别会影响修饰它们的形容词,但在控制名词的意义后,语 - Controlgym:用于基准化强化学习算法的大规模安全关键控制环境
我们介绍了 controlgym,这是一个包含 36 个安全关键的工业控制设置和 10 个基于无穷维偏微分方程的控制问题的库。我们将 controlgym 集成在 OpenAI Gym/Gymnasium (Gym) 框架中,允许直接应用标 - 多个认知用户的频谱感知联合检测算法
利用频谱感知技术进行多用户频谱感知,提高虚警概率和检测概率,从而有效地探测闲置时段的频谱资源,优化信息资源的重新分配。
- 仅加 $π$!用于理解日常生活活动的姿势引发视频 Transformer
PI-ViT is a Pose Induced Video Transformer that augments RGB representations learned by video transformers with 2D and 3 - 将深度生成模型与极值理论相结合的合成危害模拟:一种多元且空间协调的方法
气候风险和复合灾害的分布对于了解气候风险和指导适应政策至关重要。本研究使用生成对抗网络(GANs)模拟了孟加拉湾的极值风速、显著波高和总降水量,结合传统的极值理论进行尾部推断,为气候风险评估和灾害应对提供了有效的方法。
- Hy-Tracker:一种提升高光谱视频物体跟踪效率和准确性的新框架
提出一种桥接高光谱数据和最先进目标检测方法的新颖框架 Hy-Tracker,以利用 YOLOv7 在高光谱视频中进行目标跟踪,并通过引入跟踪器和 Kalman-Filter 处理尺度变化和遮挡挑战,实现了对目标的准确跟踪。
- 利用功能磁共振成像时间序列的沉降图嵌入进行轻度认知障碍检测
通过使用脑部网络的静息态功能磁共振成像技术,本研究采用复发图方法对 100 名受试者的脑部网络进行分析,并通过自编码器得出低维特征嵌入,得到 93% 的分类准确率,证明了该方法的潜力。
- Compact3D: 压缩高斯散射辐射场模型与矢量量化
用基于 k-means 算法的简单向量量化方法和类似于游程编码的方法来减少 3D 高斯雨滴方法的存储成本,并在质量下降很小的情况下减少存储成本近 20 倍。
- 面向不确定环境的通用网络流量预测自适应框架
利用时间序列分析为动态分配移动网络流量预测模型的新框架,通过选择性地使用学习行为相对于当前研究具有超过 50%的性能改进,并在无需对单个细胞具有先验知识的情况下超过传统方法;该框架通过无监督聚类识别独特趋势和季节模式,然后在每个聚类中应用监 - mPLUG-PaperOwl: 多模态大型语言模型的科学图解析
通过强化多模态图表分析能力,我们构建了多模态图表理解数据集 M-Paper 并引入了控制信号‘outline’,通过与先进的多模态语言模型的全面实验,证明了在我们的数据集上进行训练能够展现更强大的科学图表理解性能.
- TransCORALNet: 供应链信用评估冷启动的双流 Transformer CORAL 网络
本文提出了一种解释性的双流转换 CORAL 网络(TransCORALNet),用于分段行业和冷启动问题下的供应链信用评估。该模型旨在为具有有限历史数据的新供应链借款人提供准确的信用评估预测。
- 元先验:自适应逆问题求解的元学习
基于深度神经网络和元学习的方法,实现在缺少标准数据的情况下,用少量样本进行特定任务的有效训练,并在图像处理和磁共振成像等多个领域展示了方法的有效性。
- DiffCAD: 基于弱监督的概率 CAD 模型检索和对齐
基于 CAD 模型基元从 RGB 图像中感知 3D 结构可以有效地实现基于三维物体的场景表示,本文提出了 DiffCAD,这是一种第一个弱监督的条件生成方法,可以从 RGB 图像中检索和对齐 CAD 模型,通过扩散学习隐式概率模型来捕捉 C - 选择费马距离的参数:导航几何和噪声
研究了理论和模拟方法来选择 Fermat 距离的参数,该距离在机器学习任务中没有直接可用的自然距离时或通过扩展数据集的几何和统计特性来改善欧氏距离的结果时被证明是一个有用的工具。
- ASIST 的姿态估计和跟踪
Aircraft Ship Integrated Secure and Traverse (ASIST) 航空器船舶综合安全遍历系统中的 Pose Estimation and Tracking for ASIST (PETA) 研究了一种 - 多视图超声心动图中先天心脏病的自动解读
多视角超声心动图自动分析方法,采用深度可分离卷积网络结构对先天性心脏病进行诊断和分类,不需要关键帧选择和视角注释。
- 预测建模的预登记
通过研究预测建模中出现的再现性和泛化性的担忧,我们探讨引入先注册的可能性和潜在好处。虽然预测建模取得了显著进展,涵盖了核心机器学习任务和各种科学应用,但是忽视的背景因素、基于数据的决策和意外重复使用测试数据等挑战引发了对结果完整性的质疑。为 - 在在线学生辩论中使用明确回复作为协调机制
对话中的语言协调、显式回复、对话结构、人际协调和层次主题模型进行研究。