- AM-SORT:多目标跟踪的可调整运动预测器与历史轨迹嵌入
通过引入适应性的运动预测器,即 AM-SORT,将卡尔曼滤波器替换为转换器架构,我们提出了一种基于运动的多目标跟踪方法,从而解决了在涉及非线性运动和遮挡情景时估计未来物体位置的限制。AM-SORT 通过历史轨迹嵌入到转换器中,提取一系列边界 - 通过上下文元图强化学习实现具有高通用性和少样本适应性的随机动态电力调度
提出了一种新颖的上下文元图增强学习 (Meta-GRL) 方法,用于高度通用的多阶段最优调度策略,通过引入更通用的上下文马尔可夫决策过程 (MDP) 和可扩展的图表示来实现更通用的多阶段随机电力调度建模,经过足够的离线学习后,该方法可以快速 - 文本区域多信息感知网络用于场景文本检测
该论文介绍了一种称为区域多信息感知模块(RMIPM)的即插即用模块,可以增强基于分割的算法的检测性能,多种类型的信息可以感知到场景文本区域,实验证明与最先进的算法相比,该方法具有可比较的性能。
- MM推荐系统的机器反学习:一种洞察
该论文通过研究机器忘记(MUL)在推荐系统中的应用,讨论了适应性、个性化、隐私和偏见等挑战,并提出了类似传统模型的 MUL 通过根据用户偏好和伦理考量动态调整系统知识的方法。论文批判性地审查了 MUL 的基础知识、实际应用和算法透明度等挑战 - 边缘设备上可靠和自适应分布式推理的流体动力学 DNNs
分布推理是边缘上高效 DNN 推理的一种流行方法。本文引入了专为分布推理设计的流体动态 DNNs(Fluid DyDNNs),通过使用新颖的嵌套增量训练算法来提高其子网络的独立和组合操作能力,从而增强系统的可靠性和适应性。在嵌入式 Arm - SPFormer:使用超像素表示增强视觉 Transformer
SPFormer 是一种新颖的视觉变换器,增强了超像素表示,通过对图像内容进行自适应划分,有效捕捉了复杂的细节,并在各种基准测试中表现出优异性能。其独特的可解释性结构提供了对模型内部过程的洞察,显著提高了 SPFormer 的稳健性。
- GPT-4V (ision) 对分布偏移适应程度如何进行初步研究
深入研究了 GPT-4V 在各种数据分布转变下的适应性和泛化能力,并评估了其在动态环境中的鲁棒性,在 13 个不同领域的数据集上进行了零 - shot 泛化实验,探讨了它在受控数据扰动下的适应能力,并研究了上下文学习作为提高其适应性的工具的 - 分离增强:用于文本到图像扩散模型的组合调优
通过引入两种新目标函数(Separate loss 和 Enhance loss),减少物体遮挡区域重叠和最大化注意力分数,本研究提出了一个与传统方法不同的图文生成模型,通过关键参数的微调提高了其可扩展性和通用性,在图像真实性、文本 - 图 - 朝自由度开放的任务解决
通过引入 "Diffusion for Open-ended Goals"(DOG)框架来提升具有人工智能的体验智能体(如机器人)的能力,以处理未预见的多方面、动态的、缺乏明确定义的的开放式任务目标,并展示了 DOG 在迷宫导航和机器人控制 - 认知视角下的持续学习基准评估
连续学习模型的认知能力和评价度量方法不匹配,为了解决这些问题,提出了将模型认知能力和评价度量整合成统一评价范式的方法,通过实验证明目前没有方法能够满足所有要求,对模型性能的影响因素进行了讨论并提供了改进连续学习模型的指导。
- SDSRA:一种用于有效策略学习的基于技能驱动和技能重新组合的算法
引入一种新的算法 - 技能驱动的技能重组算法 (SDSRA),该算法显著提高了在强化学习任务中实现最大熵效率的效果。通过将基于技能的策略集成到稳健的 Actor-Critic 框架中,SDSRA 在各种复杂和多样化的基准中展示出卓越的适应性 - 全球声音的和谐:文化感知模型对增强内容审查的贡献
大规模内容审核面临着在评估内容时考虑本地文化差异的挑战。该研究探讨了如何通过适应本地理解细微差别来解决这个问题,培训大型语言模型以捕捉跨地理区域的交流细节,并在关于何为冒犯内容的文化和社会变化时提供解释。研究发现,基于广泛的媒体数据集进行培 - 了解您的受众:LLM 是否适应不同的年龄和教育水平?
对四种最先进的大型语言模型(商业和开源)回答科学问题并针对不同年龄组和教育水平的读者群体进行可读性评估,发现它们的可读性存在较大差异。研究结果表明,目前的大型语言模型在适应不同受众时的可读性有待提高,强调了在教育场景中增强大型语言模型的适应 - PIPE:并行推理通过后训练量化残差扩展集成
通过将浮点操作转换为较低位宽格式,基于残差误差扩展、群组稀疏性和集成逼近的 PIPE 量化方法,在每个基准应用、架构和位宽上实现卓越性能,从深度神经网络到自然语言处理,从 int8 到三进制量化,并满足数据隐私需求。
- 相似文档模板匹配算法
该研究提出了一种全面的医疗文件验证方法,通过模板提取、比较和欺诈检测等先进技术的整合,有效解决了医疗文件验证中的模板提取、比较、欺诈检测和适应性问题。
- 关于电子健康记录共享基础模型的适应性的多中心研究
通过将基础模型应用于医疗保健领域,可使人工智能的开发更具规模性和经济效益。医疗记录的结构化基础模型在数百万患者的记录上训练,表现出了较少训练标签的性能提升以及对分布变化的改进鲁棒性。本研究基于多中心数据研究探讨了这种基础模型的适应性,结果显 - 风险规避的批次主动逆向奖励设计
通过批处理逐渐优化查询的可能奖励函数的概率分布,在保证安全性的同时,提高效率和准确性,以及适应处理未知特征并对重要的 AI 模型进行调整。
- 面向四足机器人的连续强化学习
四足机器人的持续学习方案探讨了在不同环境中顺序训练并评估其性能的能力,以洞察前向和后向技能传递的程度,以及机器人对先前获得技能的遗忘程度,以期提高其在真实场景中的适应性和性能。
- 基于视觉信息的人群仿真模型研究 —— 基于时空卷积网络
本文提出了一种基于视觉信息的众包模拟模型(VID),该模型通过使用先前的社会视觉信息和个体的运动数据来预测行人下一时间步的速度。通过测试该模型在具有不同几何结构的三个公共行人运动数据集上,结果显示该模型在适应不同几何情景方面的能力得到了提升 - EMNLPChatGPT 增强的多阶段预训练用于多场景多领域对话摘要
我们提出了一种特定于多场景多领域对话摘要的新型预训练模型,它采用多阶段预训练策略来缩小预训练目标和微调目标之间的差距。实验结果表明,我们的预训练模型在完全微调、零样本和少样本设置下,显著优于先前的最先进模型。