- 骑士不确定性游戏
游戏作为 AI 的试验平台,在 20 世纪后期和 21 世纪初被视为 AI 的研究重点,但取得的成功并未实现通用智能,因此需要能够应对游戏规则的不确定性以实现 AGI 发展和智能机器建设。
- 以细微之处增强基于 LLM 的人机交互,以提升多样性意识
通过利用大规模语言模型的能力,本文提出了一套针对多样化感知的自主对话系统,该系统适应不同人群和个体,考虑到背景、个性、年龄、性别和文化等因素,对话过程由系统预设的知识库架构引导,并利用语言模型生成多样化感知的句子,通过提供精心设计的提示,融 - MetaFollower: 适应性个性化自动车辆跟随
通过元学习,我们提出了一种可适应个性化车辆跟驰的 MetaFollower 框架,结合长短期记忆网络(LSTM)和智能驾驶模型(IDM),能够准确捕捉和模拟车辆跟驰行为的细微动态,并考虑到个体驾驶者的独特驾驶风格。与常规的自适应巡航控制系统 - 探索构建语言特定的 LLM 的设计选择
通过对已有大语言模型进行适应和扩展,我们研究了构建语言专属的大语言模型。我们通过系统实验探究基础模型选择、词汇扩展和持续微调等设计选择对适应后的大语言模型的效率(编码同样数量信息所需的词汇数)和最终任务性能的影响。我们发现,(1)适应前的初 - FlexLoc: 零样本传感器视角不变性目标定位的条件神经网络与分布式多模态传感器
采用条件神经网络将节点视角信息注入定位管道以适应于未见的视角,显著提高多视图室内跟踪中定位准确性的 FlexLoc 技术。
- 场景和方法用于情境化的自然语言解释
利用大型语言模型,针对不同用户情境生成自然语言解释,并通过定量评估展示适应程度。我们收集了一个基准数据集,包括 100 个解释对象,每个对象都与针对三个不同受众类型(如教育工作者、学生和专业人员)的解释配对,使我们能够评估解释在特定信息需求 - 踏出并探索:关于使用增量数据进行热启动训练
通过知识整合和获取(CKCA)算法,我们提出了适用于深度学习应用的连续模型改进方法,旨在在不损害先前知识的前提下,更好地适应新数据,并采用两个新组件:特征规范化(FeatReg)和自适应知识蒸馏(AdaKD)。在 ImageNet 数据集上 - 机器心理学:将操作条件反射与非公理推理系统结合,推进人工智能普适性研究
这篇论文介绍了一种称为机器心理学的跨学科框架,将操作学习心理学原理与特定的人工智能模型非公理推理系统(NARS)相结合,以增强通用人工智能(AGI)研究。该框架的核心前提是适应对于生物和人工智能同样重要,可以通过操作条件性原理来理解。该研究 - CompetEvo: 走向基于竞争的形态进化
通过竞争进化 (CompetEvo),能够使代理体在多智能体竞争场景中进化出满足战斗需求的适宜设计和策略,相较于固定形态的代理体,在战斗场景中获得优势,并展现出异形对峙时产生的惊人和印象深刻行为。
- 基于自适应瓶颈和双对抗解码器的通用时间序列异常检测器
提出了一种基于多领域数据预训练的时间序列异常检测通用模型 DADA,通过灵活选择信息瓶颈和明确区分正常与异常序列,在多个目标数据集上取得了竞争性甚至优秀的结果。
- 无文本多域图形预训练:走向图形基础模型
MDGPT 是一个用于图学习的多领域图预训练和适应性框架,通过多领域知识的利用来解决不同领域的图数据对齐和适应的问题,并在多个公开数据集上进行了实验验证,超越了先前的研究成果 37.9%。
- 无处不玩:基于时态逻辑的游戏环境独立方法在机器人足球中的应用
通过引入基于时态逻辑的方法,使机器人的行为和目标能够适应环境语义,实现在非结构化环境中进行足球比赛的能力。
- ICLR通过视觉领域提示生成适应分布转变
提出一种在测试时使用少量无标签数据进行模型适应以应对分布偏移的方法,通过利用预训练模型和源域的相关信息从有限数据中提取领域知识,并通过建立知识库、领域特定提示生成器、引导模块、领域感知对比损失和元学习等技术实现领域知识的提取。在多个基准测试 - MedAdapter:大规模语言模型在医疗推理中的高效测试时适应
MedAdapter 是一种针对生物医学应用的大型语言模型(LLMs)进行测试时间适应的统一后期适配器,通过仅针对小型适配器进行微调来有效地适应原始模型,进而在生物医学推理中实现了平均性能提高 25.48% 和 11.31%,无需大量计算资 - CVPR探索视觉提示在多模态大型语言模型中的可转移性
通过 Transferable Visual Prompting (TVP) 这一新方法,在只对一个模型进行训练的情况下,有效改善多样化的 Multimodal Large Language Models (MLLMs) 的性能,以提高其在 - 在新情境中使用时适应分段任何事物模型
通过利用用户交互和构建的掩码生成伪标签,我们提出了一种在实时使用过程中可以调整 Segment Anything Model (SAM) 的框架,从而显著减小了在新领域或对象类型中进行交互式分割时的失效率。我们的方法在 FR_20@85 和 - Few-shot 分类中的平坦性改善骨干通用化
通过对骨干网络的培训,实现深度神经网络在新任务中的快速适应,从而提高其泛化能力。
- 数据驱动的任务预测与知识驱动的人机协作规划
一个名为 DaTAPlan 的框架扩展了之前的工作,使用低层次学习模型(LLM)来预测高级任务,使得一个代理人和人类能够协同合作通过经典规划系统计算出的低级行动共同实现这些任务,还能自适应地适应人类行为结果和偏好的意外变化,通过在真实的仿真 - 动态环境中的进化机器人改进了拉马克遗传
本研究探讨了拉马克系统在进化机器人技术中的整合,并与传统的达尔文模型在各种环境中进行比较。通过采用拉马克原理,在机器人继承学习特性的基础上,结合没有继承的达尔文学习,在动态环境下研究适应性。我们的研究在六种不同的环境设置中进行,证明了拉马克 - TTT-KD: 基于基础模型的知识蒸馏进行测试时训练用于 3D 语义分割
提出了第一个用于 3D 语义分割的测试时训练方法 TTT-KD,通过模拟知识蒸馏,适应测试时的分布转变,从而提高在分布相似和分布不同的测试样本上的性能。