- PromptIQA:通过提示提升无参考图片质量评估的性能和泛化能力
通过使用图像 - 得分对(ISP)来引导预测,并通过数据增强策略训练,我们提出了 PromptIQA 方法来适应各种多样化的 IQA 任务需求,并具有更高的性能和更好的泛化能力。
- 通过调整临床环境中皮肤病状况分布的差异来缩小人工智能泛化差距
近期,人工智能算法在从临床照片中分类皮肤病方面取得了巨大进展。然而,我们对这些算法在现实环境下的鲁棒性了解甚少,而很多因素可能导致其普适性的丧失。通过理解和克服这些限制,我们可以开发出可以帮助在各种临床环境下诊断皮肤病的具有普适性的人工智能 - ICLR基础模型的少样本调整研究:多任务微调方法
基金模型的有效适应新任务,特别是那些有限标签的任务,一直是一个开放性问题,缺乏理论理解。本研究通过理论分析和大量实证证据,研究多任务微调方法的理论验证和任务选择算法,为基金模型在缺少充足标签的新任务上的有效适应提供新的视角。
- 去偏离线表示学习用于快速在线适应非平稳动态
发展能够适应非平稳环境的策略对于现实强化学习应用至关重要。本文介绍了一种名为 DORA 的新方法,通过信息瓶颈原理实现了快速在线自适应,并在实验评估中展示了其在动力学编码和性能方面明显优于现有基线模型。
- 策略学习在缺乏支持下的离散的 RL 中的应用
通过解决源模拟和目标环境之间的动力学差异问题,提出一种简单但有效的方法,通过偏向和扩展源支持以减轻支持缺陷,以适应大的动力学差异,从而在目标领域中制定出有效的策略。
- X-LoRA:低秩适配器专家的混合,用于蛋白质力学和设计中的大型语言模型的灵活框架
基于 LoRA 适应性技术的深层令牌级方法,应用于大型语言模型,通过隐藏状态动态混合适应层,实现不同能力的组合,适用于各种现有的大型语言模型,主要聚焦于生物材料分析和蛋白质力学设计。
- ACL跨语言迁移的软提示调整:少即是多
通过插入可学习的嵌入或软提示到预训练语言模型 (PLM) 的输入层,Soft Prompt Tuning (SPT) 是一种将 PLM 调适到特定任务的参数高效方法,无需修改其参数。本文研究了 SPT 在跨语言传递中的潜力,并通过冻结模型参 - 基于上下文感知探索的快速端对端适应
我们提出了基于历史上下文的同伴识别奖励,这个奖励根据学习智能体对同伴的行为模式识别得有多好来奖励智能体。我们的方法在多样的测试平台上进行评估,包括竞争性(Kuhn Poker)、合作性(PO-Overcooked)或混合(Predator- - 基于深度学习的位置不敏感的自适应降雨量预测
我们提出了一种自适应深度学习框架,可以为任何地点的降雨预测提供解决方案,并通过使用深度神经网络对巴黎、洛杉矶和东京的降雨预测进行适应后,取得了 43.51%、5.09% 和 38.62% 的改进。
- AHAM: 适应、帮助、询问、建模 -- 为文献挖掘提取 LLMs
利用 AHAM 方法和度量指引领域相关的 BERTopic 主题建模框架的适应,通过 LLaMa2 生成式语言模型,通过与领域专家的合作设计提示,以 LLM 为指导,在文献挖掘中生成主题定义。该方法在文献发现的科学论文语料库上进行了评估,并 - 利用镜面下降实现快速适应的多功能损失几何元学习
利用从相关任务中提取的任务不变的先验知识,元学习是一种原则性的框架,能够在数据记录有限时有效地学习新任务。使用预条件器来处理权重更新的收敛问题是元学习中的一个基本挑战。现有方法通过增强每个任务的训练过程来处理这个挑战。然而,简单的线性预条件 - 缩小差距:将最先进的 U-Net 模型推广至撒哈拉以南非洲人群
通过对不同数据集进行训练,本研究发现,在低质量数据环境下,将模型预训练于高质量神经影像数据,并在较小规模低质量数据上进行微调,可以显著提高肿瘤分割模型的性能。
- AAAILaViP: 语言驱动的视觉提示
通过语言引导的视觉提示方法,我们使视觉语言模型的视觉编码器适应下游任务,从而提高适应性和泛化性能。
- 计算机视觉中背景学习的灵活视觉提示
通过对现代视频对象分割技术的可视化上下文学习方法进行改进,我们提出了一种用于图像分割的上下文学习方法,并通过在支持集大小和不同分割数据集上进行评估,验证了该方法在效果上超越现有技术,并在包含训练集未遇到的类别的数据上表现出色,另外我们还提出 - 进化储层用于元强化学习
通过进化和发展之间的相互作用,本文提出了一种计算模型来研究能够使生物适应环境的机制,并使用元强化学习作为计算框架。通过进化递归神经网络架构的超参数而非权重值来生成的水库,可以促进复杂任务的学习、局部可观测任务的解决、促进运动任务学习中的振荡 - AdaTyper:自适应语义列类型检测
AdaTyper 使用混合类型预测器,结合基于规则和轻量级机器学习模型,通过弱监督方法和最少的人工反馈,在推理时针对新的语义类型和数据分布变化进行自适应,能显著提高新型和已有类型的 f1-score。
- 视觉语言模型中的主动提示学习
基于现有观察,我们提出了一个名为 PCB 的新型主动学习框架,对预训练视觉语言模型(VLMs)进行自适应,以解决标签获取成本高的问题,并在七个真实数据集上实验证明,在性能上超越了传统的主动学习和随机取样方法。
- 通过概率模型为基础的元强化学习实现数据高效的任务泛化
PACOH-RL 是一种基于模型的元强化学习算法,用于有效地适应控制策略对变化的动力学。它通过元学习动力学模型的先验知识来实现对新动力学的快速适应,同时利用正则化和认知不确定性量化来引导探索和数据收集,从而在数据有限的情况下实现正向传递,适 - 数据流中概念漂移局部性的全面分析
在线学习中,适应漂移数据流是一个重要挑战。本文提出了一种基于局部性和尺度的概念漂移分类方法,并构建了一套 2760 个基准问题,用于评估不同难度级别的漂移检测器。通过对 9 种前沿漂移检测器的综合评估,揭示了它们的优势和弱点,并为未来的研究 - 即时适应:单机器人部署的行为调节
现实世界的机器人需要在训练中未曾见过的情况下适应,本文研究了在部署过程中如何通过采用多样化的先前学习行为库来实时适应新奇场景的问题,提出了一种基于预训练行为的感知价值来选择和调整行为的 ROAM 机制,该机制在测试时的单个情节内完成自适应过