generalizability | BriefGPT

关键词generalizability

搜索结果 - 233

Sym-Q：符号回归的自适应序贯决策
Symbolic Q-network (Sym-Q) 是一种基于强化学习的模型，重新定义了符号回归作为一种顺序决策任务，通过奖励信号对表达式的匹配精度进行优化，从而在发现潜在表达式方面具有独特的能力和效率。
PDF5 months ago
隐式逐步优化中动量在平滑目标函数中的作用
随机梯度下降 (SGD) 与动量在收敛性和泛化能力方面具有快速收敛和优秀的表现，但缺乏理论解释。本文证明了 SGD 与动量使目标函数平滑化，平滑程度由学习率、批量大小、动量因子、随机梯度的方差和梯度范数的上界决定。这一理论发现揭示了动量为何
PDF5 months ago
基于短语引导的风格转移的单域通用目标检测
单域广义目标检测提高模型泛化能力，只使用来自单一源域的数据进行训练。本文提出了一种基于短语定位的风格转移方法（PGST）来实现此任务。通过定义文本提示并利用已有模型学习目标域的风格，并将源域的视觉特征转移到目标域。最终，我们使用这些风格转移
PDF5 months ago
AAAI破解 Transformer 模型：任务特定的上下文归因承诺在不进行预训练 LLM 微调的情况下提供改进的泛化能力
本研究提出了一种使用任务特定的上下文归因来维持模型的泛化能力并提高下游任务性能的框架。在实验证实中，该模型在三个数据集上展示了卓越的准确性和泛化性能。
PDF5 months ago
利用辅助学习和特定任务适应性增强分子性质预测
既训练的图神经网络（Pretrained Graph Neural Networks）广泛应用于各种分子属性预测任务，但由于传统的精调对目标任务的训练会导致较差的泛化性能，因此本文探讨了通过与多个辅助任务共同训练的方式来适应目标任务的预训练
PDF5 months ago
基于对象驱动的一次性细调文本到图像扩散与原型嵌入
通过使用单一输入图像和对象特定感兴趣区域，以目标驱动的方式解决了大规模文本 - 图像生成模型面临的新物体、单次拍摄等挑战，通过改进模型初始化、引入特征化正则化以及对象特定损失等方法，提高了生成模型的泛化性能和生成图像的准确性，实验证明我们的
PDF5 months ago
从 GPT-4 到 Gemini 和更远：通过四种方式评估 MLLMs 的一般化能力、可靠性和因果关系
通过对专有和开源多模态大语言模型的定性研究，本文旨在增强对最近的 MLLM 在一般化、可信度和因果推理能力方面与广大公众期望之间差距的理解，主要关注文本、代码、图像和视频四个模态，最终目标是提高 MLLM 透明度，发现 14 个实证性发现以
PDF5 months ago
人工智能在临床黑素瘤诊断中的应用：一项前瞻性多中心研究的洞见
通过与皮肤科医生在一个具有多个不同医院和摄像机配置、罕见黑素瘤亚型和特殊解剖部位的异质测试集上进行比较，我们评估了 “全数据扩展”（ADAE）算法在黑素瘤检测中的诊断准确性，并提高了算法的泛化能力。与皮肤科医生相比，AI 在异质数据集上表现
PDF5 months ago
零構人體多人舞蹈生成
提出了一种名为 MultiDance-Zero 的零样本框架，用于合成符合任意多人和背景的视频，同时准确地遵循动作姿势，通过深入回溯获取最终清晰图像的背景和关键点，从而进一步提高生成视频的时序一致性。
PDF5 months ago
探究焦虑的生理特征的普适性
使用机器学习技术检测焦虑和压力的效果已得到证明，本研究通过对心电图 (ECG) 和电脑皮肤反应 (EDA) 信号提取的特征进行统计回归分析以及跨数据集验证的方法，第一次对焦虑和高度兴奋情绪之间的关系进行了跨数据集评估，发现模型可能更多地识别
PDF5 months ago
适配器与混合层融合增强预训练语言模型对文本分类的对抗性鲁棒性
该研究通过优化 fine-tuned adapters 并使用混合数据训练神经网络，提出了一种在实践中更实用的对抗训练机制，从而在提高模型的泛化性和预测性能的同时避免了传统对抗训练方法中存在的性能下降和计算成本较高的问题。
PDF6 months ago
学习快速捷径：关于语言模型中自然语言理解的误导承诺
大型语言模型在自然语言处理领域取得了重要的性能提升，然而近期的研究发现，这些模型在执行任务时往往使用了捷径，导致性能看起来得到了提升，却缺乏泛化能力。这一现象给大型语言模型的自然语言理解评估带来了挑战。本文对该领域的相关研究进行了简明调查，
PDF6 months ago
RIDGE：医学图像分割模型的再现性、完整性、可靠性、泛化能力及效率评估
介绍了 RIDec 列表，这是一种评估基于深度学习的医学图像分割模型可重复性、完整性、可靠性、泛化能力和效率的框架，该检查列表为研究人员提供指导，以提高他们工作的质量和透明度，确保分割模型不仅在科学上可靠，而且在临床上有意义。
PDF6 months ago
揭示自动化作文评分的图景：准确性、公正性和普适性的综合研究
我们的研究旨在揭示自动论文评分（AES）模型的准确性、公平性和泛化能力之间的复杂关系，为开发真实教育中的有效 AES 模型提供实用洞察。
PDF6 months ago
一种新的深度隐藏物理模型泛化框架
这项工作介绍了一种对隐藏物理模型的新型增强方法，可以泛化处理系统输入、参数和领域的变化，并展示了该方法在系统发现方面的潜力，可以帮助学习变化后的系统输入、参数和领域配置的隐藏物理。
PDF6 months ago
面部深度伪造检测器概述
本研究对最新的深度伪造检测器进行了广泛综述和分析，评估了它们在几个关键标准下的表现，并将它们分类成四个高水平组和十三个细粒度子组，进一步提供了关于影响检测器有效性的因素的深入实际见解。通过考察 16 个主要检测器在多种标准攻击场景下的普适性
PDF6 months ago
GenH2R: 通过可扩展模拟、演示和模仿学习可迁移的人机交接
本研究提出了 GenH2R 框架，用于学习通用的基于视觉的人到机器人交接技能，通过大规模的模拟环境和模仿学习的方法，实现了超过现有模拟器数量三个数量级的 H2R 交接模拟环境和高质量演示，通过 4D 模仿学习方法在模拟器和实际中取得了至少
PDF6 months ago
鲁棒随机下降展开网络
深度展开是一种新兴的学习优化方法，在可训练的神经网络中展开剪枝迭代算法的层，本文提出使用随机下降约束进行训练的深度展开结构，理论上证明了输出序列的收敛性和对未知问题的泛化能力，同时展示了对扰动和干扰具有鲁棒性的优势。
PDF6 months ago
AAAICR-SAM：曲率规则的锐度感知最小化
通过最小化最坏情况损失，使用单步梯度上升作为近似方法，我们提出了曲率正则化 SAM（CR-SAM），通过引入归一化的 Hessian 迹来准确测量训练和测试集上的损失曲线的曲率。我们的实证评估结果显示，CR-SAM 在各种数据集上持续提高了
PDF7 months ago
走向人类化感知：学习异构图中的结构因果模型
通过构建可理解的变量和包含高级因果发现技术的自动学习任务级因果关系，HG-SCM 可以模拟人类感知和决策过程。在实证数据集上与七种基线模型进行比较后，HG-SCM 取得了最高的平均性能排名和最小的标准差，充分证明了其在预测能力和推广性方面的
PDF7 months ago