- 基于混合密度网络的随机电子器件的机器学习紧凑建模
通过机器学习中的混合密度网络(MDNs),创新的方法能够模拟电子设备的随机行为,从而克服传统建模技术的局限性。
- 多目标强化学习的超参数优化
对多目标强化学习中超参数优化的挑战进行了初步调查,并提出了一种系统性方法来解决这个问题,该方法能够显著提高多目标强化学习代理的性能,并鉴定了未来的研究机会。
- EMNLP定制参考语境的同时机器翻译
提出了一种通过修改参考文献并使用强化学习方法进行个性化训练的新方法,用于改进不同延迟下训练的同传机器翻译模型的性能。实验证明,该方法在固定和自适应策略下都取得了最先进的性能。
- MIS-AVioDD: 音频 - 视觉深度伪造检测的模态不变和特定表示
本文研究针对深度伪造技术的威胁,提出了一种在表征层面上辅助音频和视觉融合的多模态深度伪造检测方法,通过使用模态不变和特定的表 征确保保留表示真实或伪造内容的共同模式和每个模态的特定模式,实验证明该方法相比于单模态和多模态音 视频深度伪造检测 - 图补丁程序:通过测试时间增强减轻图神经网络中的度偏差
通过引入 GraphPatcher 框架,本文提出了一种具有测试时间增强功能的方法,旨在增强图神经网络对低度节点的泛化性能,并保留其在高度节点上的原有优势性能。
- 特征模仿的广泛影响:在金融、语音和生理领域的神经增强
神经网络权重的初始化在决定其性能方面起着关键作用。特征模仿网络(FINs)通过将权重初始化为逼近特定的闭式统计特征,为深度学习架构奠定了有希望的基础。本研究将 FINs 的适用性扩展到其他时间序列数据集,并在比特币价格预测、语音情感识别和慢 - 通过阅读理解调整大型语言模型
我们研究了如何在特定领域的语料库上继续进行预训练,发现在原始语料库上进行训练赋予了模型领域知识,但严重损害了其对问题回答的提示能力。借鉴人类通过阅读理解进行学习的灵感,我们提出了一种简单的方法,将原始语料库转化为阅读理解文本。每个原始文本都 - 一个关于扩展面向指令调整的大型多模态模型的实证研究
通过调整视觉指导,对开源大型多模态模型进行扩展研究,探索影响多模态和语言能力的变量,发现扩展模型能够提升性能,具有与整个模型微调相当的效果,并强调了提高图像分辨率和混合多模态语言数据对性能的重要性,有时视觉指导可以提高纯语言功能。
- ExMobileViT:移动视觉 Transformer 的轻量分类器扩展
提出了一种有效的结构,通过小的计算开销增强了适用于移动设备的视觉 Transformer 的性能。该结构通过存储来自早期注意力阶段的信息并在最终分类器中重复利用该信息解决了现有方案的弱点。
- 使用扩散去噪模型的医学图像分割回收训练策略
通过改进训练策略和提出一种新的回收方法,本文旨在解决现有扩散模型在图像分割中的性能问题,实验证明该方法在多个医学影像数据集上显著优于标准扩散训练,改善了性能并与非扩散型监督训练相媲美。
- ICCV适应你的教师:改进无样本连续学习的知识蒸馏
通过知识蒸馏作为正则化策略,我们研究了不需要示例的类别增量学习(CIL),以防止遗忘。我们引入了一种名为教师适应(TA)的方法,它与基于知识蒸馏的 CIL 方法无缝结合,并在多个不需要示例的 CIL 基准测试中持续提高性能。
- 长篇法律文件分类的大型语言模型提示链
本研究采用逐次引导策略,以解决复杂的法律文件分类问题,通过创建原始文档的简洁摘要,语义搜索相关示例文本和标注,利用上下文学习进行标签提示,证明逐次引导不仅可以提升零样本性能,还可以超越更大模型(如 ChatGPT 零样本)的微平均 F1 得 - IJCAI超级联邦学习中非独立同分布数据的超螺旋原型探索与一致聚合
HyperFed 提出了三个主要模块:超曲面原型 Tammes 初始化(HPTI)、超曲面原型学习(HPL)和一致聚合(CA),通过统一类原型和一致特征表示,以及减少不一致性对服务器的影响,有效提升非独立同分布数据下联邦学习性能。
- 情绪刺激:通过心理学为大型语言模型提升增强
大语言模型通过 EmotionPrompt 在情绪智能方面进行性能提升,取得了显著的成果,有助于人类与语言模型的跨学科知识交互。
- 一种基于场景的功能测试方法,用于提高深度神经网络性能
提出了一种基于情景的功能测试方法,通过迭代测试机器学习模型来诊断和治疗弱点,其中治疗包括使用转移学习技术进行再训练,实验结果表明该方法可以显著提高自动驾驶汽车感知系统的神经网络模型性能。
- 通过数据重要性学习改进检索增强的大型语言模型
通过修剪或重新权重检索语料库,可以提高大型语言模型的性能,无需进行进一步训练。在某些任务中,甚至允许较小的模型(例如 GPT-JT)通过搜索引擎 API 进行扩展,胜过未使用检索增强的 GPT-3.5。此外,我们展示了在实践中可以高效地计算 - 高效的多粒度知识重用在类增量分割中的应用
本文提出了一种高效利用多级特征融合 Class Incremental Semantic Segmentation 的方法,采用特征金字塔和 DEFY 模块等技术,使得在 PASCAL VOC 2012 和 ADE20K 数据集上的平均性能 - 使用视觉裁剪增强 BLIP 系模型对细节问题的回答
文章探讨将视觉切割技术用于改进最新的 BLIP 模型在细节问题上的表现,提出了三种测试方式,并进行了实验验证,结果表明,相较于人工切割,基于多模式嵌入的自动切割方法效果相似,同时发现对于零 - shot 模型和小边界框,效果更为显著,在 V - 视频抄袭检测的特征兼容性渐进式学习
本文提出了 Feature-Compatible Progressive Learning(FCPL)方法,以参加 Meta AI 视频相似性挑战赛(VSC22),然后通过实验结果证明该方法优于其他竞争者,并提供了相应代码。
- 通过迁移学习增强现实世界人机合作团队表现
本项研究将迁移学习集成在深度强化学习代理中,以此从专家那里传递知识提高人 - 机器协作质量。实验发现,这种方式不仅缩短了任务训练时间,而且明显提升了团队表现和主观感受,并能为透明和可解释的机器人行为设计提供有趣的见解。