- ExpCLIP: 通过语义对齐桥接文本和面部表情
使用自然语言作为情感提示,并结合大规模语言模型构建的数据集,以及基于 CLIP 的模型实现文本和面部表情的语义对齐,从而实现表情丰富且可控制的面部动画生成。
- QUEST: 车辆基础设施协同感知的查询流
合作感知可以通过提供额外视点和扩大感知范围有效增强个体感知性能。在这篇论文中,我们提出了查询合作的概念,以实现可解释的实例级灵活特征交互。通过引入 QUEST 框架,使查询流在智能体之间传递,通过融合实现跨智能体的查询交互,对于个体不知道的 - 基于 Transformers 语言模型的 TransDis 方法自动评估中文语言的发散思维能力
本研究利用基于 Transformer 的语言模型,提出了一种名为 TransDis 的评分系统,可对汉语中 Alternative Uses Task (AUT) 的回应提供有效的创意性(质量)和灵活性(多样性)得分,该系统可成为用于测量 - 一站式:通用 LoRA 用于参数高效微调
GLoRA 是一种用于通用参数节约的微调任务的高级方法。它使用广义提示模块来优化预训练模型权重和调整中间激活,并通过采用可伸缩的、模块化的逐层结构搜索来促进高效参数适应,从而实现强大的转移学习、少样本学习和领域泛化能力。
- 深度学习中超网络的简要评述
Hypernetworks, or hypernets in short, are neural networks that generate weights for another neural network, allowing for - 基于大型语言模型的机器人任务规划与有向图结构表示
该研究提出了一种将人类专业知识和 LLM 结合的任务规划方法,通过逐步分解任务并生成任务树来减少每个任务的计划量,并设计了一种策略来分离机器任务计划,从而使任务计划过程更加灵活。
- 差分扩散:赋予每个像素以其强度
提出一种新的框架,使用户能够为每个图像碎片自定义更改量,增强了现代扩散模型的灵活性和表达能力,且无需模型训练或微调,可直接应用于现有模型,量化和定性结果表明,该方法实现了更好的可控性,并可产生现有模型无法达到的结果。
- 基于函数马尔可夫转移算子的深度随机过程
本文介绍了一种新的随机过程类别 Markov 神经过程 (MNPs),由神经参数化的 Markov 转移算子所构造,证明这些转移算子可以保留 SPs 的交换性和一致性,因此提供了对神经过程 (NPs) 框架的迭代构造的灵活性和表现力,实验表 - 利用数据驱动的需求预测的能源集成优化随机模型预测控制
本文提出了一种基于 “随机模型预测控制器” 的方法来针对电力和热需求的不确定性,应用高斯过程构建历史数据的需求预测模型,采用情景法从产生的预测模型中进行多步需求轨迹抽样,并在模拟能源中心模型和真实建筑需求数据上验证了所提出的预测器和随机控制 - AAAI具有概率群的分布鲁棒优化
本文提出了一种新的概率组成员身份的框架 PG-DRO,以解决现代机器学习模型易受特定样本组内平均相关性的干扰的问题,通过考虑软组成员身份而不是硬组注释,该框架可以灵活生成组概率,从而更好地适应样本组成员身份模糊的情况,并在图像分类和自然语言 - 深度强化学习设计规划灵活移动微电网
本文探讨了为游牧社区设计和规划移动多能源供应系统的策略,并采用深度强化学习(DRL)作为设计和规划问题的解决方案,结果表明游牧能源系统在技术和经济上都是可行的,特别是在考虑灵活性时,对可用基线值的潜在改进高达 25%,67%和 76%。
- 语义角色标注遇上定义建模:利用自然语言描述谓词 - 论元结构
本文提出了一种新的方法,利用定义建模来介绍一种广义的 SRL 形式,即使用自然语言定义而非离散标签来描述谓词论元结构。经过实验证明, 这种灵活的模型不会牺牲性能。
- 法律文本中的多粒度论据挖掘
探索使用多个粒度层次的法律论证挖掘,使用 Longformer 模型进行令牌级别的分类来更准确地识别法律论证的元素,并提供更大的灵活性来分析法律文本并获得更多有见地的信息。
- 排列不变智能体的最小神经网络模型
通过限制输入的排列和尺寸,构建了一种可以灵活应对变化,具有新型 ANN 模型的结构,该模型能够在多个控制问题上表现出 ANN 所缺乏的灵活性,并且可以处理输入索引的快速排列,证明了其在很大程度上具有优越性。
- 通过遍历权重空间的功能不变路径来构建灵活的机器学习系统
通过构建具有功能等效性的网络的路径连接集合,将神经网络的权重空间视为弯曲的黎曼流形并沿着功能不变路径将网络移动,同时寻找满足次要目标的网络,通过路径抽样算法,能够训练具有数百万权重参数的神经网络来学习一系列分类任务而不会损失性能,同时适应包 - ICML深度最近邻实现的超范围检测
本文研究使用非参数最近邻距离方法进行开放世界中一类重要任务:Out-of-distribution 检测,不同于先前的研究,该方法不施加任何分布假设,因此具有更强的灵活性和普适性,在多个基准测试中证明了其有效性,并且相对强基线的 Mahal - Tevatron: 高效灵活的密集检索工具包
本文介绍了 Tevatron,一个用于密集检索的工具包,其优化了效率、灵活性和代码的简明性。Tevatron 为密集检索提供了标准化的流程,包括文本处理、模型训练、语料库 / 查询编码和搜索等。作者展示了 Tevatron 在多个 IR 和 - AAAIAutoInit: 神经网络分析信号保持的权重初始化
本文介绍了一种自适应不同神经网络结构的权重初始化算法 AutoInit,该算法通过跟踪信号传播时的均值和方差,适当地调整每层的权重,从而避免信号爆炸或消失。实验证明,AutoInit 在各种激活函数、正则化、学习率和归一化设置下,都能提高卷 - CVPR基于无监督域自适应的语义分割的集成蒸馏再思考
提出了一种灵活的 “ensemble-distillation 框架”,用于执行基于语义分割的无监督域自适应任务,允许任意组成集合的成员,同时保持其优越性能。通过在 GTA5 到 Cityscapes 和 SYNTHIA 到 Citysca - AAAISMIL: 大量缺失模态的多模态学习
本文研究多模态学习中缺失模态的问题,提出一种基于贝叶斯元学习的方法 SMIL,可同时实现训练及测试数据中缺失模态的灵活性及训练数据大量缺失模态时的高效性,实验证明 SMIL 方法在 MM-IMDb、CMU-MOSI 和 avMNIST 三个