我们提出了一种有效的方法来在文本子空间中探索目标嵌入,借鉴了自我表现性特性,并提出了一种有效的选择策略来确定文本子空间的基向量。实验评估表明,所学习的嵌入不仅能够忠实地重构输入图像,还能显著改善其与新的输入文本提示的对齐性。此外,我们观察到在文本子空间中优化能够显著提高对初始词的鲁棒性,从而放宽了用户需要输入最相关初始词的约束。我们的方法为个性化文本到图像生成的更高效的表示学习打开了大门。
Jun, 2024
扩散模型和表示学习之间的相互作用进行了综述,包括数学基础、去噪网络架构和引导方法等方面,阐述了与扩散模型和表示学习相关的各种方法,并提出了对扩散模型和表示学习分类的综合概述以及现有关注点和潜在研究领域。
UniRec 是一个新颖的双向增强顺序推荐方法,利用序列一致性和物品频率来提高性能,特别是在表示不均匀序列和低频物品方面;与其他先进模型相比,在四个数据集上表现显著优越。
2D 图像生成建模,表示学习,Point-MAGE,点云数据,神经场表示。
我们研究了辅助学习任务对强化学习中的表示学习问题的影响,包括观测重建和潜在自预测,并研究它们如何与干扰项和观测函数在 MDP 中交互。
我们介绍了一个无监督的分离表示学习框架 (SE-VGAE),旨在生成以属性连接的多图形式的建筑布局,同时强调表示的分离性,通过优化数据集和实验,对探索基于图形数据的建筑设计表示空间进行了深入研究,该研究将无监督的分离表示学习应用于建筑布局图生成任务中。
通过多模态生理信号的 Siamese 架构,通过多尺度对比,学习抑郁症识别的多模态生理信号的表示学习框架,能够提高对刺激任务相关的语义表示的学习,且在公开数据集和自收集的多模态生理信号数据集上优于现有模型,具备对多模态时序下游任务的迁移能力。
基于观测数据的领域自适应问题,通过线性结构因果模型和表示学习方法,研究使用不变的协变量表示来解决概念漂移和改善目标预测的可行性,并通过在 Stiefel 流形上约束优化来证明大多数局部最优解与不变的线性子空间一致。通过验证实现方法和理论的三个真实数据集。
多标签分类的零样本学习方法,通过引入 CLIP-Decoder 的多模态表示学习,在零样本多标签分类任务中表现出前沿结果,相较于现有方法在性能上提升了 3.9%,在广义零样本多标签分类任务中提升了近 2.3%。
通过交替可识别机制(IEM)统一了交换性数据和因果结构学习的框架,提出了新的可识别性结果,并希望为因果表示学习的进一步研究铺平道路。