- 搜索中的多意图属性感知文本匹配
通过多意图建模、属性感知编码和意图感知匹配等方法,我们提出了多意图属性感知匹配模型,旨在探索文本匹配系统中属性的有效性,以提高搜索查询与候选项的匹配效果。
- 文本到图像扩散模型的语义引导调整
最近的文本到图像 (T2I) 扩散模型的进展在生成具有零样本泛化能力的高质量图像方面取得了令人印象深刻的成功。然而,当前的模型在紧密遵循提示语义方面存在困难,通常会误代或忽视特定属性。为了解决这个问题,我们提出了一种简单的、无需训练的方法, - 基于无需调优的增强逆控制的一致图像编辑
提出了一种名为 Tuning-free Inversion-enhanced Control (TIC) 的新方法,通过直接关联反演过程和采样过程的特征来缓解 DDIM 重建中的不一致性,实现准确的重建和内容一致性编辑。通过实验证明,该方法 - 具有共享用户嵌入的交叉属性矩阵分解模型
通过将深度学习技术应用于推荐系统,本文提出了一种改良的跨属性矩阵因子分解模型,该模型不仅考虑了用户与物品之间的交互,还跨越了相关属性,有效解决了冷启动问题。实验证明,在高数据稀疏性的情况下,该模型在 Movielens 和 Pinteres - 使用属性本地化野外物体
提出了一种名为 LOWA 的新方法,它基于视觉语言的训练策略,使用 transformer 架构,旨在解决当前基于开放词汇对象检测器的不足,用户不仅可以检测对象,还可以通过属性定位对象,并在 OVAD 基准测试和 VAW 数据集方面进行了评 - 加强上下文在区域词对齐中的作用以进行目标检测
本研究探索语言上下文对目标检测的影响,并提出了一种增强上下文作用的方法,特别是属性等语境,以提高区域 - 词对齐性能。该方法在区域 - 词预训练方面超越了最先进技术,并通过文本 - 区域检索和短语命名分析展示了属性敏感模型的细粒度实用性。
- MM使用具有重叠支持的频率选择模型的点云几何和属性上采样
提出一种联合几何和属性信息进行点云上采样的频率选择性上采样(FSU)方法,在几何模型采样和属性模型评估两个步骤中利用块式覆盖支持来提高点云的表面详细度和视觉效果,并在实验证明,在误差和颜色 PSNR 等方面优于其他常规方案。
- 分析性评估中的分配方案:申请人为中心的整体性或属性为中心的分段式?
本文研究了在众多应用场景中面临的难题:如何评估和选出申请人。作者提出了基于属性的评估和分配策略,并通过理论和实验方法进行了比较和分析,确定了两种方法之间的权衡和影响因素。
- AAAIDUET:对比零样学习的跨模态语义基础
本论文提出了一种基于 Transformer 的 DUET 方法,通过自我监督的多模态学习范式,整合了预训练语言模型(PLMs)的潜在语义知识,实现零样本学习并取得了最先进的性能表现。
- ACL神经机器翻译中准确的目标属性预测
本研究探讨在神经机器翻译中,针对某些属性(如单词大小写或性别)控制训练数据,以预测目标单词和属性,能够使翻译更忠实于这些属性的训练数据分布。通过在大写输入翻译和性别预测两个任务上的实验结果,证明该策略有助于在测试中镜像训练数据分布,并促进大 - ACLSocAoG: 对话中社交关系推断的增量图解析
该研究提出了一种基于 And-or 图的模型,名为 SocAoG,用于从对话中推断社交关系,包括从语义对话预测属性和关系、基于相关属性更新社交关系以及基于人际社交关系更新个体属性,并在 DialogRE 和 MovieGraph 上进行了实 - ACLCompGuessWhat?!:基于感知的语言学习的多任务评估框架
提出了一个评估框架 GROLLA,用于属性引导的基于场景的语言学习,其中包括三个子任务,以及一个用于评估学习潜在表征质量的新数据集 CompGuessWhat?!。结果显示,现有的模型学到了表达对象属性的表征的能力不足,并且它们没有学会足够 - EMNLPVideo2Commonsense: 生成通识描述以丰富视频字幕
通过生成视频常识描述(包括解释动机、影响和描述人物特点)的方法,结合开放式视频常识问答,可以提升通过字幕来理解视频的能力。
- Hotel2vec:使用自监督学习学习属性感知酒店嵌入
论文提出了一种利用神经网络构建酒店向量表征的框架,该框架可以综合利用用户点击信息、酒店属性信息、设施信息以及地理信息来训练模型,生成可解释的表征,提高推荐系统的准确性以及其他应用的表现,并成功地解决了历史点击信息不足的问题。
- EMNLP利用结构和语义对属性导向的方面情感发现进行加强
我们提出了 Trait 这个无监督概率模型,它可以从文本中发现方面和情感并将它们与不同的属性关联起来。我们证明通过显式地整合属性,Trait 明显优于现有方法,并生成符合我们直觉的属性简介,同时产生更大的语义凝聚力。
- EMNLP情感分类中属性表示与注入的反思
通过使用 BiLSTM 与注意力分类器限制了基础模型并专注于如何在嵌入、编码、注意力和分类器四个方面注入属性,将属性表示为块状重要性权重矩阵,并通过实验表明,我们的方法在标准方法之上取得了显著的改进,并且在注入属性方面,注意机制是最差的位置 - 多重语义下走向少样本学习的初步探索
本研究关注于使用额外语义信息以便在少量样本时进行图像分类,研究表明组合多种语义信息可以带来更好的效果。
- NIPSTzK Flow - 条件生成模型
TzK 是一个基于条件概率流模型的算法,利用附加信息学习目标观测数据流形的紧密条件先验分布,支持高效逼近任意数据样本分布,通过缺失数据用先验样本替代来支持监督、非监督和半监督学习,并支持联合 MNIST 和 Omniglot 数据集的最小预 - ECCV增强属性的有选择性零样本分类
通过使用人工定义和自动发现到的残差属性,提出了一种基于选择性零样本分类器,通过在人工定义属性的子空间中进行预测并使用定义和残差属性来度量预测置信度,以解决分类器在选择分类场景中做出可疑预测的问题,并在多个基准测试中证明了其优异的表现。
- AAAI互补推荐的深度风格匹配
本文使用孪生卷积神经网络大力提取商品名中的关键属性,以此学习人类的样式兼容性,实现自动化的搭配推荐。