- DiffusionDet: 目标检测的扩散模型
DiffusionDet 是一种将对象检测作为从噪声框到对象框的去噪扩散过程的新框架,其在训练阶段通过对象框从地面实况框扩散到随机分布,模型学习将该过程反转,在推断阶段,模型以渐进方式将一组随机生成框细化为输出结果,使用随机框作为对象候选框 - DiffRoll:基于扩散的生成式音乐转录技术及无监督预训练能力
提出了一种新的生成方法,DiffRoll,来处理自动音乐转录问题。它将 AMT 视为有条件的生成任务,从其理论上训练模型来从纯高斯噪声中生成逼真的钢琴卷,因此 DiffRoll 不需要分类器,可在仅提供钢琴卷的不配对数据集上训练。实验证明, - 上下文生成检索
提出了一种上下文生成检索模型,其在生成式检索模型的解码步骤中使用上下文嵌入,结合了双编码器方法和生成式检索模型的优点,显示出比只有普通嵌入的情况更高的性能。
- 基于生成模型的时间序列异常检测
本研究提出了一种基于数据驱动生成方法的交通拥堵异常检测框架,通过对多变量时间序列的分布进行学习,结合空间 - 时间信息进行聚类和核密度估计,能够在无监督和稀疏的环境下实现交通异常的检测和分类,并在合成数据集上得到了显著的性能提升。
- ACL将多跳问题回答建模为单序列预测
本文提出了一种简单而具有解释性的生成方法 (PathFid),通过显式建模推理过程来解决多跳问题的答案生成。通过线性化支持段落、关键句子和事实答案的分层推理路径,将问题作为单一序列预测任务,并编码跨段落互动以促进复杂推理。实验证明,Path - WWW金融因果关系提取的生成方法
该论文探讨了一种利用编码器 - 解码器框架和指针网络实现因果关系提取的生成式方法,并使用金融领域的因果数据集进行实验,结果表现出了极高的性能水平。
- ACL基于知识库指导的预训练和同义词感知微调的生成式生物医学实体链接
本文提出了一种新的方法来解决生物医学实体链接的问题,利用基于知识库的预训练和微调,以及多种类似词的构建方式来进行模型训练,这种方法在多项实验中都取得了最优结果。
- 生成式设计构思:自然语言生成方法
提出了一种使用最新的预训练语言模型探索知识驱动设计生成的方法,具体通过改进的预训练变压器 fine-tuning 并结合美国专利数据库来实现。该方法不仅能使用简洁易懂的语言生成想法,而且能够以可控的知识距离将目标设计与外部知识来源进行综合综 - ACL谨言慎行:显式生成隐含常识知识以产生响应
本文提出 Think-Before-Speaking 方法,将隐含的常识知识外部化来生成回复,实验结果表明该方法在多个评价指标上表现出色。
- 基于结构性因果模型的实例相关标签噪声学习
本文提出了一种利用结构因果模型的生成方法来应对标签噪声的问题,证明了合理地建模示例有助于识别标签噪声转移矩阵,从而带来更好的分类器,该方法在合成和真实世界的标签噪声数据集上均优于所有最先进的方法。
- 知识库问答的生成式关系链接
通过对关系链接进行生成式建模,并将目标知识库的结构化数据注入到序列生成模型中,进一步生成由参数 - 关系对组成的结构化输出,从而大幅提高与已有方法的比较结果,同时使用更简单的模型,可轻松适应不同的知识库。
- 生成式零样本学习用于三维点云语义分割
本研究提出了一种新的基于生成模型的零样本学习方法,能够处理包括分类和语义分割在内的三维数据,在 ModelNet40 数据集上表现良好,并在 S3DIS,ScanNet 和 SemanticKITTI 数据集上进行了验证。
- ACL利用槽位描述进行零样本跨域对话状态跟踪
本论文提出一种增强型随机生成方法,利用自我注意力编码器对对话和插槽进行编码,然后以自回归的方式生成插槽值,并融入信息捕捉模板,实现跨领域知识转移,实验证明该方法在多领域体系下显著提高了当前的零样本跨领域任务对话状态跟踪技术。
- ICCV生成可转移的有针对性扰动
该论文提出了一种新的生成方法 —— 高度可转移的有目标扰动(TTP),该方法不依赖于源或目标域标签,能够自适应地合成特定于给定输入的扰动,并且在广泛的攻击设置下始终表现优异。
- ICML通过文本生成统一视觉语言任务
该研究提出了一个统一框架,通过相同的语言建模目标,在单个体系结构中学习不同的任务,实现视频图像理解、语言推理和标签生成等领域的应用。通过在多个基准测试中的表现,这种生成方法(在单个统一的体系结构下)显示出了与最先进的特定任务模型相当的性能, - SIGIR少样本生成式对话查询重写
该研究提出了一种用于会话查询重写的 few-shot 生成方法,使用规则和自监督学习生成弱监督数据,并使用 GPT-2 进行优化以重写会话查询,在 TREC Conversational Assistance Track 上,我们的弱监督 - 基于堆叠对抗网络的零样本素描图像检索
本论文提出了一种基于生成对抗网络和连体网络的零样本草图图像检索方法,该方法在标准 ZSL 和广义 ZSL 设置下均获得了显著的提高。
- 一种用于语音增强的循环变分自编码器
本文提出一种基于递归变分自编码器(RVAE)的语音增强的生成方法, 通过与非负矩阵分解噪声模型相结合,仅使用干净的语音信号训练深度生成语音模型, 并在测试时微调 RVAE 的编码器以近似给出噪声语音观测下的潜在变量的分布。与基于前馈完全连接 - ICCV一种视频修复的内部学习方法
提出了一种新颖的视频修复算法,通过 Deep Image Prior(DIP)推出的卷积网络,同时生成缺失的外观和光流信息,并采用一种无需先验训练的生成式方法进行修复。该方法具有良好的视觉效果和长期一致性。
- Scan2Mesh: 从非结构化的范围扫描到 3D 网格
Scan2Mesh 是一种基于数据驱动的生成方法,其通过神经网络实现将非结构化和可能不完整的 3D 扫描转换成结构化的 3D 网格表示,并生成了类似于手工建模软件创建的 CAD 模型的网格表示。