- DEPTH:分层预训练的议程教育
深度是一个编码器 - 解码器模型,通过在预训练过程中引入面向语篇的目标来提高语言模型在语篇层面上的理解能力。通过结合层次化的句子表示和两个目标:句子重排和跨度破坏,深度能够更快地学习语义和语篇级别的表示,从而拓展了 T5 在语篇能力方面的表 - DiffuseTrace:一种透明且灵活的潜在扩散模型水印方案
通过使用 DiffuseTrace 技术,我们可以在所有生成的图像中嵌入无形的水印,以便进行未来的语义检测,而不会损害图像质量。
- 基于 CNN 编码器 - 解码器框架的压缩图像字幕生成
我们的项目旨在通过开发结合卷积神经网络(CNN)和编码 - 解码模型的自动图像字幕架构来解决图像字幕的挑战。我们还进行了性能比较,研究了多种预训练 CNN 模型的性能变化,并探索了频率正则化技术在压缩 “AlexNet” 和 “Effici - ACL基于融合实例解码的实体消歧
提出了一种编码器 - 解码器模型来消除实体歧义,通过更详细的实体描述来改进基准性能,取得了强大而稳健的性能,尤其在 ZELDA 基准上比 GENRE 提高了 +1.5%,并在 GERBIL 基准的全流程实体链接中比 EntQA 提高了 +1 - AAAI存在即混沌:基于不确定性考虑的增强 3D 人体动作预测
通过考虑不确定性,提出了一种新颖的计算高效的编码 - 解码模型,能够学习适合未来帧的适当特征,并且在数量和质量上具有明显的优势。
- 大规模综合监督的跨语言开放领域问答预训练
基于自我监督方法的编码器 - 解码器模型在跨语言问答中表现出色,利用维基百科的跨语言链接结构,综合生成监督信号,提高了检索和回答生成的性能,相比于其他方法,包括机器翻译,CLASS 方法在监督和零资源语言适配等方面均取得更好的效果。
- 改进的数据生成方法以提升资产配置能力:适用于固定收益资产的合成数据集方法
提出了一种生成针对资产配置方法和构建固定收益领域投资组合的合成数据集的新方法,该方法通过改进 CorrGAN 模型生成合成相关矩阵,并提出了一种编码器 - 解码器模型,在给定相关矩阵的条件下采样附加数据,从而促进对不同资产中的资产配置方法进 - 针对土耳其语的翻译对齐句子嵌入
由于在土耳其方面训练句子向量所需的高质量数据集有限,我们提出了一种训练方法和程序来开发句子向量模型,其核心思想是通过两个连续阶段对预训练的编码 - 解码模型进行微调,其中第一个阶段涉及将嵌入空间与翻译对齐。通过这种对齐,主模型的才能能够更好 - 通过多路径长期船舶轨迹预测构建更安全的海上环境
利用自动识别系统(Automatic Identification System,AIS)数据和编码器 - 解码器模型,本研究预测了船只轨迹,进而提高船只安全和避免船只与鲸类碰撞,证实了地理数据工程和轨迹预测模型在保护海洋生物物种方面的潜力 - 基于编码器 - 解码器的长短期记忆(LSTM)视频字幕模型
本文展示了使用编码 - 解码模型来实现视频数据到文本字幕的多对多映射的方法,并讨论了数据预处理、模型构建和训练。通过对数据集的不同分割使用 2 元 BLEU 分数来评估字幕的准确性。通过特定的输出示例字幕表明模型在视频时间维度上具有通用性。 - 通过逐帧离散特征的自监督提取人体动作结构
本文提出了一种编码器 - 解码器模型,用于自我监督方式提取以逐帧离散特征表示的人体动作的结构。
- 学习得到的局部注意力图用于合成血管分割
用 T2 磁共振成像合成大脑 Willis 环的主要脑动脉分割的编码器 - 解码器模型,其根据 T2 磁共振成像提取相关信息,与现有模型相比,产生具有更高分辨率的 Willis 环血管分割。
- PressureTransferNet:基于人类属性引导的动态地面压力剖面转移的压力映射三维模拟
提供了一种新方法 PressureTransferNet,用于使用地面压力信息进行人体活动识别(HAR)。该方法利用不同个体的现有压力数据生成特定活动的特定身体动态地面压力图。通过以源压力图和目标人体属性向量作为输入的编码器 - 解码器模型 - KDD将多模态信号在超复数空间中融合,实现科学文献的极端抽象文本摘要(TL;DR)
本文提供了 mTLDR 数据集和 mTLDRgen 模型,用于实现基于多种输入模态的极端抽象文本摘要。该模型使用双重融合的超复杂 Transformer 和 Wasserstein-Riemann 编码器 Transformer 来在超复杂 - 使用 TiDE 进行长期时间序列预测的稠密编码器
提出了一种基于多层感知器的编码器 - 解码器模型 TiDE,用于长期时间序列预测,实现了线性模型的简单和速度,同时还能处理协变量和非线性依赖关系。在理论上,我们证明了最简单的线性模型在某些假设下可以实现近似最优的误差率。在实验上,我们展示了 - 视频活动定位的边界去噪
提出了一种称为 DenoiseLoc 的编码器 - 解码器模型,从去噪的角度研究了视频活动定位问题,通过边界去噪来预测具有精确边界的活动,能够提高准确性和收敛速度,并在多个视频活动理解任务上取得了最先进的性能。
- 基于连续帧提取潜在特征拼接实现视频中准确实时的息肉检测
该研究提出一种集成时间信息的有效特征级联方法,用于改善基于卷积神经网络的结构在视频直肠镜筛查中对息肉的自动检测,实验结果表明,该方法可提高自动检测的整体性能。
- ACL面向视觉问答中生成答案和解释的统一模型
提出了一种基于多任务学习的统一模型(UMAE)来解决现有的视觉问答系统中存在的回答和解释分离的问题,其方法涉及在训练数据集中添加人工提示令牌,并在各种 VQA 相关任务上进行细调,实验证明该模型在准确性、解释性和领域外表现等方面均得到了明显 - HanoiT: 通过选择性上下文增强上下文感知翻译
本文提出了一种使用层间选择机制来筛选和优化长文档上下文的端到端编码器 - 解码器模型,以改善神经机器翻译的质量。 实验证明,该模型通过软选择机制在四组数据集上明显优于以前的模型。
- AAAI使用艺术家信息生成音乐播放列表标题
本文提出了一种使用艺人 ID 生成播放列表标题的编码器 - 解码器模型,结合时间分割方法来提高效果,该方法显著提高了单词重叠、语义相关性和多样性。