- 自然视觉图像重建的脑启发解码器
本文介绍一种基于深度学习的神经网络结构,通过脑电波等脑活动信号重构视觉图像,将感受野特性结合到损失函数中,有效地提高了视觉重构的精度和效果
- 使用增量构建 - 推断 - 近似范式进行 MPE 推断
本文提出了一种基于增量建立 - 推断 - 近似(IBIA)框架的算法,用于近似求解贝叶斯网络中最大可能解(MPE)的推断问题,该算法无需搜索,运行时间竞争力强,可在 117 个测试基准中的 100 个得到有效结果,精度与分支限界搜索相当。
- ACL神经机器翻译预训练的复制行为研究
本文研究了使用预训练语言模型来初始化神经机器翻译模型的好处,在发现预训练对机器翻译的副作用时,提出了一种名为 “copying penalty” 的方法来控制解码过程中的复制行为,实验证明,该方法可以提高预训练的机器翻译模型的翻译性能。
- 计算极化码权重分布的确定性算法
该文研究极化码的重量分布问题,提出了一种基于解码路径的递归计算极化码重量分布的算法,并探讨了极化码的混合因子和自同构群等性质,从而实现在合理时间内计算长度为 128 的极化码的重量分布。
- EMNLP将本地翻译机制融入非自回归翻译中
本研究介绍了一种新的局部自回归翻译机制,将其应用于非自回归翻译模型中,以捕捉目标输出的局部依赖关系。同时,设计出一种高效的合并算法来对齐和合并输出序列。我们在 5 个翻译任务上进行了实证结果,表明相比 CMLM,我们的方法在更少的译码迭代次 - 插入变压器:通过插入操作实现灵活序列生成
本研究提出插入变换器,是基于插入操作的迭代,部分自回归模型,可在解码期间在序列中的任何位置插入标记,这种灵活性提供了多种性能优势,特别是在 WMT 2014 英德机器翻译任务中表现出色,成功恢复原始 Transformer 的性能,同时只需 - CVPR零样本目标身份推断在视觉搜索中的应用
本文提出了 InferNet 模型来通过观察人眼的运动轨迹进行目标推断,并且证明了该模型在实验中表现优秀,甚至在没有物体特异性训练的情况下也能完成任务。
- ACL神经机器翻译的过去与未来建模
我们提出了一种新的机制来将源信息分成已翻译的过去内容和未翻译的未来内容,并使用两个附加的循环层对其进行建模,从而为神经机器翻译系统提供已翻译和未翻译内容的知识,实验结果表明,该方法显著改善了中英、德英和英德翻译任务的翻译性能,具体来说,该模 - 基于短语的强制解码改进神经机器翻译
本研究提出了一种将传统 SMT 模型与神经机器翻译相结合的方法,从而提高翻译质量。该方法利用现有的基于短语的 SMT 模型计算基于短语的解码成本,并将其用于重新排列 n 个最佳 NMT 输出。研究表明,利用强制解码成本对 NMT 输出进行排 - 非线性信息瓶颈
该研究提出了一种方法,通过神经网络来实现将任意分布的离散和 / 或连续变量进行信息瓶颈编码和解码,并允许使用非线性映射,该方法通过一种新颖非参数上界来实现最大信息提取,相较于其他方法在多个真实数据集上表现更好。
- AAAI由统计机器翻译指导的神经机器翻译
本文提出了将 SMT 模型融入 NMT 框架,通过辅助分类器和门函数来结合 SMT 的推荐和 NMT 的生成,从而提高中英翻译的性能。实验结果表明,该方法在多个测试集上均显著优于现有的 NMT 和 SMT 系统。
- 通过向量化每秒解码数十亿个整数
本文介绍了一种基于 SIMD 指令的新型向量化方案,名为 SIMD-BP128,可以加速整数数组编码和解码,并提高节省存储空间。同时,还提出了一种名为 SIMD-FastPFOR 的新型向量化压缩方案,具有很好的压缩性能和解压速度。