- 构建另一个西班牙语字典,这次使用 GPT-4
我们提出了 “西班牙建筑事实性词典 2.0”(Spanish-BFF-2),作为第二代由人工智能生成的西班牙词典。在此研究中,我们旨在通过使用 GPT-4-turbo 来改进词典。此外,我们探索了初版的改进,并比较了两个模型的性能。
- 分割、洗牌和拼接:改进时间序列表示的简单机制
现有的学习时间序列的方法保持时间步骤的时间顺序,假设原始顺序对学习来说是最优的。然而,现实世界的时间序列的非相邻部分可能具有强烈的依赖关系。为了解决这个问题,我们提出了一种名为 Segment, Shuffle, and Stitch(S3 - COLING何时使用 “更多语境” 有助于辨别嘲讽?
通过整合多种上下文,本研究探索了现有方法在讽刺识别中的改进,并在三个讽刺识别基准测试中取得了最先进的性能,并展示了添加更多上下文的好处,同时也指出使用更多上下文可能引入社会偏见的固有缺点。
- 图像类别增量学习通用双分支框架
通过引入轻量级卷积网络的两分支连续学习框架,实现对深度神经网络中灾难性遗忘问题的改善和性能提升。
- 多交换 $k$-Means++
通过考虑更大和更复杂的局部搜索邻域,我们的算法实现了 9 + ε 的逼近比,这是局部搜索的最佳可能性,并且在几个数据集上显著改进了 Lattanzi 和 Sohler(ICML 2019)的方法。
- 选择性混合有助于处理分布转移,但不仅仅因为混合
研究表明,特定样本对之间的非随机选择使训练分布受到影响,并通过与混合无关的方法提高了泛化能力。二元分类中的 Mixup 跨类混合隐含地对数据进行重新采样,从而实现了标签转移的经典解决方案。选择性混合和重新采样方法存在新的等价性,相关的优势可 - ICMLPOUF: 面向提示的无监督微调大规模预训练模型
本研究提出一种无监督的精调框架,用于快速和直接地向未标记的目标数据进行深度学习模型的预训练,并在图像分类、情感分析和自然语言推理任务中实现了持续的改进。
- AAAIRWEN-TTS: 自然语音合成的关系感知字编码网络
本研究提出了 Relation-aware Word Encoding Network(RWEN)模型,通过两个模块(即语义级别关系编码和相邻单词关系编码)有效利用语法和语义信息,与以前的方法相比,实验结果显示出了显著的改进。
- LERT: 一种基于语言学动机的预训练语言模型
本论文提出了一种名为 LERT 的预训练语言模型,通过使用一种称为语言信息预训练策略,使用三种类型的语言特征以及原始的 MLM 预训练任务来训练,对于十种汉语 NLU 任务,LERT 能够带来显着的改进。
- 深度学习中稀疏专家模型综述
稀疏专家模型是一种在近三十年中不断涌现的深度学习架构,通过在每个样本中使用参数子集来实现稀疏度,使参数计数与每个样本的计算分离,产生非常大但高效的模型,已在自然语言处理、计算机视觉和语音识别等领域中显著提高性能。
- Transformer 的动态位置编码
本研究提出了一种新的动态位置编码(DPE)方法,通过新的位置嵌入来纠正目标单词的位置信息,相较于传统 Transformers 在英德法意四种翻译任务中取得了显著的性能提升。
- 高分辨率稀疏注意力下的语义布局操作
该研究提出了一种高分辨率稀疏注意力模块和一个生成器架构,可以在语义标签映射的基础上,有效地实现将输入图像的视觉细节转移至新布局。实验证明,该方法在图像修补和布局操作方面的性能得到了大幅提高。
- 重新审视用于视频帧插值的自适应卷积
本文通过对动态插帧的一种简单方法 —— 自适应可分离卷积进行微调来实现近乎先进方法的结果,并提出了几种直观但有效的技术来改进插帧质量,这些技术也可以应用于自适应卷积的其他相关应用领域,如连拍图像去噪、联合图像滤波或视频预测。
- ICCV稳健性的多重面貌:对于越界泛化的关键分析
本研究介绍了四个新的现实世界分布变化数据集,重点探讨了先前提出的改进模型鲁棒性方法,并测试了它们的有效性。我们发现使用更大的模型和人工数据增强可以提高真实世界分布变化的鲁棒性,这与之前的研究不同。我们的研究结果表明,未来的研究必须同时研究多 - 度量学习的现实检验
本文研究过去四年深度度量学习领域的论文,发现其中许多论文实验方法存在缺陷,显示出时间上的改进最好只是微不足道的。
- 候选融合:将语言模型集成到序列到序列手写词识别结构中
本文提出了一种新颖的候选融合方式 (Candidate Fusion),该方法在将外部语言模型集成到序列到序列架构中的同时,提供了来自外部语言模型的建议作为序列到序列识别器的新输入。Candidate Fusion 提供了两个改进,一方面, - 多元神经机器翻译的流畅性和忠实度建模
论文提出了一种引入评估模块来指导预测结果分布的神经机器翻译方法,从流畅性和忠实度的角度引导模型生成具有连接性的短语,实验结果表明,该方法可以显著提高翻译质量。
- 用于段落重新排名的更新 Duet 模型
本文提出了对 Duet 深度神经排名模型的若干小修改,并在 MS MARCO 文章排名任务上进行了评估,根据消融研究,我们报告了所提出的改进的显著提升。
- 重新思考多级网络用于人体姿态估计
研究单阶段方法与多阶段方法在姿态估计领域的性能表现,提出了单阶段模块设计、跨阶段特征聚合和粗到细的监督等改进建议,所得方法在 MS COCO 和 MPII Human Pose 数据集上都取得了新的最优表现,证明了多阶段架构的有效性。
- MM基于 OpenCV 库的 MORPH-II 人脸数据库图像预处理
本文介绍了对 MORPH-II 非商业数据集的 55,134 张图像进行预处理的步骤。介绍了预处理流水线中的每个步骤及其细节,提供了与每个步骤配对的 OpenCV 功能,并讨论了可能的改进。