无监督依存句法分析综述
该研究综述了关于合成图像的检测和归因方法,突出了它们的优点和局限性,同时指出并讨论了该领域的热门话题,概述了未来研究的有希望的方向。
Apr, 2024
辅助功能对于提高语言模型的代码生成能力有帮助,但如何调用辅助功能尚未进行系统性的研究。本文使用人工创建的评估集来综合评估最近的代码预训练语言模型中利用辅助功能的能力,并通过实验和分析发现其有效性、稳定性和具有自我改进行为的潜力,但同时也发现模型对调用辅助功能的利用不足,建议加强模型对调用辅助功能的实现方法来提高其性能。
Mar, 2024
现在的研究趋势是将数据库索引结构视为机器学习模型,通过训练单个或多个机器学习模型来学习从键到数据集内位置的映射关系,从而实现改进搜索性能和减少空间需求。该调查重点关注学习多维索引结构,介绍了该研究领域的现状,解释了每个方法的核心概念,并根据多个明确定义的标准对这些方法进行分类。我们提供了一个分类法以对每个学习多维索引进行分类和归类,并根据此分类法对现有的学习多维索引文献进行了调查。此外,我们还提供了一个时间线来说明学习索引研究的发展历程,并重点介绍了这个新兴且非常活跃的领域中的几个挑战和未来研究方向。
Mar, 2024
通过低秩参数化规则概率张量,将稠密 PCFG 扩展到数千个非终结符,有助于无监督解析。本文提出了一种简单的 PCFG 形式,独立的左右生成,这种形式比低秩方法更有效地扩展为语言模型和无监督解析器,并且具有更好的性能。同时,我们还提出了一种硬件 IO 感知的内部算法实现,用于高效扩展简单的 PCFG。
Oct, 2023
我们提出了一种新型的、快速的、基于梯度的优化算法,通过情景感知来自适应学习率,以正交邻近梯度为主要思路。该方法具有快速收敛速度,不依赖手动调参参数,具有更大的普适性,在维度 n 为任意大小的问题上可线性扩展。通过在 MNIST 基准数据集上与最先进的优化器进行广泛实验,展示了其出色的性能。我们将这种新型优化器命名为指数学习率自适应(ELRA),它将为梯度下降优化开辟全新的研究方向。
Sep, 2023
在社交媒体上大量使用讽刺文本会对目标用户产生生理影响,讽刺检测对于用户来说很困难,更 对于机器来说是具有挑战性的。此论文讨论了各种讽刺检测技术及其相关数据集等,并总结了一些 方法、挑战和未来的方向。
Apr, 2023
该研究使用无标签口语句子和未成对文本数据进行无监督组成语法分析,比较了通过级联自动语音识别和无监督解析器方法以及直接对连续的词级语音表示进行无监督解析器训练的方法,发现后者解析效果更好。此外,准确的分割也可以实现口语句子的准确解析。最后,该研究显示了无需显式归纳偏差的情况下,直接方法也可以正确学习头波方向性。
Mar, 2023
此论文旨在研究多模态多语言的统一模型,探讨其任务,数据集及方法类别,分析模态与语言之间的相互作用以及模型的优势和劣势,总结该领域的高级趋势并提出挑战和未来研究方向。
Oct, 2022