关于日语单词的定义
该研究介绍了 Universal Dependencies 的第二个版本,其中包括词汇分析、词形还原、标准化标记和句法关系,适用于 90 种语言,以及主要变化(UD v1 到 UD v2)的讨论。
Apr, 2020
本研究旨在使用核心概念对语法依存分析进行改进,并探讨将核心概念结合到框架中的方法。通过实验,研究得出使用核心概念可以在依存分析准确性方面带来小但显著的改进,主要针对少数依赖关系,包括名词修饰语、协调关系、主谓关系和直接宾语等。
Jan, 2021
通过在 UD 注释上加入一个 'UCxn' 注释层并且在典型性知识的指导下,我们将构建类型说法可以跨语言进行比较的 UD 注释,同时为未来的 UD 树库提供了建设的基础。
Mar, 2024
本研究探讨了多种模型构型,借助通用分解语义数据(UDS)集中丰富的句法和语义注释,联合解析通用依赖和 UDS,以获得两种形式主义的最新结果,同时分析了句法和语义联合模型的行为。我们还研究了联合建模在多语言环境下的普适性,并发现了 8 种语言中相似的趋势。
Apr, 2021
本文介绍了用 Universal Dependencies 分析 Tweets 的问题,提出了扩展 UD 指南来覆盖 Tweets 中的特殊结构以及使用新的 Tweet Treebank v2 来解决标注中的歧义,并构建了一个可以将原始 Tweets 解析为 UD 的流水线系统。此外,作者还提出了一种新的方法来精简基于转换的解析器的集合,并在真实情况下验证了该方法的有效性。
Apr, 2018
通过在不同语言之间建立语义和句法的通用连接,并利用跨语言的并行句法结构,我们引入了 UD Type Calculus—— 一种构成性、有原则且与语言无关的语义类型和逻辑形式系统。我们解释了 UD Type Calculus 的基本特征,这些特征都涉及将依赖关系的意义如同单词的意义一样进行指称。这些特征使得 UD-TC 能够通过使用依赖标签来准确地推导出各种句法结构的正确含义。最后,我们在一个大型现有语料库上展示了 UD-TC 的评估结果,证明它能够产生与我们的基准结果相媲美的意义。
Mar, 2024
本文提出了一个解决 MeCab 等传统词法分析器不能很好处理日本动画或游戏角色台词的问题的方法,该方法使用了为深度学习提出的子单元切割行文,并提取频繁出现的字符串来获得表征角色台词的表达式。经过性别、年龄以及日本动画中各个角色的分析,发现这些切割出来的子单元是特定于每一特征的语言表达模式,实验表明这种方法在分类上胜于传统方法。
Mar, 2022
本研究提出了基于单词形态的韩语句法分析方案,并将其应用于通用依存结构。我们开发了自动转换脚本,证明了该方案与韩语单词嵌入的高效性,并通过统计和神经模型证明了该方案的有效性。
Sep, 2022
研究对比了 Universal Dependencies 和 Universal Morphology 计划,通过提出一种从 Universal Dependencies v2 特征映射到 UniMorph 结构的确定性映射,从而消除了两个项目之间的兼容性问题,并给出了两个注释项目的基础、优势和劣势的关键评估。
Oct, 2018