- 使用 EEG 和语言模型探索语言处理的时间尺度
本研究探讨了语言处理的时间动态,通过研究预训练基于变压器的语言模型和脑电数据之间的单词表示的对准。使用时间响应函数 (TRF) 模型,我们调查了神经活动如何对应于不同层的模型表示,揭示了人工语言模型和大脑在语言理解过程中的相互作用的见解。我 - 从双曲几何回到词嵌入
在双曲盘中选择随机点并称它们为词表示,但需要通过点间互信息和最新的对齐技术近似确定哪个点对应于感兴趣的人类语言中的哪个词。
- ACL使用双语词典进行神经机器翻译的持续学习
该研究提出了一个评估框架,旨在评估神经机器翻译对持续学习新短语的能力,对不同的单词表示进行了单次学习方法的集成,并表明,必须解决这两个挑战才能成功使用双语词典。通过解决这两个挑战,我们能够将翻译新的、罕见的词汇和短语的能力从 30% 提高到 - COLING定义框架:使用定义描述混合概念表示
本文介绍了 Definition Frames (DF),一种从定义中提取的矩阵分布式表示,其中每个维度都具有语义可解释性,DF 具有与其他分布式语义方法相媲美的性能,能在单词相似性任务上取得可比较的成果。
- EMNLPLINSPECTOR WEB: 用于词表示的多语言探针套件
LINSPECTOR WEB 是一种开源多语言检测器,支持 16 种简单的语言学探测任务分析 28 种语言的单词嵌入表示,支持静态单词嵌入表示和预训练的 AllenNLP 模型的探测。
- ACL使用几十个部分注释的示例扩展解析器至远领域
通过使用神经网络的词表示方法,在与源领域语法相似的情况下,重新审视了领域适应。并提供了一种简单的方法,通过使用少量的部分注释来适应解析器。文章提供的新算法的结果,使华尔街日报测试集的最新单模型状态达到 94.3%,比之前最先进的 92.6% - 翻译中的损失:使用检索准则学习双语单词映射
本文提出了一种端到端的优化方法来解决跨语言对齐问题,实验表明该方法在单词翻译上的表现优于现有的最先进方法,尤其是对于英汉等远距离语言对齐效果更为显著。
- 除顶部之外:用于词语表达的简单有效后处理
本文介绍了一种消除平均向量和少量主导方向的词向量后处理技术,通过在多种语言和数据集上进行的实验验证,发现处理后的词表示比原始表示更强,适用于词汇水平内在任务和句子级任务。
- 基于词嵌入的在线媒体命名实体识别领域自适应
本文提出了使用分布式词表示有效地将一个领域中学习的模型适应到其他领域的方法,并分析了不同领域之间的语言变异以识别可以提高性能的语言见解,提出了捕捉词汇用法的领域特定语义的方法,并演示了如何有效地使用此类领域特定知识来学习在领域适应设置中优于 - ACL使用子词信息丰富单词向量
本文提出一种基于 skip-gram 模型的新方法,其中每个单词被表示为一组字符 n-grams 的加和。该方法快速、可在大型语料库上快速训练模型,同时可以计算未出现在训练数据中的单词的表示。我们在九种不同的语言上评估了我们的单词表示,通过 - ACL词嵌入表示的内在子空间评估
本文介绍了一种新的内在评价词汇表示的方法。我们提出了四个基本标准来检测这种方法是否能够满足自然语言的一些难点,我们提出了一些测试来直接展示这些标准是否得到满足。在此基础上,我们将这种方法应用于计数向量模型和神经网络模型等多种模型的比较,并证 - ACL神经网络自动文本评分
提出一种基于 Long-Short Term Memory 网络的自动化文本评分框架,该框架通过学习特定单词对文本评分的贡献来构建单词表示,并且能够在可视化神经网络的启发下,识别出文本中更具区分性的区域,以提高模型可解释性。
- AAAI基于字符识别的神经语言模型
本研究描述了一种仅依赖字符级输入的简单神经语言模型,该模型利用卷积神经网络和字符级公路网络作为输入,并将结果给予一种长短时记忆递归神经网络语言模型作为输出,该模型可以用较少的参数占据现有最先进的地位。此外,该模型表现出色的证明了许多语言所需 - ICLR在词汇表示中结合分布和关系语义
本文研究了词表示应该包含分布式和关系语义这一假设。为此,我们使用 Alternating Direction Method of Multipliers (ADMM),它可以灵活地在原始文本上优化分布式目标和 WordNet 上的关系目标。 - ICLR将分配和关系语义融合到单词表示中
本文研究单词表示应该结合分布式和关联语义的假说。我们采用 ADMM 方法,在原始文本上灵活优化分布式目标,WordNet 上的关联目标。初步结果表明,针对两个目标训练的单词表示在某些情况下可以提高知识库完成,类比测试和解析的性能。
- GloVe 与 word2vec 的链接
本文讨论了 GloVe 和 skip-gram 两种单词向量表示方法在训练目标上的相似性,指出它们的目标与代价函数虽不同但具有类似性。
- ACL将词向量改进应用于语义词典
本文提出了一种基于语义词典的关系信息来改进词向量表示的方法,并在多种语言的标准词汇语义评估任务中获得了显著的改进,其方法超越了以往词向量训练算法中融入语义词典的技术。
- 采用分层稀疏编码学习单词表现
提出了一种使用启发自单词意义语言学研究的稀疏编码中的分层正则化来学习单词表示的新方法,并展示了一种基于随机近端方法的高效学习算法,用于处理数十亿单词令牌的层次稀疏编码,实验表明该方法在各种基准任务上的表现优于或与最先进的方法相媲美。
- ICML基于字符级文本嵌入的文本分割
该研究提出通过训练简单的循环神经网络从原文本字符序列中直接学习文本表示,并将这些文本嵌入用作监督字符级别文本分段和标记任务的特征,以实现比表面字符 n-gram 更好的结果。