- 语义单元:获取物品感知多样性的进化过程
用分布式表示构建多义词语义向量,通过与其他向量交互演化而成,研究结果显示,具有较大或中等方差的词在文本中较容易解释,而通过与不同地壳区域交互获得更大方差的震中可能对应即将发生的大地震震中。
- ICLR相机作为光线:通过光线扩散进行姿态估计
基于光线组合的相机姿势的分布式表示以及基于回归和扩散的方法,在 CO3D 数据集上展现了最新的性能,并在未见过的物体类别和野外捕捉中表现出广泛适应性。
- spaCy 中的多哈希嵌入
这篇论文介绍了关于 spaCy 中 hash embeddings 的技术和方法,它使用分布式符号表示技术来减少大型词汇的内存占用,同时在不同领域和语言上测试证明了其 Named Entity Recognition 的性能。
- ICML音乐词向量:弥合听觉语境与音乐之间的鸿沟
本文介绍了一种使用通用文本和音乐特定数据组合训练单词的分布式表征,以评估其在将听取上下文与音乐作品相关联方面的性能。
- KDD多义词的分布式表示:一种基于损失驱动的方法
本研究提出了一种名为 LDMI 的新模型,以用来估算单词的分布式表示,特别是针对多义词。实验表明,LDMI 相比其他方法在上下文单词相似性任务上具有更好的性能表现。
- 只是文字,我全靠它们
该论文表明了利用分布式表示范式进行音乐挖掘和自然语言处理任务时歌词的优势,并通过使用分布式表示克服了手工特征和歌词被认为是流派和流行度的弱指标两个瓶颈。
- AAAI在单词形态层面植入理性知识的分布式表示
本文提出一种基于词构建立汉语词汇和语义本体,在词根级别上将结构化的理性知识嵌入到分布式表示中,避免了语料库中繁琐的消歧义。并通过实例扩增技术来利用层次信息和解决数据稀疏性问题,采用 word2vec 训练词素的分布式表示,并通过评估获得的嵌 - 通过转移学习进行实体匹配的重用和适应
本文研究了在具有限或无训练数据的情况下,通过重用和调整同一领域或相关领域数据集 D_S 的训练数据,是否可以在数据集 D_T 中训练良好的机器学习分类器,并提出了用于处理此类情况的五种算法。在五个不同领域的 12 个数据集上进行了全面的实验 - SIGIR利用词嵌入和领域知识为科学摘要加入文献引用语境
提出了一种使用分布式单词表示和领域知识从参考论文中提取适当上下文的无监督模型,评估结果表明其明显优于现有技术,并且还演示了上下文化方法提高科学文章引用摘要的有效性。
- 探索词嵌入技术在无监督文本用户生成内容归一化中的应用
提出了一种基于词的分布式表示(或词嵌入)的独立于语言和领域,完全无监督并可扩展的方法,用于从单词嵌入中学习规范化词典,以修正巴西葡萄牙语产品评论中的拼写错误和互联网俚语,相比当前可用的工具表现更好。
- ACL使用单词嵌入进行跨语言抄袭检测
本文提出使用分布式单词表示(word embeddings)来进行跨语言文本相似度检测,并通过组合不同的方法来验证它们的补充性,最终在非常具有挑战性的语料库上,在块级别下实现了英法相似度检测的总体 F1 得分 89.15%(在句级别下为 8 - 利用生成对抗网络对文档进行建模
使用生成对抗网络的方法学习自然语言文件的分布式表征,并提出一种基于最近提出的基于能量的 GAN 的模型,但使用去噪自编码器作为鉴别器网络,从鉴别器的隐藏层中提取文件表示,并在定量和定性方面进行评估。
- AAAI跨语言情感分类的结构对应学习及一对多映射
本文提出了一种基于分布式词表示的跨语言结构对应学习方法,能够在没有平行语料库的情况下学习具有意义的一对多映射,用于处理跨语言情感分类问题,在 NLP&CC 2013 跨语言情感分析数据集上进行试验,证明该方法比最先进的方法更具竞争力。
- IJCAI基于分心注意力的神经网络文档摘要
本文提出基于神经网络的 attention 模型来对长文档进行自动摘要。通过追踪文档主题之间的切换,模型实现了更好的文档理解效果,并在两个大型数据集上取得了最优表现。
- COLING层次分类和数据驱动分类的实体和分类别的联合嵌入
本研究提出了一种基于大型知识库集成结构化知识和分类法层次结构将实体和类别嵌入到语义空间的框架,使框架能够计算实体和类别之间有意义的语义相关性,以处理单词概念和多词概念,在概念分类上表现出卓越性能,并在无数据层次分类方面取得了最新的成果。
- 深度强化学习下面向对话状态跟踪和管理的端到端学习
该论文提出了一个基于 Deep Recurrent Q-Networks 变体的端到端对话系统框架,使用强化学习与监督学习的混合算法,在 20 Questions 游戏模拟器上的实验结果表明,该模型优于基线模型,并学习了潜在对话状态的分布式 - ICLR分布式模型与深度学习嵌入:将两者最优结合
本文研究了单词在分布式表示中的两种主要方法:低维度深度学习嵌入和高维度分布模型,并将这两种方法相结合,通过学习基于分布式模型向量的嵌入来提高单词相关性判断的性能。
- RNADE: 基于神经网络的实数值自回归密度估计器
基于 RNADE(Real-valued Vector Joint Density Estimation)的混合密度网络模型,可实现对真实数向量数据的密度估计并进行直接比较处理,其性能对于异构和感知数据均优于混合模型,且具有易于计算和基于梯