- 通过黑盒模型实现鲁棒的车辆跟随动力学建模:方法、分析与建议
该研究评估了黑盒模型(如 LSTM)的目标变量选择,并比较了它们与经典车辆跟随模型的最佳目标变量的异同,结果发现目标变量的最佳选择与黑盒模型的目标函数和向量空间相关。
- 在抽象文本摘要中利用表征偏差进行数据去噪
本文旨在离散化抽象文本摘要模型的向量空间,以理解输入嵌入空间和模型编码空间之间的特征学习。我们通过聚类技术来学习模型样本空间的多样性,以及数据点如何从嵌入空间映射到编码空间,从而提出了一种度量方法来过滤冗余数据点,使模型更强大且更节约数据。 - 探寻嵌入的纹理:探讨嵌入的构造
通过引入噪音亚百特信息编码的向量空间,使用探测框架扩展方法,研究了 GloVe 和 BERT 嵌入中向量范数如何编码不同种类的信息,发现 GloVe 在向量范数中存储了句法和句子长度信息,而 BERT 则将其用于编码上下文不连贯信息。
- 连续向量空间中的数学表达式的语义表示
本文介绍了一种在连续向量空间中表示数学表达式的方法,使用序列到序列架构的编码器生成向量表示,并比较了这种方法与自编码器的差异。最后,为了加快未来的项目,我们发布了一组等价的超越和代数表达式对的语料库。
- ICLR用主题嵌入混合表示单词嵌入混合
本文提出了一种新的主题建模框架,在该框架中,每个文档都被视为一组单词嵌入向量,每个主题都被建模为嵌入空间中的嵌入向量,并在相同的向量空间中嵌入单词和主题,定义一种方法来衡量文档单词的嵌入向量与主题嵌入向量之间的语义差异,并优化主题嵌入以最小 - 神经代码搜索的多模态表征
本文介绍了一种基于树序列化方法和多模态学习模型的语义代码搜索技术,实验结果表明,这种技术可以有效提高代码搜索性能。同时提出衡量代码信息完整度的量化指标来辅助实验结果理解。
- ACLMOLEMAN: 基于实体提及注释网络的实体提及链接
提出了一种基于最近邻法的实体链接方法,该方法通过建立一个上下文相关的提及编码器,学习将相似的提及放置在比不同实体的提及更接近的向量空间中,从而利用所有实体的提及作为 “类原型”,通过对训练集中标记的实体的提及集合进行检索,并应用最近的提及邻 - WSDM事件驱动的查询扩展
本文研究了基于事件的查询扩展技术,利用新颖的词语和事件的嵌入机制在相同的向量空间中识别查询和事件之间的语义关系,进而在多个新闻文本检索数据集上显著提高检索性能。
- 知识图谱嵌入和可解释人工智能
介绍了知识图谱嵌入的概念,生成和评估,总结了用于在向量空间中表示知识的方法,讨论了预测模型的解释性问题和解决方法。
- EMNLP使用知识蒸馏将单语句子嵌入多语言
本文介绍了一种将现有的句子嵌入模型扩展到新语言的简便有效方法,训练基于将翻译后的句子映射到与原始句子相同的向量空间位置的思想,相较于其他多语言句子嵌入训练方法,具有扩展现有模型以增加新语言的简易性、保证向量空间所需属性的易操作性和较低的硬件 - ACL超伪空间中的细粒度实体类型划分
本文研究了采用双曲嵌入表示大型实体类型库中的层次信息,以捕捉上下文中提及和目标类型之间的层次关系,从而提高实体类型命名性能。研究表明,双曲模型在不同的技术和数据集上表现出提高的效果,但在技术代码和数据集细节方面的差异也存在影响。
- EL Embeddings: 用于描述逻辑 EL++ 的模型的几何构建
本研究在解决如何为复杂的信息或知识库创建向量空间嵌入,以便于机器学习、相似性搜索或类似任务时能更有效地用于预测蛋白质相互作用。
- EMNLP跨语言无监督意义嵌入(CLUSE)
本文提出了一个模块化的感知诱导和表示学习模型,联合学习双语感知嵌入,在向量空间中很好地对齐,利用英汉平行语料库中的跨语言信号捕捉语言对中的词汇搭配和分布特征。通过在 Stanford 上下文单词相似性(SCWS)数据集上进行评估,确保单语感 - 利用知识图谱嵌入技术实现工业 4.0 应用案例
本文介绍使用图数据模型来表示由传感器生成的大量数据以及不同设备之间的互动,并将其嵌入到向量空间中,以便将传统机器学习方法用于工业 4.0 系统。
- COLING提高神经网络命名实体识别的鲁棒性词汇特征
本文介绍一种使用神经网络方法进行实体识别的系统,主要聚焦于研究如何在建模时引入词汇特征,并通过低维向量空间嵌入和高效训练得到最佳结果,最终在公开数据集上取得了较高的 F1 分数。
- ACL基于内容的引用推荐
该研究提出了一种基于内容的方法来推荐论文草稿中的引用,通过将请求文档嵌入到向量空间中,再使用其最近邻作为候选项,并使用区分观察和未观察到的引用的判别模型对候选项进行重新排序,无需元数据,得到了相对于标准数据集的显著提升。
- TabVec:用于 Web 表格分类的表格向量
TabVec 是一种无监督的方法,将表格嵌入向量空间以实现对表格的分类,并在没有领域注释的情况下显著提高准确性。
- ACL为词汇蕴涵专门化的词向量
该论文提出了一种新的后处理方法 LEAR(词汇蕴涵吸引 - 排斥),将任何输入的词向量空间转换为重视词汇蕴涵关系(LE)的不对称关系,通过将外部语言约束(例如 WordNet 链接)注入到初始向量空间中,LE 特化过程将真正的下位词 - 上 - Gov2Vec: 学习机构及其法律文本的分布式表示
使用唯一向量空间嵌入法比较不同机构之间的政策差异,发现各机构之间存在有意义的差异,并使用文法向量回答具体问题,正在扩展为更综合的法律语义地图。
- TransA: 知识图谱嵌入的自适应方法
研究了知识表示在人工智能中的重要性,提出了基于转换的方法矢量化实体和关系,然后通过使用基于度量学习的自适应度量方法来提高性能。在基准数据集上通过实验证明了该方法的显着改进,领先于现有的基线模型。