- 最佳综合嵌入
本文介绍一种基于词嵌入组合方法,该方法旨在通过满足新向量与其组成部分的向量表示之间的距离一致且最小化来实现给定一组词的公平嵌入表示。该嵌入组合方法可适用于静态和上下文相关的词表示,适用于创建句子的表示,并学习不一定按序组织的词组的表示。我们 - ACL句子嵌入的构成对比学习
通过最大化同一文本最小扰动嵌入之间的对齐,以及在更广泛的语料库中鼓励嵌入的均匀分布,基于对比学习的各种方法已被提出来从未标记的数据中学习文本表示。不同的是,我们提出最大化文本和其短语成分组成之间的对齐,考虑了此目标的多种实现方法,并详细阐述 - 使用高通滤波预处理的卷积自编码器改进图像追踪
本文探讨了图像追踪的过程,并介绍了几种包括高通滤波、自编码和矢量化等处理方法,以提取出图像的抽象表示。根据研究结果,使用自编码器重建图像,经过高通滤波处理,再进行矢量化可以更加抽象地表示图像,同时提高矢量化过程的有效性。
- 语言模型词嵌入空间中的词汇文体特征表达
本研究发现,通过预训练语言模型(LMs)建立的表征空间,不仅编码了单词及其关系等抽象语义概念,也能够识别如复杂性、正式程度和象征性等字词风格,以及使用在小数量文本中产生的矢量表征。此外,本文还对这些表征空间的词级与短语级特征进行了分析,并表 - 探索词嵌入偏移聚类在关系分类中的应用
本研究探讨了一种使用不同的聚合策略将单词向量之间的关系表示为向量的方法,并使用聚类模型来分析它们的正确匹配性。实验结果表明,减法聚合策略配合基于中心点的聚类机制在性能上表现更好,该研究旨在为基于词嵌入的无监督方法提供一个识别成对词汇之间关系 - 图像模式的表示学习
通过聚类技术生成图像模式的向量表达,通过计算不同向量之间的距离创建可视化,以了解不同图像模式的相对距离。
- ICCV神经笔触:三维形状的风格化线描
本论文介绍了一种从三维形状中生成艺术风格化线条图案的模型,其输入为三维形状及视角,输出为带有纹理笔触的绘画,包括笔画粗细、变形和颜色,可以从艺术家的风格中学习。该模型是全可微分的,并训练其参数来自三维形状的单个训练图形。相对于之前基于图像的 - Time2Vec:学习时间的向量表示
本文提出一种基于向量的时间表示模型 Time2Vec,具有模型无关特性,可以被轻松地导入到现有和未来的架构中,以提高模型性能。通过在多个模型和问题中的实验证明,将时间概念替换为其 Time2Vec 表示可以提高最终模型的性能。
- 面向口语理解的领域、意图和槽耦合表示学习
本文提出了一种新模型,通过利用 Spoken Language Understanding 系统中域、意图和插槽之间的层次关系,学习耦合的表示。实验结果表明,该模型学习到的表示方法在交叉域重新排序任务上表现出更好的性能。
- MM面向任务型对话系统中混合语言话语的意图检测
本研究旨在评估多语言语境下各种向量表示和模型的组合,找到最适合的方案以实现 Code Mix 话语意图识别。研究结果在 Code Mix 和英汉混合语数据集上得到了验证。
- ICCV从卫星图像中提取拓扑地图
PolyMapper 是一种新的方法,用于从空中图像中直接提取城市的拓扑地图,并提出了一种新的序列化方法以实现不同类型对象的统一形状表示,其能够在现有大规模数据集上以全自动方式绘制建筑物和道路的多边形,表现得很好。
- 用于改写和文本摘要的语义句子嵌入
介绍了一种适用于高级自然语言处理的句子向量编码框架,该框架可以从编码器 - 解码器模型中提取具有相似向量表示的常见语义信息的句子 latents 表示。我们将句子表示的应用用于两个不同的任务 -- 句子复述和段落摘要,使其适用于常用的循环框 - 利用未对齐的语音和文本训练的非监督自动语音识别技术
本文研究无监督语音识别方法,提出由语音向量表示、语义嵌入和无监督转换的框架,这一框架可用于缺乏音频文本对齐数据和受监督方法无法应用的低资源语言。
- ICML基于话语和上下文嵌入的检索式对话系统
本文利用局部敏感哈希树 LSH Forest 实现了基于向量表示的答案检索,并探讨了使用候选项选择方法时,这种方法的优越性。在 Ubuntu 语料库和荷兰的客户服务聊天数据集上进行的实验结果表明,检索式方法优于生成式方法,并揭示了未来研究方 - 通过低秩非对称投影学习边缘表示
本文提出了一种新的无向图嵌入方法,通过建模节点的连边函数,并结合从随机游走中抽样的信息,对图的联通结构进行表达,从而提高了学到的嵌入空间的表现和空间效率。该方法在社交网络、蛋白质相互作用等数据集上均取得了较好的表现。
- 基于分布式表示的混合推荐系统与短物品描述
本文提出了一种基于文本向量表示的协作过滤算法,用于在获取商品评分困难的情况下进行推荐,并与现有的算法进行了对比验证其有效性。
- SIGIRTweet2Vec: 使用字符级 CNN-LSTM 编码器 - 解码器学习推文嵌入
Tweet2Vec 是一种新方法,用于通过字符级别的 CNN-LSTM 编码器 - 解码器生成推文的通用向量表示形式,可应用于推文的各种分类任务,并且该方法也适用于其他语言。
- ACL将分布式词汇对比集成到词向量中用于反义词 - 同义词区分
该论文提出了一种新的向量表示方法,将词汇对比整合到分布式向量中,并加强了确定词语相似度度量的最显著特征。改进后的向量模型明显优于标准模型,并且可以跨词类(形容词,名词,动词)将反义词从同义词中区分开来。此外,该论文还将词汇对比向量整合到跳字 - ECCV学习物体的可预测和生成向量表示
本文介绍了一种名为 TL 嵌入网络的神经网络结构,它可生成新的 3D 物体并从 2D 图像中预测,旨在获得一个既具有生成性,又具有可预测性的嵌入空间,该嵌入空间可用于多个任务,包括从 2D 图像预测体素和 3D 模型检索。
- EMNLP循环神经语言模型中的在线表示学习
研究连续在线学习在递归神经网络语言模型中的扩展,通过每次预测后自适应地调整当前文本单元的矢量表示,实现提高语言建模精度并减少模型存储所需的计算参数。