- Bag of States: 一种基于视频的非序列方法用于测量参与度
本文提出一种使用口袋词模型的非时序方法来分析学生情感和行为状态的视频,以测量他们的学习参与度,相较于已有的时序方法,本方法在两个数据集上都展现了更优的分类准确性。
- IJCAI基于文本数据的次年破产预测:基准和基线模型
该论文基于新型和经典数据集引入了一个无结构数据情况下的基准测试,评估了几种经典和神经基础模型,并发现基于静态领域词汇表示的轻量级词袋模型在多年的文本数据中获得了出人意料的良好结果。
- ACL文本分类中的词袋、图形和序列:质疑文本图和广泛 MLP 的必要性和惊人强度
本研究发现,在归纳式文本分类中,使用 Bag-of-Words 的宽 MLP 模型优于最新的基于图的模型 TextGCN 和 HeteGCN,并与 HyperGAT 相当,而基于序列的 BERT 和 DistilBERT 模型优于所有最新的 - ICML重新评估词移距离
本文讨论了词移距离(WMD)及其与传统基线方法如词袋(BOW)和 TF-IDF 的比较,指出若使用正确的预处理方法,即 L1 正则化,则传统基线方法与 WMD 具有相近的性能,同时发现 WMD 与 L1 正则化 BOW 之间存在类比关系。
- SparTerm:学习基于词项的稀疏表示以实现快速文本检索
本文提出了一种名为 SparTerm 的框架,旨在将预训练语言模型的深度知识转移至基于词袋法的稀疏表示,以提高其语义级匹配的表达能力,同时保持其效率、可解释性和准确性,并在 MSMARCO 数据集上获得了 state of the art - ACL文本检索中的稀疏、密集和注意力表示
该研究探讨了双编码器的检索能力,并将其与稀疏词袋模型和注意力神经网络进行了比较。研究发现固定长度编码的能力存在限制,具体表现为编码维数,金标和排名较低文件之间的边际,以及文档长度。在此基础上,该研究提出了一种结合了双编码器的高效性和注意力结 - 循环网络在情感分析中实现上下文处理的方式
本文研究神经网络的上下文处理、不同类型的循环神经网络所产生的上下文效应,以及如何应用这些效应提高基线模型的性能。
- ICCV使用 CNN 识别行为的幻觉 IDT 描述符和 I3D 光流特征
本文提出了一种采用手工制作的视频表示方法和 CNN 异步技术进行动作识别的方法,并建议一种端到端可训练的网络流结构,用于简化该方法的处理流程,同时在四个公开数据集上获得了最新的结果。
- SIGIR上下文传播的术语权重用于文档表示
提出了一种新模型,通过给类似语境中出现的单词重新分配其权重,模拟了在相似语境中单词之间的语义共享,并将其纳入单词袋文档表示法中,从而在无监督设置下在难度逐渐增加的数据集上获得了最好的微观和宏观 F1 分数,针对的研究主题是单词嵌入和语义含义 - 通过表面重建学习实现可匹配的图像检索
该论文提出了一种基于卷积神经网络的图像检索方法,采用三元组损失函数和表面重投影技术,获得了丰富的训练数据和有效的表征。该方法可用于 3D 重建中匹配图像检索问题,优于当前主流方法,显著加速了图像检索过程。
- 文本处理的广义差分隐私
本文提出了一种隐私保护机制,通过结合机器学习技术和文本处理技术,通过 “词袋” 表示的文档来建模文本文件的隐私。该机制在语义相似性度量方面满足隐私保护,从而在保护文本隐私信息的同时,保留足够的文本内容信息以便进行准确的内容分类任务。
- 句子嵌入在下游和语言探究任务中的评估
本文对最新的句子嵌入方法进行了全面评估,通过使用多样的下游和语言特征探测任务,表明与在蕴涵数据集上训练的句子编码器相比,使用具有深度上下文相关性单词嵌入的词袋模型可以在许多任务中产生更好的结果,但我们远未达成一个可以在多个下游任务中持续表现 - ACL神经机器翻译的词袋模型作为目标
本文提出了一种以神经机器翻译、词袋模型、训练、中英文翻译和 BLEU 得分为关键词的方法,通过在训练阶段使用句子和词袋模型作为目标,鼓励该模型生成可能不在训练集中的正确句子,实验结果表明,我们的模型在中英文翻译数据集上的 BLEU 得分比强 - ECCV可学习的直方图:深度神经网络的统计上下文特征
本文提出了一种可学习的直方图层,可以在深度神经网络中学习直方图特征并在训练期间与其他层共同优化,这在语义分割和目标检测中得到了探索,深入研究提供了深入的洞见。
- iBoW-LCD: 基于外观的闭环检测方法,使用增量二进制单词包
本文介绍了一种新颖的基于外观的循环闭合检测方法 iBoW-LCD,该方法利用了基于二进制描述符的增量词袋(BoW)方案来检索先前看到的相似图像,避免了通常需要经典词袋模型训练阶段。此外,为了检测循环闭合,iBoW-LCD 建立在动态群岛的概 - 针对动作识别的词袋等效递归神经网络
本文提出了一种等价于传统词袋方法的循环神经网络,但可以进行判别式训练,并允许将核计算直接整合到神经网络中,从而解决了复杂性问题;在四个最新的行动识别基准测试上进行了验证,结果表明传统模型以及稀疏编码方法都被超越。
- 文本文件中什么是相关的?:一种可解释的机器学习方法
本文介绍了如何使用机器学习模型解释文本分类的决策过程以及如何生成基于词向量的文档表示方法。通过对两个不同类型的模型进行比较,表明卷积神经网络在可解释性方面的优势,也使得它更具有人类可理解性,并有潜力应用于其他领域。
- 视觉问答的简单基线
提出了用于视觉问题回答的简单词袋基线模型,使用来自问题的单词特征和图像的 CNN 特征进行拼接以预测答案并在挑战性的 VQA 数据集上显示了与许多最新方法使用递归神经网络相当的性能。同时提供了交互式 Web 演示和开源代码以探索模型的优缺点 - 非独立同分布图像模型的近似 Fisher 核在图像分类中的应用
本研究中,我们引入了非独立同分布模型来提高图像特征表示方法的性能,并通过模型的超参数的数据对数似然梯度来编码图像。我们同时使用变分自由能边界来学习超参数和计算近似的 Fisher kernels,其结果表明,与现有的特征集成方法中使用的幂归 - 句子和文本的分布式表示
提出了一种名为 “Paragraph Vector” 的无监督算法,用于从文本段落、句子和文档等长度可变的文本片段中学习固定长度的特征表示,该算法能够克服 Bag-of-words 模型的两个主要弱点,经实验证明,Paragraph Vec