- 在第一千年拉丁文本中以句子级别检测性内容
通过对句子级别的语义分类使用深度学习方法进行评估,以加速人文学科和语言学领域的语料库构建过程,我们介绍了一个包含各种类型的句子(医学,情色等)的新型语料库,跨度从公元前 300 年到公元 900 年。我们评估了不同的句子分类方法和不同的输入 - 通过辅助可学习目标编码改善深度表示学习
这篇论文介绍了一种新的可学习目标编码方法作为深度表征学习的辅助正则化,该方法能够增加表征空间中的类间间隔,以及同时保持学习目标编码的语义一致性,从而提高不平衡数据下的表征学习性能。
- 使用大型语言模型理解 HTML
通过 fine-tuned LLMs 调整,研究 HTML 理解(元素语义分类,输入描述生成和自主网页导航)任务。 T5-based models 表现最佳,提出一个来自 CommonCrawl 的大规模 HTML 数据集。
- ICML旋转预测对分类器在不同测试环境下准确性的影响
本文针对图像分类器在新环境下的分类决策问题,通过多任务学习方法,发现语义分类精度与旋转预测任务准确性有强线性关系(Pearson 相关系数 r> 0.88),从旋转预测任务的准确性,应用线性回归估计分类器性能。
- 语义图像抠图
本文提出使用语义分类的前景语境信息以及语义 trimap 对自然图像抠图进行改进,并就此进行了大规模实验,获得了当下具有最高竞争力的性能表现。同时,我们提供了一个考虑不同语义类别平衡的大型语义图像抠图数据集。
- KDD6VecLM: IPv6 目标生成的向量空间语言建模
介绍了一种基于 6VecLM 的方法,该方法可以将 IPv6 地址映射到矢量空间中以解释语义关系并使用 Transformer 网络构建 IPv6 语言模型来预测地址序列,实验结果表明,该方法可以在地址空间上进行语义分类,并具有可控制字创新 - ECCV基于图的点云学习的多核扩散 CNNs
本研究提出一种新的架构设计,结合了旋转和拓扑不变的图扩散算子和 1x1 卷积的逐点特征学习,从而有效地在不规则图形上传播特征并提高 3D 点云的特征提取和语义分类精度。
- 利用多尺度球形邻域对 3D 点云进行语义分类
本文介绍了一种基于球形邻域和比例子采样的多尺度邻域的新定义,它允许计算具有一致几何意义的特征,相对于 k 最近邻,其分类性能更好,并且与深度学习方法相比具有竞争力。
- CVPR利用场景文本理解广告
提出一个并不仅使用视觉特征,还使用从内嵌文本中提取的文本线索实现广告图像自动分类的框架,利用广告图像所含的有意义的文本内容,在分类任务中提供有益的语义解释,并使用现成组件开发框架来展示文本线索在语义分类任务中的有效性。
- NIPS弱监督下物体类别学习与检索
采用完全可区分的无监督深度聚类方法,仅使用未标记的对象提议,无需个体分类标签来学习语义类,建立特征表示并同时学习聚类。目前该方法仅提供分割对象性掩膜的监督,但该方法可扩展为使用无监督的目标性生成机制,从而使该方法完全无监督。
- 基于深度语义的三维 LiDAR 数据分类
本文提出了一种基于深度神经网络和贝叶斯滤波框架的方法,用于将三维 LiDAR 数据点语义分为三个类别:不可移动、可移动和动态。结果表明,本文方法与其他方法相比在标准基准数据集上具有竞争力,并通过将神经网络检测的语义线索与运动线索结合来提高点 - Places: 用于深度场景理解的图像数据库
本论文描述了一个 10 百万场景照片的库,利用卷积神经网络进行图像场景分类,具有高覆盖率和高多样性的实例,为解决目前难以解决的视觉识别问题提供了生态系统。
- 卷积神经网络在遥感图像土地利用分类中的应用
本研究旨在探讨使用卷积神经网络对遥感场景进行语义分类的方法,通过采用 CaffeNet 和 GoogLeNet 架构,并进行多种不同的学习方式包括预训练网络的微调等,实验结果表明该方法在两个遥感数据集的性能表现都显著优于同类方法。