- ICCV来自弱标注照片的美学图像字幕生成
本文介绍了如何通过使用基于网站提供的图片和嘈杂的评论的自动清洗策略创建一个用于美学图像标题生成的基准数据集(AVA-Captions)。同时,还介绍了一种概率的标题过滤方法,以及利用美学属性间的潜在关联性进行卷积神经网络(CNN)特征提取器 - ICCVHowTo100M: 通过观看亿万叙述视频剪辑学习文本 - 视频嵌入
本文提出了使用具有自然语言注释的视频数据来学习文本 - 视频嵌入。我们介绍了 HowTo100M 数据集,该数据集包含了源自于 1.22 百万个讲解视频的 1.36 亿段视频剪辑,能够用于不同领域的学习,证明结果表明,该嵌入方式适用于不同的 - ICCVHomebrewedDB:用于 3D 物体 6D 姿态估计的 RGB-D 数据集
本文介绍了一个新的数据集和基准测试标准,主要针对从 3D 模型(有纹理和无纹理)训练,可扩展性,遮挡,光照和物体外观的变化等方面测试 6D 姿态估计算法的性能,并使用最先进的 DPOD 检测器来设置基线。
- EMNLP学习描述一对相似图片之间的差异
本文介绍了一项任务,即自动生成文本来描述两个相似图像之间的差异。我们通过众包获取了一组新的数据集,并提出了一种模型,该模型使用隐变量来根据像素聚类将不同的像素与输出句子对齐,以捕捉视觉显著性并实现语言和视觉的对准。
- EMNLP阅读理解问题变得更容易的因素是什么?
通过研究机器阅读理解中问题的难易程度,分析数据集创建中的困难之处和基准模型的性能。在手动注释的问题样本中发现,较难的问题需要更多的知识推理和多句话推理技能,并且多选题需要更广泛的推理能力。这些结果表明,在机器阅读理解领域中的最新进展可能被高 - ECCV弱监督和半监督全景分割
这篇论文提出了一种弱监督的模型,能够同时执行语义分割和实例分割任务,并使用图像级别标签弱监督 “stuff” 类别的分割,以及使用边界框弱监督 “thing” 类别的分割。通过分析注释质量和预测性能之间的关系,可以对数据集的创建有所启示。
- 部分遮挡下的面部表情分析:一项调查
本综述回顾了面部表情分析 (FEA) 中因遮挡导致自动表情识别性能下降的原因,并围绕数据集创建、算法发展等方面的技术进展和面临的挑战,为未来工作提供更好的信息和基准。
- 中文文学文本的语篇级别命名实体识别和关系抽取数据集
本文构建了一个基于语篇水平的汉语文学语料库,提出两种标记方法来解决数据不一致性的问题,并介绍了几种常用模型进行实验,研究结果不仅展示了该数据集的可用性,而且为进一步的研究提供了基线。
- 推文中的情绪强度
本文旨在研究从文本中检测情感强度的任务。我们创建了第一个标记有愤怒、恐惧、喜悦和悲伤强度的推文数据集,并使用最佳 - 最差比例(BWS)技术提高注释一致性和获得可靠的细粒度分数。我们发现情感词 hashtag 通常会影响情感强度,通常传达更 - 那是什么时候制作的?
本文提出了基于深度学习的物品制作时间估计方法,利用已有的深度网络特征和新网络 fine-tune 的方法进行训练,创建了两个包含 67,771 个衣物图像数据集并且通过实验和应用验证了其在物品时间信息识别和时尚风格计算方面的准确性和性能。
- 推文中的立场和情感
本文介绍了一种基于社交媒体的立场检测的方法,该方法使用了情感分析来帮助检测人们的立场,同时构建了一个用于训练和测试机器学习模型的数据集,并使用了远程监督技术和词嵌入来进一步提高立场检测的准确性。
- 利用眼球扫视将静态图像数据集转换为尖峰神经形态数据集
提出了一种将现有的计算机视觉静态图像数据集转换为神经形态视觉数据集的方法,通过使用带有动力摄像机平台的移动传感器作为更生物学实际的感知方法,并提供了性能指标和结果,以及与未来工作的比较。
- 识别选举推文目的
本文提出新课题研究如何自动分析选举相关推文的目的,为此创建数据集并开发了自动分类系统,结果表明情感检测等资源对此任务也有帮助。