- 混合倡议人工科学文本检测的理解和解释
通过定量实验,我们确定了人工和机器生成科学文本之间的关键区别,并提出了一种混合倡议工作流程,用于高效、可靠地检测科学文本,结合了人类专家的先前知识与机器智能,以及可视化分析原型。我们通过两个案例研究和与熟练研究人员的控制用户研究证明了我们的 - 未来机器智能的场景与分支点
本文探讨了机械智能发展的四种情景以及相关的六大限制条件。
- 大型语言模型无法处理心智理论任务中的微小改变
本文主要讨论机器智能领域中关于直觉心理与人类智能之间关系的研究,着重研究认知心理学中的模拟推理问题,并探讨可能的未来发展方向。
- 机器更容易记忆哪些图像?
本文研究了计算机视觉中图像记忆度的量化和预测问题,提出了机器记忆度和复杂度的概念,并分析了机器和人类在图像记忆方面的不同表现和机器记忆的影响因素。
- 数据和知识获取原理与实践研讨会 2022 (PKAW 2022)
PKAW2022 将继续聚焦于知识获取和机器智能领域,并欢迎在人工智能技术和应用,以及人类和大数据驱动的多学科方法的贡献。
- DALL-E 2 无法可靠地捕捉常见的语法过程
评估了 DALL-E 2 捕捉语言学家广泛讨论的 8 种语法现象的能力,结果表明 DALL-E 2 不能可靠地推断与语法一致的含义,这挑战了最近有关这类系统理解人类语言能力的论点。
- 相互信息散度:多模态生成模型的统一度量
采用 CLIP 特征的负高斯交叉互信息度量被提出,用于评估 text-to-image generation 和 image captioning 任务的机器智能水平,与竞争指标相比具有一致性、样本简约性和鲁棒性,并在多模态表示学习中得到了 - ICLR使用加强和循环关系推理进行规则发现
本文介绍了 R5,一种基于强化学习的关系推理框架,可以在关系图数据上推理,从观察结果中明确挖掘成分逻辑规则,具有强大的系统性和稳健性,实验结果表明 R5 在关系预测任务中优于各种基于嵌入和规则归纳的基线,并在发现基本事实规则时达到高召回率。
- CVPR视觉诱导推理
本文提出了一种基于可视信息的机器智能推理任务及对应数据集 Visual Abductive Reasoning (VAR),并基于 VAR 数据集设计了一个基于 causual-and-cascaded reasoning Transfor - 抽象视觉推理研究的新兴方向综述
本论文回顾了近年来浮现出的抽象视觉推理问题的研究,并提出了一个分类体系来归纳这些问题的性质。通过研究这些问题在输入形状、隐藏规则、目标任务、认知功能和主要挑战等五个纬度上的共性和差异,一方面对于解决 Abstract Visual Reas - 多模态知识图谱构建和应用:综述
该研究论文介绍了多模态知识图谱,探讨了构建及应用过程中的挑战和进步,并分析了不同解决方案的优缺点及与 MMKG 相关的未解决研究问题。
- 抽象视觉推理的深度学习方法:关于瑞文渐进矩阵的调查
本文总结了近年来深度学习方法在抽象视觉推理领域的应用研究进展,并重点关注了目前最普遍的抽象视觉推理任务 —— 瑞文渐进矩阵(RPM),并提供了综合的深度神经模型和学习方法以及 RPM 基准集的分析,对现有方法的性能进行了分析,为当前和未来研 - WWW在决策前咨询父母及其子代:充分利用层次结构进行自监督分类法扩展
本文提出了层次扩展框架 (HEF),旨在更好地利用分类法的分层结构进行分层扩展。HEF 在多个方面利用分类法的分层结构,利用亲属关系检测和几个树独特功能来评估其子树的连贯性,并引入适合度评分来选择最优位置,将信息交换用于消歧和自我纠正。该模 - 走向健壮的模式识别:一份综述
本文从打破 “封闭世界”“独立同分布” 和 “干净大数据” 三个基本假设的角度出发,全面回顾了鲁棒模式识别的研究,并分析了当前方法的缺点和限制,为未来的研究方向提供了重要的参考意义。
- AAAI机器数感:一组用于抽象和关系推理的视觉算术问题数据集
为了将关键的认知能力赋予机器智能,本文提出一个新的数据集,即机器数理感知 (MNS),其由采用 And-Or Graph (AOG) 语法模型自动生成的视觉算术问题组成,提出结合经典搜索算法和现代神经网络的方法,以更好地理解数字概念和关系运 - ICCV目标驱动的序列数据抽象
采用一种基于强化学习实现的框架,实现了自动对序列数据进行目标驱动的数据抽象。该框架在不受数据输入顺序限制的同时,还可以定义不同的目标,以便以最好的方式保留输入数据的不同方面,能够在涉及手稿、视频和文本数据的情况下实现最佳抽象结果。
- CN-Probase:面向大规模的中文分类体系构建的数据驱动方法
本文提出了一种自动构建大规模高质量中文分类体系的方式 —— 从多个中国百科全书中提取 isA 关系,并通过三种启发式方法来验证。最终建立了精度约为 95% 的最大的中文分类体系 CN-Probase。
- 胸部 X 射线弱监督深度学习用于疾病分类和定位
本文提出了一种基于弱监督深度学习框架的方法,该框架配备了压缩和激励块、多图传输和最大 - 最小池化,用于分类胸部疾病以及定位可疑病变区域,实验证明所提出的模型具有更好的性能。
- TieNet: 用于胸部 X 光片中常见胸部疾病分类和报告的文本图像嵌入网络
本文提出了基于 Text-Image Embedding 网络的自动标注框架和胸透报告系统,利用临床自由文本的先验知识,结合卷积循环神经网络的多层注意力模型,对图像和文本进行嵌入和分类,并在未标记数据上相对于现有技术取得了更好的分类结果(平 - CVPR视觉对话
本文介绍了视觉对话任务,即通过图像、对话历史和问题,要求 AI 智能体以自然、对话式的语言与人类进行有意义的对话,并率先提出了一种基于视觉的通用测试方法以及一种新颖的二人聊天数据收集协议。在此基础上,利用 Latre Fusion、Hier