- 人工智能决策中的解释、公平性和适当依赖
研究了基于 AI 解释和分布式公平性之间的关系,发现解释会影响公平感知,从而与人类对 AI 建议的依赖关系发生关联。该研究表明,基于特征的解释并不是改善分布式公正性的可靠机制。
- 人类感知作为量化现象
研究表明,人类感知的量子结构的根源是对自下而上刺激与自上而下认知期望模式的调和,导致了感知的类别化扭曲现象并形成 “quanta”,可用量子原型理论进行建模,而这些 “quanta” 之间存在离散化的距离,导致它们的组合呈现出干涉图案。
- 任务导向对话系统的助益性和公平性
本研究通过建立一个帮助用户完成任务的对话系统并实验探究了基于计算测量的人类感知有用性和公平性问题,结论表明当前目标导向的对话系统中存在潜在的公平问题。
- 测试自然语言模型预测人类语言判断的界限
通过有争议的句子对比较,研究人员发现 GPT-2 是最符合人类语言处理的神经网络语言模型,但也存在与人类感知不符的缺陷。
- AAAI深度神经网络中的不变性是否与人类感知相一致?
研究如何将深度神经网络通过生成具有相同表现的输入来捕捉感知的不变性,并通过敌对正则化程序与人类感知对齐来评估其安全可靠性。
- EMNLPBERT 是否学习人类感知?通过词汇了解语言风格
本研究通过探究人类感知和机器词汇重要性这两个视角,研究了文本的语言风格对词汇用法的影响,通过收集人类感知数据 Hummingbird 并参考目前常用的 BERT 语言风格分类器,比较了两者对于词汇标签的不同理解。研究表明,对于某些风格,如积 - ICML探究黑盒对人脸识别的对抗攻击可感知性
在人类面孔识别系统广泛应用的背景下,本研究通过实测数据,对比了面部识别黑匣子对抗攻击的有效性和人类感知后的可感知性之间的权衡取舍,证明了随着攻击越来越激进,攻击的可感知性存在权衡取舍,同时也揭示了 L2 和其他指标与人类感知不成线性关系的事 - AAAI基于可见区域分割和形状先验的遮挡分割
提出一个基于形状先验知识的可见可切割分割方法,通过集中在可见区域和内存中的形状先验知识,该方法可以消除背景和遮挡区域的影响,提高分割效果。
- 对话的连贯性是否可靠?从对话行为和实体中学习
本文研究了开放领域对话中人类感知的连贯性问题。我们创建了 SWBD-Coh 语料库,并通过统计分析和不同架构的实验来评估模型的性能,发现模型结合对话行为和实体信息时可以实现最佳性能。
- 一个非监督的信息理论感知质量评估度量
通过结合信息理论目标函数的最新进展和基于人类视觉系统的计算体系结构,以及对成对视频帧进行无监督训练,我们提出了感知信息度量(PIM),并在 BAPPS 图像质量评估数据集上证明 PIM 与监督度量相媲美,且在 CLIC 2020 的图像压缩 - 人类和机器视知觉比较时的五个检查点
通过三个案例研究,提出比较研究设计、实验和解释的思路,并讨论了影响结果的因素,提供了一个公平的比较研究清单,以进行人和机器的视觉推理研究。
- 蜂窝连接的无线虚拟现实:需求、挑战和解决方案
本研究分析虚拟现实系统的主要驱动因素及应用场景,将人类感知要求映射到 VR 技术发展的四个阶段中,并针对基于蜂窝网络的 VR 服务列出了四个主要应用场景及其研究挑战,给出了对应的 5G 系统及未来的解决方案,并通过案例研究证明了我们提出的方 - 机器视觉视频编码:协作压缩和智能分析的典范
本文旨在探讨机器视觉中的视频编码新领域 ——Video Coding for Machines (VCM),并系统地回顾了从 MPEG 标准化的独特视角出发的视频压缩和特征压缩的最新技术。最终提出了潜在的 VCM 解决方案,并探讨了未来的方 - 人机视觉编码:可扩展的图像编码方法
本文介绍了一种新的图像编码方案,其通过利用压缩模型和生成模型共同支持机器视觉和人的视觉感知任务,并使用紧凑边缘映射连接两种视觉模式,实现了对图像特征的重新构建,其提供了有用的证据支持 MPEG VCM(面向机器的视频编码)标准化工作。
- ACL通过分析文本复杂度识别对抗性句子
该研究探讨了对抗文本的特点和区别,并提出了一种基于特征提取的识别方法,在准确率和错误率方面都优于现有方法。
- 深层感知压缩
本文探讨了深度学习压缩技术中常用的 MS-SSIM 和 MSE 误差函数与人类感知之间的关系,提出了 Deep Perceptual Compression 技术,通过在深度感知指标和 MS-SSIM 之间进行联合优化,相比先前的学习压缩方 - MOSNet:基于深度学习的语音转换客观评估
本文提出了基于深度学习的评估模型 MOSNet,用于预测转换语音的人类评分,实验结果表明其预测得分与人类得分高度相关,因此可以用作减少昂贵的人类评分需求的计算评估器。
- 语言发生障碍与人类口语转录错误
本研究探讨了与口语转录中出现错误相关的语境,揭示了人类感知语言中的流利性和其他对话语言现象。提供一个新版本的 Switchboard 语料库,用于谨慎地转录口语,并展示了转录错误对自动检测口语中语重心长现象的评估的影响。
- AI 所能做什麼并不重要,重要的是 AI 應該做什麼:走向任務委派的框架
人们更青睐于人机交互的 “机器协助” 模式,而不是完全的人工智能自动控制模式。其中,信任是与人类最佳人机委派偏好相关性最高的因素。
- ECCV深度表示为什么是良好的感知质量特征?
该研究分析了预训练卷积神经网络中的中间特征图如何提高感知质量,并提出了两种新的公式来评估深度 CNN 学习到的特征,发现使用这些特征能更好地预测人类质量判断, 进一步展示了利用该方法来选择深度特征用于形成新的损失函数可以提高单图超分辨率问题