- AAAI在哪举办人工智能会议更好,温哥华还是______:为何比较性问题很难完成
本论文研究以大型神经语言模型填充人类编写的比较问题中的实体,证明在三个不同子域中这些模型的性能可以接近于人类的完成水平,但分析表明它们学习的内容并不能建模任何广泛的可比较或类似的实体,而是非常特定于特定领域,性能与训练集中特定实体的共现高度 - 不一致约束集的高效诊断算法
该论文介绍了一种基于分治的诊断算法(FastDiag),它可以在超约束问题中识别出最小的错误约束集,以恢复一致性,并与冲突导向的命中集计算进行对比,得出了我们方法的优势。
- 关于在双曲空间中的普洛克鲁斯特分析
本文讨论了如何在双曲空间中运用 Congruent Procrustes analysis 寻找最佳匹配的方法,并给出了在没有测量噪声的情况下的最优同构闭合式解。同时,作者还分析了该方法在测量噪声存在时的性能表现。
- 一个易于使用的实际多目标优化问题套件
提供一个包括 16 个实际边界约束的多目标优化问题的集合,其中有 4 个混合整数优化问题,它们可以用来评估进化多目标优化算法的性能,并提供了 Java、C 和 Matlab 的源代码,同时提供了 8 个约束多目标实际问题。
- 医疗虚拟现实培训模拟器中的动态时间序列分类评分和评估
本研究提出并评估了用于虚拟现实(VR)培训模拟器的评分和评估方法。借助动态时间规整多元原型(DTW-MP)分类算法,本研究分析了 271 名医学生的 VR 训练数据,提高了专家级数据的可用性。通过运动分析,可以检测出个人使用的不同技术并动态 - IJCAI基于图的神经句子排序
本文提出了一种基于图神经网络的句子排序模型,通过共享实体来建立更具表达力、噪音更小的图表示,可以更准确地学习语义表示,实验结果表明,我们提出的模型准确性高于现有的最先进系统,并对实体如何帮助性能进行了深入分析。
- 算法歧视:基于深度学习人脸生物特征识别的表述和探索
本研究使用包含 6 个不同族裔的 24K 身份的新 DiveFace 数据库进行了面向深度学习的人脸识别的全面研究和性能分析,并证明了流行面孔数据库高度代表性的族群,导致预先训练的深度面部模型具有很强的算法歧视性,该歧视性可以定性地观察到深 - ICML使用 Epsilon-Greedy 算法的多媒体信息搜索性能有效性研究
通过系统捕捉和分析人类用户的反馈模式,可以对多媒体内容进行有效索引,并使用 epsilon-greedy 方法避免本地最大值,并提高多媒体信息检索性能。
- 带附加信息的安全线性汤普森抽样
本文针对线性随机赌博机问题提出一种基于线性 Thompson 抽样的新型安全算法,通过引入线性安全约束,在与没有安全约束的情况下,展示了使得机器人有更好的性能表现的结果,并将其与基于 UCB 算法的安全算法进行了比较。
- 自适应交通信号控制的开源框架
研究了不同自适应信号控制器模型的性能差异和相对优劣,提出了一个用于模拟和评估不同自适应信号控制器模型的框架,并探讨了模型的超参数与性能之间的关系。
- 深度学习时代的显著目标检测:深度调研
本文综述了计算机视觉中的一个重要问题:显著物体检测(SOD)。研究者们采用基于深度学习的方法进行研究,并从算法分类法到未解决的问题等多个角度全面梳理了深度学习在 SOD 方面的最新进展,提出了一些新观点和实验结果。
- 基于词嵌入的无监督缩略语消歧
本文提出了一种完全无监督的缩写消岐方法(称为 UAD),它通过从非结构化文本中获取缩写定义,并学习用于表示其不同含义的上下文向量,进而提高其消岐性能,并支持多个含义的成千上万个缩写,是一种高度适用于实际部署的模型。经过充分的实验评估,UAD - CVPR虚拟地面真实性和 3D 兴趣点预选,以提高 2D 检测器的可重复性评估
通过虚拟三维场景辅助测试,本文探讨了如何改进二维图像处理中的特征检测器,并将其应用于三维环境中。实验结果表明,虚拟环境可以提高特征检测器的性能,消除了大量误报情况,并通过 ROC 曲线测量指标展示了二维和三维性能的权衡。
- 多步深度强化学习的理解:对 DQN 目标的系统研究
本论文对多步方法在深度强化学习中的表现进行了测试和分析,将包括 Retrace 和 Q-learning 等等在内的各种算法与 DQN 进行比较,在山车环境下进行了许多测试,指出需要注意调整 backup length 参数和 target - 野外识别伪装人脸
该论文提出了一种包含 1000 个身份,11000 张有不同伪装配饰的面部图像的数据库:DFW。该数据库在一个非限制性环境下,总结了伪装变量,允许人们在难以区分的环境下进行面部识别。
- 现代 CPU 上 FFT 卷积比 Winograd 更快,这是为什么
比较了三种高度优化的实现方式(常规 FFT、Gauss-FFT 和 Winograd-based convolution)在现代多核和众核 CPU 上的效果,并使用 Roofline 性能模型对三种方法的计算阶段进行了详细的分析,结果显示 - ECCV诊断时间行为检测器中的错误
本文提出了一种新的诊断工具,以分析视频中时间动作检测器的性能并比较不同方法的效果,该工具可以帮助研究人员改进处理关于时间动作检测中的问题,例如如何更好地处理时间上下文问题以及如何提高对实例绝对和相对大小的稳健性等问题。另外,该实验分析发现, - 面向带客户偏好的服务在线提前预定调度
本文研究预约服务的 Web 和移动应用程序,针对该类问题提出了带性能保证的新算法,并在纽约市卫生系统的预约数据上进行了测试。
- 野外话语一致性:数据集、评估和方法
本文针对真实世界数据中的语篇连贯性方法进行了评估,并引入了新的数据集和神经模型进行性能比较和分析,结果表明神经模型表现最佳,在四个领域的低连贯性文本中发现了一些规律。
- 深度神经网络训练的基准测试和分析
通过提出一个新的 deep neural networks 训练基准 (TBD),并在三个主要的深度学习框架 (TensorFlow、MXNet、CNTK) 上进行广泛的性能分析,本文为 DNN 训练提供了一套新的分析工具集以及对未来研究和