- 面向目标高效能项集的研究
本文提出了一种名为 THUIM 的新型基于列表的算法和匹配机制,以快速匹配挖掘过程中的高效用途项集,以选择目标模式,相对于已提出的算法,THUIM 在运行时间和内存消耗方面表现良好,并具有良好的可伸缩性。
- 带标签的分布式转移系统用于隐私分析
DLTTS 是一个逻辑框架,它形式化地模拟了一个给定的数据库,如何通过代理 / 对手反复查询数据库。
- MLFW:口罩人脸识别数据库
本文章研究口罩对面部识别的影响,并搭建了一个生成口罩面部的自动化工具,建立了新的 Masked LFW(MLFW)库。通过实验发现,与原始图像比较,先进的面部识别模型在 MLFW 上的识别准确率下降了 5%-16%。
- MIA-COV19D: 基于三维胸部 CT 图像分析的 COVID-19 检测
本文介绍了一个包含约 5,000 个三维 CT 扫描的标注 COVID-19 的数据库(COV19-CT-DB),其中分为训练集、验证集和测试集,并且提供了基于 CNN-RNN 网络的深度学习方法以及其在该数据库上的性能报告。
- 人脸变换器用于识别
使用 sliding patches 修改 Transformer 模型在人脸识别中的表现,并在多个主流数据库上进行了实验,这些 Face Transformer 模型与采用相似参数和计算能力的 CNN 模型性能相当。
- 文本转 SQL 解析器的无上下文语法预训练
提出了一种名为语法预训练的 Text-to-SQL 解析新方法,通过增加问题词后的随机值以及优化解码器部分的向量初始化,采用泛化效果更佳的非零训练损失等技术提高了模型性能,成功地应用于了跨数据库的 Text-to-SQL 数据集(spide - MMSoccerDB:一个用于综合视频理解的大型数据库
本文提出了一种名为 SoccerDB 的新足球视频数据库,包含 171,191 个视频段,702,096 个边界框,37,709 个基本事件标签以及 17,115 个高光时刻注释,可用于目标检测、动作识别、时间动作定位和高光检测等任务。该数 - MM从网页抓取的文本到项目描述:社会创新项目的自动摘要
本文提出并比较了几种基于文本的方法(如 SVM、递归神经网络和 ensemble)来描述社会创新项目。同时,我们针对主题建模提出了一种新的用于自动评估摘要的度量标准。
- ALEX: 一种可更新的自适应学习索引
本文讨论了学习索引在 DBMS 索引中的应用,并介绍了一种新的学习索引 ALEX,其结合了学习索引的核心思想和成熟的存储和索引技术,可在动态更新的数据库工作负载中实现高性能和低内存占用。
- ReMASC:用于语音控制系统的逼真的重放攻击语料库
本文介绍了一个新的语音记录数据库,目的是支持关于语音控制系统(VCSs)的漏洞和保护研究。该数据库包含真实语音指令和被重放记录的指令,采集了现代语音助手开发套件,记录于不同环境条件下,不同形式的背景噪声和发言人与设备之间的相对位置。据我们所 - 通过 SQL 查询日志缩小自然语言与数据库之间的语义差距
本文提出了一种利用数据库 SQL 查询日志信息来提高现有自然语言接口到数据库的性能的方法,并通过实验评估证明了该方法的有效性,最终准确度提高了 138%。
- ApolloCar3D:自动驾驶的大型三维车辆实例理解基准
本文介绍了一种适用于自动驾驶研究的大规模 3D 汽车数据库,并提出了使用深度学习算法进行图像分割和车辆姿态与形状估计的方法,并使用关键点进一步优化模型性能。
- EMNLPSpider: 复杂跨领域语义解析和文本到 SQL 任务的大规模人类标注数据集
介绍了 Spider 数据集,它是由 11 名大学生注释的大规模、复杂和跨领域的语义分析和文本到 SQL 数据集,涵盖了 200 个数据库中的 138 个不同领域,区别于以往单一数据库且训练集和测试集中使用相同程序的语义分析任务,需要模型具 - 增量式物体数据库:从多个局部观测建立 3D 模型
提出了一种使用移动代理逐步建立物体数据库的系统,从全局分割图中提取对象状的片段,并将其储存在数据库中,然后匹配和合并以创建和改进对象模型,该方法不需要场景中形状的先前知识。
- 情感语音数据库:实现对语音生成系统中情感维度的控制
本文介绍了一种情感语音数据库,涵盖男性和女性以及法语男性等不同语音。该数据库可以用于合成和生成语音,并且可以控制情感维度。通过建立一个简单的 MLP 系统,我们可以将中性语音转换为愤怒语音风格,并通过 CMOS 感知测试评估其效率,结果表明 - CVPR使用自适应损失和大规模事故数据库预测交通事故
本文研究交通事故的预测,并提出了 AdaLEA 和自注释数据库等方法,在实验中取得了较好的平均精确度和在接近碰撞时间方面更早的预测时间。
- 用于检测交通几乎碰撞事件的驾驶视频分析
本研究通过在百余辆出租车上安装行车记录仪,建立了一个交通近失事故数据库(NIDB),用于帮助自动驾驶车辆和高级驾驶辅助系统(ADAS)自我学习,并开发了一种近失识别方法,其性能可与人类对近失事故的理解相媲美。
- 设计公平的排名方案
本文介绍了一种方法,帮助用户选择公平的准则权重,在多维空间中为一系列公平准则展示出满足这些准则的区域,如果不满足相应准则,提供最小的修改建议。实验证明,该系统能够有效地满足公平性要求。
- 用于植物幼苗分类算法基准测试的公共图像数据库
提供了一个包含 960 种不同植物的数据库,包括带有注释的 RGB 图像和基于 $f_{1}$ 分数的基准分类结果评估,可公开访问。
- 远程心率测量可重复性研究
本文研究了远程光电容积脉搏图 (rPPG) 的可重复性问题。建立了一个含有大量被试的、公开的数据库,并选择了三种发表在文献中最前沿的 rPPG 算法作为开放源代码软件进行实现和发布。通过在各种设置下的深入、公正的实验评估,发现没有一种选定的