- 机器学习应用的代码异味
该论文提出了 22 个机器学习代码异味,解释了它们的背景和可能产生的后果,并给出了相应的解决方案以及它们所属的流程阶段和相关证据,以帮助数据科学家和开发人员生成和维护高质量的机器学习应用程序代码。
- SIGIR产品比较扩展至多家店铺的初步见解
本研究旨在设计一个比较流水线,以满足电子商务业务的操作约束,并通过多家商店的基准测试和用户研究来展示其性能与可行性,为电子商务推荐领域提供新的解决方案。
- SIGIR搜索引擎魔法师:通过与搜索引擎的对话获取信息
本论文针对谈话式信息查找的限制制约了以往的理论研究和实验研究,提出了一个针对谈话式信息查找的流程管道和 “WISE” 数据集,并设计了神经网络架构和预训练 / 微调学习方案,在谈话式信息查找的所有子任务上进行训练,并发布数据集、代码和评估脚 - ICLRAutoGL:自动化图学习库
AutoGL 是首个自动机器学习图形的库,我们提出了包含四个模块的自动机器学习流程:自动特征工程、模型训练、超参数优化和自动集成,其中每个模块都提供了多种最先进的方法和灵活的基类和 API。
- 基于 Kapture 的稳健图像检索视觉定位
本文介绍了一种新的数据格式和工具箱 ——kapture,其用于视觉定位和 SFM;通过介绍 kapture 的可适应性管道,证明其在多个公共数据集上的表现,成为该领域的领导者,能够促进未来的研究。
- ICLRAutoHAS: 高效的超参数和架构搜索
本文提出了一种统一的管道,AutoHAS,以高效搜索架构和超参数,该管道可以更新共享网络权重和强化学习 (RL) 控制器来学习架构候选项和超参数候选项的概率分布, 可以有效地提高具有不同搜索空间和数据集的网络的准确性。
- DeepFaceLab:集成、灵活且可扩展的人脸交换框架
我们提出了 DeepFaceLab,这是当前支配面部交换的深度伪造框架,它提供必要的工具和易于使用的方式来进行高质量的面部交换,并提供了一种灵活松散的耦合结构,详细介绍了 DeepFaceLab 的实现原理和流程,并比较了我们的方法与其他面 - 搜索引擎对话:基于 SERP 的对话回应生成
本文讨论了 Conversational Agents(CAs)和 Conversational Search(CS)的研究,提出了一个使用自然语言与搜索引擎对话的系统,并使用 Crowdsourcing 平台的工作人员创建了 Search - 句子情感的可控转换
本文提出了一种利用情感分类器和自编码器改变句子情感以生成更多训练数据的自动化流程,并使用词向量模型得出了 54.7% 成功率的实验结果。
- MM基于 OpenCV 库的 MORPH-II 人脸数据库图像预处理
本文介绍了对 MORPH-II 非商业数据集的 55,134 张图像进行预处理的步骤。介绍了预处理流水线中的每个步骤及其细节,提供了与每个步骤配对的 OpenCV 功能,并讨论了可能的改进。
- 82 个树库,34 个模型:多树库模型实现通用依存句法分析
介绍了 Uppsala 系统,它是一个由三个部分构成的流水线,可以用于 CoNLL 2018 共享任务的普遍依赖语法分析。通过使用多个树库对同一语言或密切相关语言训练模型,我们极大地减少了模型数量,最终在公开测试上获得了 LAS 和 MLA - Autostacker: 一种组合进化学习系统
Autostacker 是一种基于 Evolutionary Algorithm 的自动机器学习建模架构,通过创新的分层堆叠结构快速演化候选流水线,从而找到机器学习模型的创新组合和结构,而无需事先了解数据或特征预处理。与其他自动机器学习系统 - 公平流水线
本研究旨在通过将公平考虑因素分离出来,促进机器学习的公平性,特别研究了公平如何通过复合决策流程(我们称之为流水线)传播,算法公平性之前的工作仅关注于一个决策方面的公平性,然而许多决策过程需要超过一个决策。
- CVPREAST: 一种高效准确的场景文本检测器
本研究提出了一种简单而强大的场景文本检测流程,该流程可以直接预测全图中任意方向和四边形形状的单词或文本行,消除了不必要的中间步骤(例如候选聚合和单词划分),只需要一个神经网络进行操作,大大提升了检测的准确性和效率。
- 音频事件检测为何比分类更难?
本文针对音频事件的检测任务,通过加入高质量事件分类器,构建了一个改进的检测管道,实现了自动化验证和拒绝虚假警报,结果表明此管道在各种检测和分类器组合下,均可显著提高检测性能。
- 大规模连通组学的多通路方法
该研究提出了一种基于多核系统的、可用于实时处理电子显微镜数据的多通道管道,并演示了其在重建神经元连接性的准确性和速度上的优势。