Despite data's crucial role in machine learning, most existing tools and
research tend to focus on systems on top of existing data rather than how to
interpret and manipulate data. In this paper, we propose datalab, a unified
data-oriented platform that not only allows users to interac
介绍了 Data and Learning Hub for science (DLHub),它是一个多租户系统,具有模型库和服务功能,并专注于科学应用,这解决了当前系统中的一些局限性。DLHub 使用户能够共享、发布、验证、重现和重用模型,并通过简单的 Web 接口使用可扩展和低延迟的服务能力,以提高模型可用性和可访问性。
介绍了 BiblioDAP'21: 第一届 Bibliographic Data Analysis and Processing 工作坊,指出由于发表的论文数量的显著增加以及固有的挑战,自动处理引文数据在数字图书馆、数据科学和机器学习中变得非常重要,其包括自动从 PDF 文档中提取引用、构建精确的引文图和作者名称消歧等方面。