Sep, 2013
数据未定义:大数据定义概述
Undefined By Data: A Survey of Big Data Definitions
Jonathan Stuart Ward, Adam Barker
TL;DR本文尝试对 “大数据” 这一常用术语进行统一定义,以解决其多样性和歧义性给相关讨论带来的影响。
Abstract
The term big data has become ubiquitous. Owing to a shared origin between
academia, industry and the media there is no single unified definition, and
various stakeholders provide diverse and often contradictory d
发现论文,激发创造
大数据的规模有多大?
使用机器学习模型,大数据引入了一种新的预测能力。本文评估了 “大数据” 在典型材料科学机器学习问题中的含义,涉及数据量、数据质量和真实性以及基础设施问题。通过选定的示例,研究了模型在相似数据集上的泛化能力、如何从异构数据源收集高质量数据集、模型的特征集和复杂性如何影响表达能力以及创建更大数据集并在其上训练模型所需的基础设施要求。总之,我们发现大数据在各个方面都带来了独特的挑战,这应该促使进一步研究。
May, 2024
大数据分析挑战
这篇文献讨论了大数据的显著特征及其对统计和计算方法的范式变革产生的影响,强调了高置信度集中最稀疏解的可行性,并指出大多数针对大数据的统计方法中的外生性假设无法被验证,容易导致错误的统计推断和错误的科学结论。
Aug, 2013
大数据系统应对机器学习挑战:向大数据科学服务发展
介绍大数据科学中使用云计算作为一种实用且成本效益高的解决方案,着重分析软件堆栈的建设模块,为数据科学家提供大数据分析应用的普及服务,为该领域的最新发展和挑战提供各种见解。
Sep, 2017
区块链在大数据领域的调查:方法、机遇和未来方向
本文全面调查了区块链在大数据领域中的应用,着重研究最新的方法、机会和未来方向,包括区块链服务以实现大数据采集、存储、分析和隐私保护,以及在智慧城市、智能医疗、智能交通和智能电网等不同垂直领域的应用。此外,文章还涵盖了一些代表性的区块链大数据项目,并分析了面临的挑战和未来方向。
Sep, 2020