本研究探讨大数据推荐系统中的算法,并提出了一种基于三级层次结构的分类方法,通过实证和实验评估,对各种技术进行了排名。同时,研究还展示了大数据技术在推荐系统领域的未来前景和进一步研究的机会。
Feb, 2024
使用机器学习模型,大数据引入了一种新的预测能力。本文评估了 “大数据” 在典型材料科学机器学习问题中的含义,涉及数据量、数据质量和真实性以及基础设施问题。通过选定的示例,研究了模型在相似数据集上的泛化能力、如何从异构数据源收集高质量数据集、模型的特征集和复杂性如何影响表达能力以及创建更大数据集并在其上训练模型所需的基础设施要求。总之,我们发现大数据在各个方面都带来了独特的挑战,这应该促使进一步研究。
May, 2024
本文提供了关于数据工程任务的描述和分类,包括数据组织,数据质量和特征工程,以及四个数据集和例子分析,以帮助减少这项任务的负担并推动数据工程自动化的研究。
Apr, 2020
这篇论文探讨了文本挖掘的任务及技术,其中包括文本预处理、分类和聚类,并简要介绍了文本挖掘在生物医药领域中的应用。
Jul, 2017
调查报告探讨机器学习和自然语言处理领域中数据收集的现状和挑战,特别关注数据获取、标注和模型优化三个方面,提供技术选择建议,并指出有待研究的问题。
Nov, 2018
本研究讨论了文本分类算法的概述,包括不同的文本特征提取、降维方法、现有算法和技术、评估方法,并探讨了每种技术的限制和在实际问题中的应用。
Apr, 2019
本文探讨大数据管理的三个层面:技术、人和流程,并强调技术、人和流程对于大数据管理是有关键性作用的。
Jan, 2022
通过使用方法论分类将算法进行细分并实施实证评估和实验比较,我们的研究是第一篇利用此方法论分类对文本分类算法进行分类的综述论文。
Jan, 2024
本文探讨数据流聚类的不同问题定义、特定困难以及各种方法的基础,以及如何解决不同问题。
Jun, 2010
本文通过问卷调查的方式,探究了大数据在教育机构中的应用以及采用大数据和分析技术时的制约因素。
Jul, 2022