数据科学十大研究挑战领域
我们提出了一个 “数据科学为社会福祉”(DSSG)研究框架,考虑了相关数据科学研究流派、社会福祉挑战和不同层次的社会技术抽象之间的相互作用,并通过文献分析实证证明了在信息系统(及其他相关学科)中关于 DSSG 的工作缺乏,并强调当前的阻碍因素。我们希望本文和专题论坛能够激发未来的 DSSG 研究,并帮助扭转过去 30 多年来数据科学研究中社会福祉挑战获得比例逐渐减少的令人担忧趋势。
Nov, 2023
数据科学研究正在经历一场由技术、互联网和不断增长的计算能力驱动的革命。我们在此提出,需要创造性地利用科学研究和算法开发社区作为强大创新的轴心,通过关键评估、社区实验和集众智等方式,让这些社区参与科学发现探索,从而带来发展新的数据驱动、可复现且经过充分基准测试的算法解决方案,来解决当前感兴趣的基础性和应用性问题。通过协调社区参与高度复杂和大规模数据的分析,可以找到最佳应对这些挑战的鲁棒方法学。当社区参与采用竞赛形式,也被称为挑战赛时,分析方法的验证在本质上得到解决,建立了性能基准。最后,挑战赛促进跨学科开放创新,创建能够直接或间接协作解决重要科学差距的社区。通过共同努力,参与者可以解决诸如健康研究、气候变化和社会公正等各种重要问题。最重要的是,挑战赛可以催化和加速将复杂数据合成知识或可执行信息的过程,应被视为一个产生持久社会和研究贡献的强大工具。
Dec, 2023
这篇文献讨论了大数据的显著特征及其对统计和计算方法的范式变革产生的影响,强调了高置信度集中最稀疏解的可行性,并指出大多数针对大数据的统计方法中的外生性假设无法被验证,容易导致错误的统计推断和错误的科学结论。
Aug, 2013
介绍大数据科学中使用云计算作为一种实用且成本效益高的解决方案,着重分析软件堆栈的建设模块,为数据科学家提供大数据分析应用的普及服务,为该领域的最新发展和挑战提供各种见解。
Sep, 2017
数据科学是一个具有无限广泛的范围、规模、复杂性和能力的研究范式,通过知识发现在各个学科中广泛应用,具有巨大的潜力和风险,并将带领我们进入对世界的新认知方式。
Jul, 2023
本文研究数据科学家的文献综述实践,并通过 20 个数据科学家的半结构化访谈和思考协议证实,数据科学家在跨学科领域面临挑战,缺少细节和数学内容,借助代码,博客和演讲的知识背景解决文献信息过载问题和借助线上和线下同事的支持。最后,我们概述未来方向,旨在帮助数据科学家应对蓬勃发展的研究文献。
Jan, 2023
学术挑战是推动现有技术发展、将特定主题和问题置于科学界关注的有效手段,同时也是缩小受限社群在访问和参与塑造研究领域方面的差距的重要方式。本文回顾了过去几年里在机器学习及相关领域内最具影响力的竞赛,并分析了各个学科领域的挑战。对科学挑战的目标、主要成就和未来几年的期望进行了审视。
Dec, 2023