- IJCAI社区发现的深度学习:进展、挑战和机遇
本文介绍了社区检测在科学研究和数据分析中的重要性, 分析了经典社区检测方法的局限性,探讨了基于深度学习的三个研究方向 —— 深度神经网络、深度图嵌入和图神经网络,总结了不同框架、模型和算法的进展和挑战,并探讨了未来研究机遇。
- 困了?别担心!:任务感知的命令推荐与主动帮助,面向分析师
本文提出了一种基于任务感知的命令推荐系统,利用主题建模技术将用户任务信息纳入模型中,同时引入帮助预测模型以主动为用户提供指令推荐,通过基于网络的分析软件的日志数据,证明了我们神经元模型的卓越性能。
- 大数据下的端到端实体解析:一项调查
本文首次提供现代实体解析工作流的全面视图,并介绍了实体索引和匹配方法的新颖方面,旨在同时应对多个大数据特征的挑战。文章从数据库、语义 Web 和机器学习三个方面分别阐述了基本概念、处理步骤和任务策略,并最终提供了现有方法的综合讨论,最后详细 - 使用神经网络识别网络新闻中的标题党
本研究提出了一种使用深度学习方法来检测 2017 年 Clickbait Challenge 数据集中的 clickbaits 的模型,同时利用数据分析和可视化技术探索和发现数据集中的信息。该模型在均方误差方面在 Clickbait Cha - 盲目多类集成分类
本研究介绍了一种基于联合张量和矩阵分解的动态匹配方法,旨在实现从多个分类器集合中无损学习。该方案效果得到了在真实和合成数据集上的评测。
- 移动社交大数据:微信朋友圈数据集、网络应用和机会
本文讨论了通过 WeChatNet 数据集,对移动社交网络的信息传播、网络流量预测以及人口分布进行数据分析的研究,并探讨了使用该数据集进行新应用程序开发的潜在研究机会。
- 张量网络的降维和大规模优化。第 2 部分:应用和未来展望
本文介绍了张量网络及其运算的简介并侧重于介绍用于数据 / 参数的超压缩高阶表示的张量网络模型及其应用, 包括支持张量机、求广义特征值、深度神经网络等优化问题的张量分解方法,如张量列车和分层 Tuck 分解,并通过图形方法以及基于核张量的低秩 - MM大数据、数据科学与公民权利
数据分析和算法决策越来越影响我们生活的各个方面,因此有必要确保它们不成为歧视,不公平,社会正义和不公平源泉的工具。本文提出了一个明确的研究议程,旨在解决这些问题。重点包括:确定模型是否存在偏见,将公平意识纳入机器学习方法中,提高数据驱动和模 - MMSeer:数据分析赋能软件定义网络
Seer 是使用软件定义网络和大数据原理构建的灵活高可配置的网络智能数据平台。其可实现基于数据流量学习的预测,用于智能城市环境中移动设备的移动模式预测。
- KDD量化问题的在线优化方法
本研究提出了用于优化量化特定的性能参数的首批在线随机算法,其对于多变量优化的理论具有最优的收敛性,并通过实验验证,相对于现有的算法,能够更好地对性能参数进行优化。
- MacroBase:在快速数据中优先考虑注意力
MacroBase 是一种数据分析引擎,适用于高容量的快速数据流,文中介绍了 MacroBase 实现高效、准确、模块化的分析方式,利用新型油藏取样器和针对快速数据流的重量级策略实现对数据进行高效搜索,速度比其他替代方法快一个数量级。
- NIPS机器学习技术在大型移动用户数据集上的实际应用
在这篇论文中,作者描述了从关系数据库管理系统(RDBMS)到分布式大数据分析平台的转变,这个平台适用于大规模机器学习和数据挖掘,利用通信服务提供商 (CSPs) 的大规模交易数据资产以及数据分析技术,用于服务个性化、预测建模和产品优化,而这 - 具有保证的改进实用矩阵草图
本研究对大规模数据分析中矩阵表示及其压缩方法进行了分类和比较,尝试通过优化压缩方法,在保证错误界限的同时实现大小和时间的双重优化。
- 基于大数据的计算创意方法
数据驱动的计算机创意系统可结合创意领域和愉悦心理物理学数据来源,利用大数据分析技术产生新颖高质量的创意产物,本文以烹饪食谱和菜单为例展示了该方法。