本书系统介绍Spark大数据处理框架。全书共8章,内容包括大数据技术概述、Spark大数据处理框架、SparkRDD编程、SparkSQL结构化数据处理、HBase分布式数据库、SparkStreaming流计算、SparkMLlib机器学习、数据可视化。本书可作为高等院校计算机科学与技术、信息管理与信息系统、软件工程
本书从系统的角度,成体系地研究动态数据驱动原理与方法。以数据驱动为根本出发点,揭示了复杂系统的设计、运行、控制与优化规律,从信号感知、结构感知、环境感知、情景感知、语境感知、能量感知、过程感知、网络感知、系统感知等不同维度,介绍了主流的理论与方法,提供了研究复杂系统问题的新思路、新方法。
本专著主要介绍基于数据驱动的个性化需求预测理论与方法。根据交互场景的特点,分别从基本交互、交互广度、交互深度和交互多样性四个角度介绍最新个性化需求预测理论与方法。在基本交互场景中,主要研究了基于用户和产品的交互的个性化需求预测;在交互广度方面,主要研究了融合用户与好友关系交互以及融合用户与群组交互场景的个性化需求预测;
数据是组织的重要资产,做好数据管理是盘活数据资源,释放数据价值的有效手段。本书以数据管理为主题,分为背景篇、标准篇、贯标篇、评估篇和政策篇五个篇章,首先梳理了数据管理的概念、背景和发展历程,为读者建立对数据管理的总体认识;其次详细解读国家标准——数据管理能力成熟度评估模型(以下简称DCMM),帮助读者深入理解DCMM标
本书是在大数据时代已经到来之际,在商业、经济及其他领域中,在基于数据和分析去发现问题并做出科学、客观的决策越来越重要的背景下,为了满足日益增长的数据分析人才需求,特开设基于Python的《数据挖掘与数据分析》课程。通过本课程的学习,使学生学会使用Python进行科学计算、可视化绘图、数据处理,分析与建模,并详细拆解学习
在大数据时代,我们并不缺少数据,缺少的是利用数据分析的思维和工具去解决实际问题的能力。数据化分析是运用恰当的方法和工具,对数据进行科学、有效的分析,从而提出有理有据、具有可操作性的建议,以解决现实中的难题。本书主要介绍了数据分析的9种思维、7种工具、学习方法、基本方法、展现方法、制作数据分析报告的方法,以及数据分析的思
本书主要从电子商务数据分析入手,系统介绍在电子商务环境下进行数据分析的各种思路和方法。全书共分为12个项目,主要内容包括初识电子商务与数据分析、使用数据分析工具、分析市场数据、分析竞争对手数据、分析商品定价数据、分析流量数据、分析运营与销售数据、分析库存数据、分析会员数据、分析利润数据、制作数据分析报告,最后一个项目以
数据科学是一门全新的学科,涵盖了从发现罪犯到预测流行病的信息时代。但这不仅仅是我们的电脑、智能手机和信用卡收集的大量信息。本书为全彩印刷,图文并茂地探讨了数据科学如何在科学、社会、商业、娱乐和我们的世界的未来各个方面影响我们。在本书中,数据科学领域的专家解释了该领域的50个发人深省的主题,每个主题,无论多复杂,作者都会
本书以全国职业院校技能大赛“自动化生产线安装与调试”项目所指定的YL335B型自动化生产线为载体,按照“一体化设计、结构化课程、颗粒化资源”的建构逻辑,系统地规划了全书的结构体系。本书内容主要涵盖机械结构、电气线路和传感器检测等自动化生产线的基础技术,以及气压传动、变频调速和交流伺服等运动控制技术,还包括自动化生产线基
本书通过讲解Python编程及其基础应用为大数据专业的学习奠定基础。全书共8个项目,主要内容包括进入Python编程世界、编程计算三角形面积、开发一个面积计算器、开发一个万年历、开发一个扑克牌游戏、开发一个文件自动备份器、字符串加密解密和天气数据分析与可视化。本书以简洁、通俗易懂的语言,讲解了Python中*基本、*重