本书在内容编排上共设置五章:第一章基于大数据的内涵与发展、大数据的主要应用价值与挑战、大数据时代及其特征方面诠释大数据理论与大数据时代;第二章解读大数据处理架构与技术,内容涵盖大数据处理架构Hadoop及其生态系统、大数据处理架构SPSSModeler及其文本挖掘、大数据存储与管理研究;第三章分析数据挖掘技术及其常用算
本书将现场总线控制技术与工程应用相结合,先简单介绍了工业数据通信的基础知识;再从工程应用角度出发,以项目案例的形式介绍了CAN、PROFIBUS-DP/PA、工业以太网、PROFINETIO、AS-I等总线的规范、技术特点、组态方法,以及经典WinCCV7.3及TIAPortalWinCCV13组态软件的特点、组态与应
本书详细阐述了大数据领域数据采集与预处理的相关理论和技术。全书共8章,内容包括概述、大数据实验环境搭建、网络数据采集、分布式消息系统Kafka、日志采集系统Flume、数据仓库中的数据集成、ETL工具Kettle、使用pandas进行数据清洗。本书在第3章至第8章中安排了丰富的实践操作,以便读者更好地学习和掌握数据采集
本书共分八章。章主要介绍语言、语法、句法的基本概念,也借此阐明笔者自己的观点,交代句法分析的一般背景。第二章主要从句子定义、句子分类、词在句中的格位变化以及句子结构成分间的语法关系与语法意义等几个方面介绍阿拉伯传统语语法学家的传统句法观,交代阿拉伯语传统语法学家研究阿拉伯语句法的基本脉络和基本内容,并做简要评价。 第
本书以数据思维为主题,以数据分析全流程为主线,融合了与数据思维相关的编程语言、统计学基础及案例分析等内容,全书分为4篇,囊括了数据思维的概念和培养方法、数据来源及体系建设、数据分析三大思维方式及用户流失、用户转化实战等共11章的内容。本书囊括了数据分析中常用的分析方法,包括经典的海盗(AARRR)模型、麦肯锡的MECE
本书参照教育部计算机基础课程实验教学的基本要求,主要介绍信息技术及其应用,从基础原理出发、以具体应用为导向进行数据处理讲解。全书共三部分:第一部分(第1~4章)为数据处理基础,介绍数据获取以及基本的数据处理方法,包括使用软件、浏览器插件等工具爬取数据,Excel电子表格数据处理和图像数据处理;第二部分(第5~8章)为数
本书面向大数据技术专业,遵循知识性、实用性、系统性、条理性、连贯性和先进性的原则,力求激发读者的兴趣,注重实践性环节教学,注重各知识点之间的衔接,精心组织内容,做到由浅入深、突出重点。本章共9章,第1章为Spark基础,主要包括Spark基础知识、Spark应用场景以及Spark生态系统等内容;第2章为Scala语言基
本书共六章内容,具体安排如下。第1章,描述了数据科学的基础概念和发展历程,对数据科学的定义、方法、工具、语言和框架做了的总体介绍。此外,第1章从教育、医疗、交通、农业、营销、用户行为特征等方面展开说明数据科学对现实生活的影响,以及从海量数据的有效性与数据共享问题揭示数据科学目前面临的机遇与挑战。第2章,阐述了数据科学的
本书由资深大数据专家精心编写,循序渐进地介绍了Flink生态系统主流的大数据开发技术。全书共7章,第1章讲解Flink的基础知识,包括Flink应用场景、主要组件、编程模型等,最后通过一个单词计数示例带领读者快速体验Flink应用程序的编写;第2、3章讲解Flink的多种运行时架构、任务调度原理、数据分区以及Flink
本书旨在梳理和探究数据资源与数据资产的一些相关问题,主要涉及数据资源的概述、价值、确权、流通与数据资产的概述、定价和管理。前半部分主要围绕数据资源展开,在对数据资源发展历程与现状梳理的基础上,探讨了大家关注的数据资源价值、确权和流通等问题。后半部分围绕数据资产展开,在对数据资产进行概述的基础上,探讨了数据资产的定价特征