大数据这个原本陌生的专业词汇迅速进入大众视野,掀起了一场新的数据技术革命。大数据正在改变我们的生产、生活、教育、思维等诸多领域以及认识、理解世界的方式,作为时代精神精华的哲学,应该及时对这场数据革命做出全面的回应和批判,深入分析大数据对我们的世界观、认识论、方法论、价值观和伦理观将带来的深刻变革。本书全面建构了以大数据
"本书聚焦于Hadoop、Spark、Flink等面向数据密集型应用的分布式计算系统,将原理、架构、编程的知识进行有机结合,统一从设计思想、体系架构、工作原理、容错机制和编程示例5个维度进行剖析。本书注重通过横向比较阐释该类系统设计的共性原理,帮助读者形成完整、统一的知识体系。本书概述了分布式计算系统(第1章),根据应
本书主要介绍了大数据的基本概念、原理、方法和技术。全书共分11章,第1章介绍大数据的基本概念;第2章介绍大数据系统生态;第3、4章分别论述大数据存储与管理技术、大数据计算与处理技术;第5、6、7、8章介绍大数据获取技术、大数据预处理技术、大数据分析技术、可视化展现技术;第9、10、11章介绍了3个典型案例。全书坚持系统
本书聚焦综合信息系统智能化的关键和难点,摒弃传统的处理模式,充分利用数据的不确定性信息,就区间、序列、直觉模糊、犹豫模糊、语义等不同类型数据的相似度量、粒层转化、识别决策等开展了较为系统、深入的研究,构建异类数据间统一的粒层转换框架,解决不同类型数据间的相似度量、跨层关联与融合问题。全书共分15章,第1章介绍问题的来源
过程控制是由控制理论、计算机技术和仪器仪表、工艺知识等知识相结合而构成的一门应用科学,其任务是在了解、熟悉、掌握生产工艺流程与生产过程的静态和动态特性的基础上,根据工艺要求,应用控制理论、现代控制技术,分析、设计、整定过程控制系统。通过本书的学习,使读者能够掌握过程控制系统的基本概念、基本组成环节和基本控制规律,了解过
本书在全面梳理和分析国内外在大数据安全保护技术、标准规范及法律政策等资料的基础上,对大数据安全和隐私保护的相关技术、基础理论等进行了全面介绍。本书共12章,内容包括大数据安全相关技术、密码技术及网络安全协议、大数据平台Hadoop的安全机制、身份认证技术、访问控制技术、数据加密技术,并对大数据采集、存储、处理、交换、销
本书基于Spark3.2.x版本,从Spark核心编程语言Scala讲起,涵盖了当前整个Spark生态系统主流的大数据开发技术。全书共9章,第1章讲解了Scala语言的基础知识,包括IDEA工具的使用等;第2章讲解了Spark的主要组件、集群架构原理、集群环境搭建以及Spark应用程序的提交和运行;第3~9章讲解了离线
本书以大数据分析技术及其应用为核心,系统地介绍了信息技术与大数据分析基础、大数据分析工具、信息网络技术与数据获取、文本和表格数据处理、数据分析、大数据分析实战等内容。本书通过一系列实例分析,深入浅出地向读者具体介绍了AIStudio云计算平台、Python程序设计语言、Word2016、Excel2016和PowerP
本书主要介绍大数据关键技术中的大数据采集和数据预处理技术,是大数据专业的入门级的专业基础课教程(含教学课件、源代码与视频教程),旨在为学生搭建起大数据的知识架构,讲述大数据采集和数据预处理的基本原理,开展相关的实验,为学生在大数据以及相关领域的学习奠定坚实的基础。全书共分四部分:第一部分是理论基础(第1~2章和第6章)
近年来,基础软件的发展越来越受到重视,越来越多的计算机从业者对数据管理系统和大数据的知识产生了强烈的需求。 本书既介绍了数据管理系统的技术发展史,又介绍了数据管理系统的关键技术内涵,同时还介绍了一系列主流的商业化产品及其架构,并对前沿技术进行了讨论分析,给出作者自己的见解和洞察。本书内容主要包括数据库与大数据的诞生、