全书共20章,第1-9章分别介绍大数据与人工智能的发展历史、数据工程、机器学习算法、深度学习与神经网络、大数据存储技术、HadoopMapReduce解析、Spark解析、分布式数据挖掘算法和PyTorch解析等知识,第10-20章为大数据技术和机器学习技术相结合的一些案例。
本书是给儿童普及大数据概念的图文书。以棉棉和爸爸用手机点外卖,棉棉好奇点餐软件为什么推送了好多自己爱吃的食物为起点,逐步引入数据、数据库、数据库管理系统、大数据、大数据的特点、云计算、大数据的应用与未来等概念,为孩子打开大数据之门,让孩子大开眼界,感受数据力量,建立数据意识。本书知识丰富却不失童趣,深入浅出地将深奥难懂
大数据这个原本陌生的专业词汇迅速进入大众视野,掀起了一场新的数据技术革命。大数据正在改变我们的生产、生活、教育、思维等诸多领域以及认识、理解世界的方式,作为时代精神精华的哲学,应该及时对这场数据革命做出全面的回应和批判,深入分析大数据对我们的世界观、认识论、方法论、价值观和伦理观将带来的深刻变革。本书全面建构了以大数据
"本书聚焦于Hadoop、Spark、Flink等面向数据密集型应用的分布式计算系统,将原理、架构、编程的知识进行有机结合,统一从设计思想、体系架构、工作原理、容错机制和编程示例5个维度进行剖析。本书注重通过横向比较阐释该类系统设计的共性原理,帮助读者形成完整、统一的知识体系。本书概述了分布式计算系统(第1章),根据应
本书主要介绍了大数据的基本概念、原理、方法和技术。全书共分11章,第1章介绍大数据的基本概念;第2章介绍大数据系统生态;第3、4章分别论述大数据存储与管理技术、大数据计算与处理技术;第5、6、7、8章介绍大数据获取技术、大数据预处理技术、大数据分析技术、可视化展现技术;第9、10、11章介绍了3个典型案例。全书坚持系统
本书聚焦综合信息系统智能化的关键和难点,摒弃传统的处理模式,充分利用数据的不确定性信息,就区间、序列、直觉模糊、犹豫模糊、语义等不同类型数据的相似度量、粒层转化、识别决策等开展了较为系统、深入的研究,构建异类数据间统一的粒层转换框架,解决不同类型数据间的相似度量、跨层关联与融合问题。全书共分15章,第1章介绍问题的来源
过程控制是由控制理论、计算机技术和仪器仪表、工艺知识等知识相结合而构成的一门应用科学,其任务是在了解、熟悉、掌握生产工艺流程与生产过程的静态和动态特性的基础上,根据工艺要求,应用控制理论、现代控制技术,分析、设计、整定过程控制系统。通过本书的学习,使读者能够掌握过程控制系统的基本概念、基本组成环节和基本控制规律,了解过
本书在全面梳理和分析国内外在大数据安全保护技术、标准规范及法律政策等资料的基础上,对大数据安全和隐私保护的相关技术、基础理论等进行了全面介绍。本书共12章,内容包括大数据安全相关技术、密码技术及网络安全协议、大数据平台Hadoop的安全机制、身份认证技术、访问控制技术、数据加密技术,并对大数据采集、存储、处理、交换、销
本书基于Spark3.2.x版本,从Spark核心编程语言Scala讲起,涵盖了当前整个Spark生态系统主流的大数据开发技术。全书共9章,第1章讲解了Scala语言的基础知识,包括IDEA工具的使用等;第2章讲解了Spark的主要组件、集群架构原理、集群环境搭建以及Spark应用程序的提交和运行;第3~9章讲解了离线
本书以大数据分析技术及其应用为核心,系统地介绍了信息技术与大数据分析基础、大数据分析工具、信息网络技术与数据获取、文本和表格数据处理、数据分析、大数据分析实战等内容。本书通过一系列实例分析,深入浅出地向读者具体介绍了AIStudio云计算平台、Python程序设计语言、Word2016、Excel2016和PowerP