本书内容涵盖了目前使用最为广泛的大数据处理系统Hadoop生态圈中的几大核心软件系统:分布式大数据处理系统Hadoop、数据库HBase、数据仓库工具Hive、内存大数据计算框架Spark和SparkSQL,详细介绍了它们的架构、工作原理、部署方法、常用配置、常用操作命令、SQL引擎等内容。本书对上述几大系统的各种安装
本书介绍了数据挖掘的基本概念,包括数据挖掘的常用算法、常用工具、用途和应用场景及应用状况,讲述了常用数据挖掘方法,如分类、聚类、关联规则的概念、思想、典型算法、应用场景等。此外,本书还从实际应用出发,讲解了基于日志的大数据挖掘技术的原理、工具、应用场景和成功案例。日志挖掘技术现在已得到了广泛的运用。通过以上内容的学习,
数据清洗是大数据领域不可缺少的环节,用来发现并纠正数据中可能存在的错误,针对数据审查过程中发现的错误值、缺失值、异常值、可疑数据,选用适当方法进行“清理”,使“脏”数据变为“干净”数据。本书共分为8章:第1章主要介绍数据清洗的概念、任务和流程,数据标准化概念及数据仓库技术等;第2章主要介绍Windows和类UNIX操作
本书针对应用型本科教育和新工科的特点,以信息的传感、转换、处理为核心,按检测技术基础(第1~2章)、传感器原理及应用(第3~8章)、自动检测系统(第9~11章)三大模块组织内容。传感器原理及应用模块以被测量为主线,分别介绍温度、力、声、磁、光、气体和湿度等各类传感器的原理、结构、性能及其应用电路,并针对不同类型的传感器
本书根据过程工业所用原料和生产产品的特性,提出了对输送设备的要求,对流体流动从理论上进行了介绍;并介绍了液体输送设备——泵、高压气体输送设备——往复式压缩机和离心式压缩机、低压气体输送设备——风机、粉体的机械式输送设备、粉体的流态化输送设备——气力输送与水力输送、粉体的生产加工设备——粉碎设备的工作原理、特性、分类、选
《十三五行政机关公务员培训纲要》提出加强大数据思维方面的培训。本书首先论述了大数据的兴起背景、重要意义、主要特点和相关技术,以及领导干部的大数据思维和政府大数据,介绍了美国、英国、德国、法国、澳大利亚、日本、韩国、中国的大数据发展情况以及中国贵州、京津冀、珠江三角洲、上海、河南、重庆、沈阳和内蒙古八个国家大数据综合试
本书主要介绍在生产、科研、生活等领域常用传感器及检测技术的工作原理、特性参数、选型、安装使用及调试等方面的知识。对测量技术的基本概念、误差理论、抗干扰技术、电磁兼容及计算机在检测系统中的应用也作了介绍。
为贯彻国家大数据战略,落实《国务院关于印发存进大数据发展行动纲要的通知》和《大数据产业发展规划(2016-2020年)》,全面掌握我国大数据产业发展和应用情况,工业和信息化部办公厅于2017年10月向地方工业和信息化主管部门及央企集团下发了《工业和信息化部办公厅关于组织开展2017大数据优秀产品和应用解决方案征集
《控制手册:控制系统的行业应用(第2版下册)》出版后立刻成为研究现代控制系统的工程师们所需的必备资源。在《控制手册:控制系统的行业应用(第2版下册)》所获得的众多荣誉中,值一提的便是其第1版作为工程手册在1996年被AAP所引用。如今,威廉·S·莱文再次编著了这本全面、控制工程资料。他已经完全重编了已有文本以反映自上个
Python文本分析