本书以当前流行的大数据存储技术为主线,从大数据存储技术特性和实现入手,对大数据存储的基本架构、实现原理、应用部署等进行了全面翔实的介绍。同时,以德拓大数据处理平台为依托,对HBase、Hive、Stork、Teryx、Eagles、Cayman等技术进行实战演练。此外,还通过真实案例分析了大数据处理过程中数据存储技术的
◎内容简介 所谓另类数据,就其本意,就是非传统数据。目前业内对于另类数据并没有统一的定义,大体上可以理解为有别于传统数据同时有价值的数据和信息。当下越来越多的数据渗入我们的生活中,但是数据本身具有洞见的时候才会有用。随着人工智能和机器学习的发展,我们可以从看似杂乱无章的海量数据中提取特征,云计算的发展也可以有效管理此类
本书作为Hadoop大数据技术的项目化实战教材,以任务驱动为导向,深入浅出地介绍了Hadoop及其周边框架的应用,涵盖了当前Hadoop生态系统中的主流大数据技术。全书共12个项目,包括云计算和大数据基础概论、CentOS的安装与网络配置、MPI集群部署及应用、Hadoop集群部署及应用、MapReduce基本原理及应
随着数字新时代的崛起,每个企业都走到了数字化转型的十字路口,企业该如何选择?该如何迈出数字化转型的第一步?面对多变、不确定、复杂且模糊的市场环境,企业该如何抓住数字时代的创新机会,走上坚定的转型之路? 本书在上一版的基础上,借由笔者亲历的企业数字化转型项目,分析了企业数字化转型失败的原因,并首次提出企业数字化转型的成功
本书内容包括:数据科学及工作流程、统计模型与机器学习算法、信息提取与统计变量创建、数据可视化与社交网络、预测模型与因果分析、数据预处理与工程方法。
本书系统地介绍了有关过程参数检测和自动控制装置的基础理论和应用技术。全书分为4篇,共10章。第1篇基础知识,含第1、2章,介绍本课程的意义及内容,检测仪表的基本概念及性能指标;第2篇过程参数检测,含第3~7章,介绍生产过程中常用的温度、压力、流量、物位和成分等参数的测量方法及常用检测仪表;第3篇过程控制仪表,含第8、9
本书较全面地叙述了智能控制的基本理论、方法和应用。全书共分18章,主要内容为模糊控制的基本原理和应用、神经网络控制的基本原理和应用、智能优化算法及其应用和智能协调控制基本原理及应用。本书系统性强,理论联系实际,叙述深入浅出,适合初学者学习。书中给出了一些智能控制算法的仿真实例和MATLAB仿真程序(见配书资源),并配有
《数据标注工程(第2版)》由数据标注行业的专家团队编写,采用通俗易懂的方式,系统地介绍了数据标注的基本概念、分类、流程、质量管理、安全、项目管理、平台和应用等内容。本书通过理论与实战相结合的方式,帮助读者由浅入深进行学习,让读者真正掌握数据标注的核心技术、数据标注工程实施和管理方法。
集散控制系统是利用计算机技术对生产过程进行集中监控、操作、管理和分散控制的一种新型的控制技术。它是由计算机技术、信号处理技术、测量控制技术、网络通信技术和人机接口技术等发展而产生的。以现场总线为代表的工业控制网络已成为新一代工业控制系统中的重要技术,它使得集散控制系统组成更灵活、控制更方便、应用更广泛。现代工业生产离不
本书描述了数据的混杂特性,当前关于首席数据官报告体系的分歧,自适应规划的需求,平衡的实现,以及特定的新执行模型;介绍了首席数据官过程改进框架,通过数据管理知识体系和数据管理成熟度模型描述了数据领导者使用的核心概念、技术和策略以及集成;描述了在当前领导者之外维持数据和实践改进所需的关键角色以及首席数据官在其组织中实施解决