作者针对大数据问题,分析如何进行大数据的导入,如何使用大数据工具进行快速的数据预处理,以及如何构建数据仓库。详细讲解了Kettle工具的使用、数据集成、Kettle作业项设计等。
本书是一本系统介绍大数据可视化技术的图书。书中首先阐述了大数据的可视化技术的基本概念以及相关的基础理论知识,然后采用理论与实践相结合的方式,针对实际应用中的各种不同类型的数据,包括时间数据,比例数据,关系数据,文本数据,复杂数据,介绍相应的可视化理论和操作方法,最后,介绍了数据可视化在各个领域中的应用。 本书实例丰富,
本书详细讨论大数据管理技术的各个分支及其实现技术,包括大数据建模技术、大数据存储和索引技术、大数据查询处理技术、大数据事务处理技术和大数据总线技术,并在此基础上,对大数据应用系统进行了全面分析。本书面向大数据应用的开发人员、大数据管理系统的开发人员以及大数据管理技术的研究人员,也适用于高等院校相关专业师生学习。
全书共分为五大部分,*部分介绍了实时数据流和聚类方法的背景,包括实时数据流的特点、进行数据分析的技术以及研究现状。第二部分详细讲解了聚类方法中的简单聚类,包括基于衰减窗口与剪枝维度树的数据流聚类和实时数据流动态模式发现与跟踪方法,以及相关实验证明等内容。第三部分详细阐述了增量聚类技术,包括什么是增量聚类、网格划分策略,
《大数据技术及其背景下的数据挖掘研究》围绕大数据背景下的数据挖掘及应用问题,从大数据挖掘的基本概念入手,系统地阐述了大数据的基础理论、大数据处理架构Hadoop以及大数据存储与管理研究;由浅入深地论述了数据挖掘的基础理论、大数据挖掘技术研究、数据挖掘的艺术,并结合实践,阐述了数据挖掘的应用。《大数据技术及其背景下的数据
决策问题中存在大量的冗余信息,而且很多信息都具有不确定性,面对这些杂乱无章的海量数据,决策者需花费大量时间分析,以至于可能错失决策良机,因此研究具有不确定性的决策问题中冗余信息约简是决策者亟待解决的关键问题。目前软集合方法能够较好地处理不确定决策问题,但软集合约简方法目前还不完善,致使对海量数据很难做出决策。本书主要以
随着计算机和互联网技术的飞速发展和广泛普及,互联网已经成为人类获取知识的最大平台。在爬取了Web网页语料后,需要通过数据预处理和数据分析来获取数据的价值,从而造福人类,推动社会发展。本书主要是Web大数据预处理和数据分析的实战指南,内容包括三部分:基础知识、基于Python的数据预处理、基于Python的数据分析
本书从多个数据项目实例出发,介绍爬虫、反爬虫的各种案例,使读者了解到数据抓取和分析的完整过程。书中案例的难度由浅入深,以作者原创的代码为主,不借助现成的框架,强调在数据采集过程中的发散思维,总结攻克反爬虫的思维模式,实现以低成本的方式得到想要的数据的愿望。最后,用一个“爱飞狗”的例子,为读者展示如何从0到1地开发一个大
本书的主要内容是非线性自抗扰控制的设计与理论分析.自抗扰控制是一项在线估计并补偿不确定性因素的控制技术,由三个主要部分构成,分别是跟踪微分器、扩张状态观测器以及基于前两者的反馈控制器.本书较为详细地论述了非线性跟踪微分器、非线性扩张状态观测器的设计与收敛性,以及基于跟踪微分器与扩张状态观测器的不确定性因素补偿控制器——
《数控技术》坚持“理论先进,注重实践,操作性强,学以致用”的原则精选内容,较全面、深入浅出地介绍了数控技术的相关知识。全书共分8章,前言、数控技术概述、数控加工的工艺分析与程序编制、自动编程基础、数控系统的插补原理、计算机数控装置、数控机床的伺服系统、数控机床的位置检测装置、数控机床的PLC控制。教材内容面向工程实际,