随着计算机和互联网技术的飞速发展和广泛普及,互联网已经成为人类获取知识的最大平台。在爬取了Web网页语料后,需要通过数据预处理和数据分析来获取数据的价值,从而造福人类,推动社会发展。本书主要是Web大数据预处理和数据分析的实战指南,内容包括三部分:基础知识、基于Python的数据预处理、基于Python的数据分析
决策问题中存在大量的冗余信息,而且很多信息都具有不确定性,面对这些杂乱无章的海量数据,决策者需花费大量时间分析,以至于可能错失决策良机,因此研究具有不确定性的决策问题中冗余信息约简是决策者亟待解决的关键问题。目前软集合方法能够较好地处理不确定决策问题,但软集合约简方法目前还不完善,致使对海量数据很难做出决策。本书主要以
天津滨海迅腾科技集团有限公司编著的《大数据高可用环境搭建与运维(企业级人才培养解决方案十三五规划教材)》主要涉及11个项目,即大数据分布式集群、分布式集群基础配置、ZooKeeper分布式协调系统、Hadoop高可用、Hive分布式数据仓库工具、HBase分布式数据库、大数据协作框架、Linux自动化部署、Ambari
本书将大数据技术生态圈主流技术框架的应用与发展、搭建Hadoop大数据分布式系统集群平台、大数据分布式文件系统HDFS(HadoopDistributedFileSystem)、大数据分布式并行计算框架MapReduce、大数据汽车销售数据统计分析项目5大模块分为11章内容进行阐述。具体分布情况如下:第1章是大数据概论
本书采用理论与实践相结合的方式,全面介绍了Hadoop大数据技术。主要内容包括初识Hadoop大数据技术、Hadoop环境配置,分布式文件系统HDFS、资源调度框架YARN、分布式计算框架MapReduce、大数据数据仓库Hive、分布式数据库HBase、查询大型半结构化数据集的语言Pig、分布式日志采集工具Flume
“第1章认识商务智能”,解释了BI的相关概念及理论基础;“第2章实施商务智能”,讲述了BI项目的实施过程;“第3章分析商务智能案例”,展示了企业真实BI案例的实施细节、成果及价值所在;第4章至第6章为商务智能开发工具;“第7章商务智能的应用与发展趋势”,介绍了BI的应用及未来发展趋势。
本书从系统的角度出发,按照大数据处理流程的顺序,全面介绍了大数据技术的基础知识,提升读者对大数据的认知。全书分3个逻辑层次,共9章。 本书作为大数据技术的基础教材,目的不在于让读者对具体的某个技术平台细节有很深的理解,而是尽量让读者体会整个大数据处理的技术流程,使读者能够掌握大数据技术的整体框架,能够在未来的学习和工作
本书的主要内容是非线性自抗扰控制的设计与理论分析.自抗扰控制是一项在线估计并补偿不确定性因素的控制技术,由三个主要部分构成,分别是跟踪微分器、扩张状态观测器以及基于前两者的反馈控制器.本书较为详细地论述了非线性跟踪微分器、非线性扩张状态观测器的设计与收敛性,以及基于跟踪微分器与扩张状态观测器的不确定性因素补偿控制器——
本书共8章,全面和详尽地介绍了数据产品经理的日常工作、需要的基础知识和常用的分析方法,也介绍了数据仓库的理论与应用,以及大数据分析平台、用户行为分析平台、AB实验平台等数据产品的建设,最后介绍了数据产品在各个业务领域中的应用。从基础知识到项目进阶,本书内容充分结合业务实践,剥开数据产品经理的神秘面纱。本书讲解了数据产品
本书详细介绍了大数据挖掘技术,全书分为3篇,共12章。第1篇为大数据分析基础,包括第1~4章,分别为大数据概述、大数据相关技术、数据预处理、R语言工具的使用。第2篇为大数据挖掘技术,包括第5~11章,分别为线性分类方法、分类方法、聚类分析、关联规则、预测方法与离群点诊断、时间序列分析、大数据挖掘可视化。第3篇为大数据挖