作者针对大数据问题,分析如何进行大数据的导入,如何使用大数据工具进行快速的数据预处理,以及如何构建数据仓库。详细讲解了Kettle工具的使用、数据集成、Kettle作业项设计等。
本书是关于大数据和Spark的实用手册。它将助你学习如何用Spark来完成很多大数据分析任务,其中覆盖了高效利用Spark所需要知道的重要主题:如何使用SparkShell进行交互式数据分析、如何编写Spark应用、如何在Spark中对大规模数据进行交互分析、如何使用SparkStreaming处理高速数据流、如何使用
本书由全球知名的通信专家万蕾博士领衔撰写,对5G-NR上下行解耦技术进行了系统的介绍。全书共10章:第1章首先介绍了5G-NR的研究背景和上下行解耦的标准化过程;第2章主要回顾了5G-NR上下行解耦技术的驱动力;第3章介绍了世界范围内的5G频谱状况和双工制式;第4章对5G网络部署的挑战以及上下行解耦技术的优势进行了系统
《数控技术》坚持“理论先进,注重实践,操作性强,学以致用”的原则精选内容,较全面、深入浅出地介绍了数控技术的相关知识。全书共分8章,前言、数控技术概述、数控加工的工艺分析与程序编制、自动编程基础、数控系统的插补原理、计算机数控装置、数控机床的伺服系统、数控机床的位置检测装置、数控机床的PLC控制。教材内容面向工程实际,
本书从多个数据项目实例出发,介绍爬虫、反爬虫的各种案例,使读者了解到数据抓取和分析的完整过程。书中案例的难度由浅入深,以作者原创的代码为主,不借助现成的框架,强调在数据采集过程中的发散思维,总结攻克反爬虫的思维模式,实现以低成本的方式得到想要的数据的愿望。最后,用一个“爱飞狗”的例子,为读者展示如何从0到1地开发一个大
线性延迟反馈控制使非线性系统产生了非常复杂的行为,包括混沌和分岔,延迟产生的混沌具有理论上的无穷维,可能通过简单的方法获得超混沌吸引子。针对线性延迟反馈的混沌产生机理,包括局部分岔,全局分岔,拓扑马蹄等一系列问题进行了较为深入的分析,同时对混沌的应用,如通信应用,加密应用和压实机械中的应用都进行了深入的研究,这些研究成
随着计算机和互联网技术的飞速发展和广泛普及,互联网已经成为人类获取知识的最大平台。在爬取了Web网页语料后,需要通过数据预处理和数据分析来获取数据的价值,从而造福人类,推动社会发展。本书主要是Web大数据预处理和数据分析的实战指南,内容包括三部分:基础知识、基于Python的数据预处理、基于Python的数据分析
决策问题中存在大量的冗余信息,而且很多信息都具有不确定性,面对这些杂乱无章的海量数据,决策者需花费大量时间分析,以至于可能错失决策良机,因此研究具有不确定性的决策问题中冗余信息约简是决策者亟待解决的关键问题。目前软集合方法能够较好地处理不确定决策问题,但软集合约简方法目前还不完善,致使对海量数据很难做出决策。本书主要以
本书围绕工业过程运行状态智能监控的若干核心问题展开论述。第1章介绍了工业过程运行状态监控的重要性与前人工作。第2章综述了工业过程运行状态监控的理论基础,重点阐述以主元分析、偏最小二乘、费舍尔判别分析等为核心的多元统计分析方法。第3~5章主要介绍了针对工业过程正常运行状态优劣的区分与分析,具体包括基于综合经济指标的运行状
现在越来越多的企业开始利用数据科学来驱动业务,本书将依托TalkingData在大数据领域的多年实践经验,从数据、人才、工具三个维度帮助企业数据团队完成端到端的数据科学项目部署。本书的内容包括数据科学项目的基础概念、准备工作、团队人才及端到端的实战案例等,适合正面临数字化转型的企业决策者、数据团队负责人,以及从事数据科
本书共有12章,分为3篇。大数据基本定义篇阐述了大数据可视分析的背景、分析框架及前景,并结合实例多角度描述可视化分析在不同应用场景下的设计及实现过程。大数据基本方法篇针对实际应用中遇到的不同类型的数据,包括多媒体数据、网络数据、多层面数据和不确定性数据介绍相应的可视化方法,并结合研究成果,展示从探索层面到解释层面的数据
本书的主要内容是非线性自抗扰控制的设计与理论分析.自抗扰控制是一项在线估计并补偿不确定性因素的控制技术,由三个主要部分构成,分别是跟踪微分器、扩张状态观测器以及基于前两者的反馈控制器.本书较为详细地论述了非线性跟踪微分器、非线性扩张状态观测器的设计与收敛性,以及基于跟踪微分器与扩张状态观测器的不确定性因素补偿控制器——
本书共8章,全面和详尽地介绍了数据产品经理的日常工作、需要的基础知识和常用的分析方法,也介绍了数据仓库的理论与应用,以及大数据分析平台、用户行为分析平台、AB实验平台等数据产品的建设,最后介绍了数据产品在各个业务领域中的应用。从基础知识到项目进阶,本书内容充分结合业务实践,剥开数据产品经理的神秘面纱。本书讲解了数据产品
本书主要针对网络化分布式系统中,如何设计预测控制的估计器、控制器、协调策略等方面问题进行讲解。内容包括网络化滚动时域状态估计,网络化预测控制的设计与分析以及以保证状态估计性能的滚动时域调度策略;典型的基于Nash优化、局部性能指标、全局性能指标、作用域优化的分布式预测控制设计方法和系统综合;最后介绍了网络化分布式系统预
本书分为数据思维和案例解析两个部分,对“怎么想”和“怎么做”两大分析痛点问题进行剖析和解答。基于知先行后的考虑,前3章首先对“怎么想”的问题进行解答,通过明确分析问题、开启分析思路、打开分析视角,依次回答数据思维3个核心问题:解决什么问题?分析哪些内容?分析到何种程度?结合11个思维练习的案例,引导读者对业务需求进行思
大数据的巨大作用不仅表现在经济的转型升级上,更重要的是表现在国家的治理创新上。本书对数据治理、政府治理和社会治理这三个方面的相关问题进行了初步探讨,包括数据治理与数据价值实现、数据开放共享的精细化治理与隐私保护、数字政府与数字公民建设、数据思维与领导干部的数据决策、慈善资源和志愿服务的精准供给与衔接、老龄化社会中的智慧
本书理论联系实际,系统地介绍了典型自动控制系统的构建原理、分析方法和设计方法。内容包括直流电机控制系统、交流异步电机控制系统和交流同步电机控制系统。 直流电机控制以调压调速为主线,侧重介绍闭环自动控制系统的构建思想、分析和设计方法。内容包括电气自动控制系统基础、直流开环控制调速系统、直流闭环控制调速系统、闭环调速系统
本书阐述词法分析、文本分类、文本聚类、文本检索、垃圾邮件过滤、情感分析、个性化推荐等文本分析与文本挖掘方面的理论方法。人工智能技术与互联网的发展更是为该领域研究提出新的需求,书中相关理论和技术可以直接用于解决具体文本分析与文本挖掘的问题,也可以为进一步研究提供理论方法基础。本书包括理论、技术,既适合理论方法的学习,又适
因果关系严格区分了“因”变量和“果”变量,在揭示事物发生机制、指导干预行为等方面具有相关关系不可替代的重要作用。在大数据时代,如何探索海量、高维、观察性的数据背后的因果机制具有重要的商业价值和科学意义。观察数据的因果关系方向判断困难、高维数据的因果结构发现能力不足、现有算法适用场景有限等仍然严重阻碍着因果推断领域的发展
大数据管理与应用主要以信息科学、计算机科学和管理科学等学科为理论基础,其研究内容包括大数据科学基础理论、大数据预处理、大数据计算、大数据管理和分析等。本书力图通过对大数据科学相关数据管理方面内容的综合介绍,面向大数据时代的电子商务智能数据计算领域,从大数据采集、大数据预处理、大数据存储与计算、多源异构大数据分析、大数据