Spark是业界主流的大数据计算框架。本书通过一系列大数据应用案例和实践项目贯穿始终,使用Python详细阐述了Spark大数据环境的搭建、SparkRDD离线数据计算、SparkSQL离线数据处理、SparkStreaming实时数据计算等一系列常见的大数据处理问题,并在此基础上对Spark的核心概念及技术原理进行了
本书第4版根据计算机控制与网络技术的发展,基于工业界、科技界和教育界的成果进行了全面修订。本书面向新工科建设、工程教育专业认证和卓越工程人才培养计划,以立德树人为根本任务,以科学家精神、企业家精神、工匠精神等中国精神为动力,以培养学生解决复杂工程和实际问题的综合能力为出发点,以主流机型PC/ISA/PCI/PCIE总
本书是备受广大读者推崇的数据结构与算法入门教程,已在GitHub获得超60k的Star,并多次登顶GitHubTrending。书中系统介绍了数据结构与算法基础、复杂度分析、数组与链表、栈与队列、哈希表、树、堆、图、搜索、排序、分治、回溯、动态规划和贪心算法等核心知识,通过清晰易懂的解释和丰富的代码示例,以及生动形象的
本书结合作者多年的研究成果和实践经验,深入讲解了PID控制器参数整定方法和复杂控制方案设计策略。书中首先介绍了PID控制器的基础知识,包括过程控制基本原理、PID控制器发展简史、PID参数影响分析、PID算法改进等,之后结合实操案例重点讲述了PID参数的Lambda整定方法,最后给出了串级控制、前馈控制、比值控制、超驰
主要内容包括,大数据技术概述(或背景知识),Scala基础知识,Spark基础,RDD编程,SparkSQL开发,SparkStreaming/StructuredStreaming编程,MLLib机器学习编程等基础内容。 主要作为本科生数据科学与大数据技术、计算机科学与技术等相关专业必修或选修课程教科书,或作为相关工
控制理论方面的著述和教科书汗牛充栋,具体控制系统或者控制软件的使用攻略也琳琅满目。但在两者之间缺乏桥梁。“书上讲的用不上,需要用的书上不讲”,这是常听到的抱怨。本书试图搭接,从实用角度出发,为大量控制实践提供一点理论依据,也为控制理论研究提示一点工程实践中需要解决的问题。本书分六部分。第一部分简述基本的反馈,动态系统和
本书注重全面而系统的介绍,从工业生产线的基础知识到先进的智联生产线,本书都所有阐述,主要围绕数据/模型混合驱动的智联生产线,介绍相应的基本原理、使用方法、评估技术和主要应用。全书共6章,第1章智联生产线发展概述(传统生产线-智联生产线);第2章数据/模型混合驱动的智联生产线协同方法,包括智联生产线人机物协同认知方法和智
随着物联网、云计算、大数据与人工智能等技术的蓬勃发展,计算服务逐渐从计算密集型向数据密集型(DataIntensive)转变。高性能、高通量的数据服务关键技术成为智慧城市、智能制造、智慧农业等国家重大需求解决方案的核心基础。并行与分布式数据处理的概念启发于上世纪80年代,源自讨论在内存及二级存储极为有限的条件下如何跨越
“文明”是人类经过教化后达到的一种状态,代表着社会的进步。自人类社会发端以来,人类文明就进入了一个漫长的演进过程。从原始文明、农业文明、工业文明到数字文明,每一次新文明的诞生都代表着文明形态的重塑和社会的变更。数字文明是一种基于大数据、云计算、物联网、区块链等新一代技术,以高科技为主要特征的文明,其核心是网络化、信息化
理解数据最有力的工具是良好的对话。现实中,如果数据分析师和管理者使用不同语言,拥有完全不同的观点,或者对彼此的方法和约束条件缺乏了解,那么双方将难以就数据达成共识。 本书旨在帮助读者建立一种称为数据流利度的技能,掌握一系列有效的数据分析交流技巧,使其能够清晰、准确地表达数据的含义并挖掘数据潜在的价值。 本书通过理解