本书围绕数据分析的基本概念与常用方法,提供一套适用于初学者快速入门的实践教材。本书中以医学数据为例,围绕实际应用场景中最常见的五种数据形式:统计数据、文本数据、时序数据、图像数据以及健康数据,从基本概念、初步探索到综合应用的全流程系统示范教学。本书共计五个章节,分别为:统计数据分析、文本数据分析、时序数据分析、图像数据
本书系统介绍了大数据的相关知识,全书共13章,内容包括Hadoop大数据处理架构、HDFS分布式文件系统、YARN资源管理、MapReduce分布式计算框架、HBase分布式数据库、流数据采集、典型非关系数据库的安装与使用、分布式数据分析工具Pig、Spark大数据处理框架、基于Python的SparkRDD编程、基于
本书对第1版做了修订,紧跟传统分布式计算、云计算与大数据相关领域的新技术,以应用需求为背景讲解相关技术原理和应用方法,主要内容包括:传统分布式计算的基本原理和编程开发技术,云计算的原理和关键技术、主流云计算平台和编程开发方法,云原生技术、云计算安全技术与标准及云存储技术,大数据的分析处理关键技术、计算模式和编程技术、平
本书讲述:大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换而言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。首先,本书在总结大数据的概念、特征的基础上,给出大数据的本质是客观存在的论断。其次,探讨大数据价
这是一本学术著作,本书全面探讨了大数据技术的发展趋势与应用实践,旨在深入研究大数据对各行业的影响,并探索其在实际应用中的优势与挑战。本书首先系统介绍了大数据的概念、特点和基本技术,包括数据采集、存储、处理和分析等方面的核心内容。其次,通过对各个行业的案例分析和实践经验总结,详细阐述了大数据在金融、医疗、教育、交通等领域
本书以提高实际工程设计能力为目的,深入浅出地对EDA技术、VHDL硬件描述语言、FPGA开发应用及相关知识做了系统介绍,读者通过本书的学习能初步了解和掌握FPGA开发的基本内容及实用技术。本书各章都安排了习题或针对性较强的实验与设计内容,书中列举的大部分VHDL设计实例和实验示例都可以在EDA开发工具QuartusⅡ1
本书为想要设计、构建和维护实时分析应用程序的人员(包括数据工程师、架构师和技术领导者)提供了结构合理的基础知识。第1章和第2章简要介绍实时分析,并概述可以构建的实时分析应用程序的类型。第3章介绍一家虚构的比萨公司,该公司已经建立了流处理基础设施,但尚未实现任何实时分析功能。第4-10章展示如何为这家比萨公司实现不同类型
教材首先介绍Z变换以及如何采用Z变换建立广义对象的Z传递函数,然后建立计算机控制系统的开环及闭环传递函数并分析系统的控制性能指标。在分析的基础上,讲述两种控制算法的设计方法:(1)间接设计法(PID控制、史密斯预估法);(2)直接设计法(最小拍无纹波设计、大林算法)。简要介绍离散系统状态空间分析与设计方法。以工程实践的
本书介绍了大数据挖掘与统计机器学习领域最常用的模型和算法,包括最基础的线性回归和线性分类方法,以及模型选择和模型评价的概念和方法,进而介绍非线性的回归和分类方法(包括决策树与组合方法、支持向量机、神经网络以及在此基础上发展的深度学习方法)。最后介绍无监督的学习中的聚类方法和业界广泛使用的推荐系统方法。除了方法的理论讲解
本书以“数据流”为主线,从信号处理角度出发,围绕问题描述和解决方案设计与实现两个角度组织材料,介绍计算机控制系统的分析、设计理论和工程实现技术。同时,本书提供了多种学习支持材料,如电子课件、教学指导手册、部分习题解答和线上虚拟仿真实验,能更好地帮助学生认识计算机控制的并发实时任务管理本质,树立正确的国家观、民族观、历史