本书通过应用案例并借助R软件介绍统计方法在数据分析中的应用。主要内容:数据的表示及可视化,线性回归分析,逐步回归与回归诊断,广义线性模型与非线性模型,方差分析,聚类分析,判别分析,主成分分析,因子分析,对应分析,典型相关分析,高维数据分析简介。本书的最大特点是:用R软件学习数据分析的统计方法,容易入门。对于常用统计方法
利用这本书,你将学习以下内容:了解如何选择Spark转换实现优化的解决方案。探索强大的转换和归约,包括reduceByKey()、combineByKey()和mapPartitions()。理解数据分区以实现优化查询。使用PySpark设计模式构建和应用模型。对图数据应用motif查找算法。使用GraphFrames
本书是写给技术管理者、程序员的技术管理书籍。以技术团队的工作数据为基础,以技术团队为核心,用严谨的思维逻辑总结了研发容量、研发能力、研发投入率、研发人效等数据指标,以及个人胜任力、团队胜任力和技术价值等管理模型;用幽默的文字阐述了技术团队的选、用、育、留的标准,以及技术工作的衡量、评价的标准;讲述数字化技术管理的理论如
本书围绕数据中心业务如何经营这一主题展开论述,以数据中心产业演变为切入点,围绕“布局-建设-服务”三大核心环节,针对数据中心产业面临的集群化布局、低碳化建设、智能化服务的机遇与挑战,通过变革中的数据中心产业、数据中心产业面临的挑战、数据中心布局之道、数据中心低碳建设之道、数据中心智能服务之道、数据中心产业政策实施之道、
本书先带领读者了解工业网络技术的发展脉络,再以三菱iQ-FX、iQ-R、MELSEC-Q系列PLC为主控CPU,通过项目形式全面学习以太网通信、简单CPU通信、串行通信、CC-Link通信、CC-LinkIEField通信、CC-LinkIEControl通信、CC-LinkIETSN通信、Modbus通信和综合网络通
本书是中国特色高水平高职学校电气自动化技术专业的CDIO系列教材之一,是应CDIO课程改革的需要,校企合作编写的新形态教材。本书重视学生职业能力和工匠精神的培养,知识点和技能点紧密结合过程控制工程项目的实际应用,配有大量立体化教学资源,学生通过扫描二维码即可获得在线资源进行学习。本书共3个项目,项目设置结合工程实际,内
Hive是大数据领域的一个重要开发工具。本书基于Hive3.1.3版本进行编写,首先,简单介绍了Hive的起源和发展,以及Hive的安装和部署;其次,分别介绍了Hive的数据定义语言、数据操作语言、查询语言,以及各种函数,其中穿插安排了大量的综合案例练习;再次,讲解了分区表和分桶表,以及文件的压缩;最后,重点讲解了Hi
本书共分8章,主要内容如下: 第1章介绍数据的认知与研究任务,大数据概念特征及技术挑战等。 第2章介绍大数据内容、知识和结果表达概念,以及元数据和知识图谱技术。 第3章介绍数据存储基础、大数据存储要求以及应对技术和典型系统。 第4章介绍数据管理基础,新型数据管理模型及其相应大数据管理系统。 第5章介绍数据计算基础,大数
本书以信息技术工具与大数据分析为核心,结合当前时代信息技术的发展动态,通过10个具有代表性的实验,对与大数据分析相关的工具、方法及其应用进行了详细介绍。本书一方面涵盖了信息技术基础知识、AIStudio平台、Python程序设计语言、网络数据获取、文本和表格数据处理与数据分析等大数据分析基础知识体系内容,另一方面加入了
本书是一本全面关注数据资产管理体系、方法与实践的工具书,主要内容分为数据资产管理概述、数据资产管理体系、数据资产管理技术、数据资产管理实践、数据资产管理未来共5章。第1章概要介绍数据资产管理的定义与内涵、数据资产管理关注的焦点、数据资产化的战略意义等;第2章介绍数据资产管理体系,涵盖数据管理组织、战略规划、保障机制、运