本书先简单介绍了Spark和SparkMLlib,然后介绍标准SparkMLlib库之外的更强大的第三方机器学习算法和库。通过阅读本书,你将能够通过几十个实际的例子和深刻的解释,将所学到的知识应用到真实世界的用例。
本书由“数据仓库之父”Inmon和“DataVault之父”Linstedt领衔撰写,带领读者从宏观视角了解数据架构的基本概念和原则,是数据科学家、分析师和管理者在入门阶段的必备参考读物。本书创新性地提出终端状态架构的概念,新增了关于可视化和大数据的章节,以及文本管理和分析等来自不同行业的实例。通过阅读本书,读者将通晓
本书主要分析Hadoop3.2.0的新特性和新功能,共5章。首先简单介绍Hadoop,让刚接触Hadoop的读者对它有个基本了解;接着介绍目前使用比较多的分布式文件系统HDFS,内容涉及NameNode的原理、HA、HDFSFederation和HDFS3.0中新增的特性;然后从应用管理和资源调度这两个方面介绍一个通用
本书是“数字系统设计”课程的配套教材。全书共6章,包括C8051F360单片机结构、C8051F360的数字I/O端口、C8051F360的模拟外设、开发工具简介、实验平台概述、综合设计实例。本书提供实验平台所有模块的详细电路原理图、设计方案、底层控制程序、例程应用等。在每个综合设计实例后提供拓展任务,以便学生深入理解
借助于数据分析与挖掘技术能够从庞大的、分散的数据中获取所需要的知识,这是当前科技领域的一个重要课题研究。本书梳理了大数据分析与数据挖掘的多种研究方法,介绍了数据特征分析与数据准备,并从关联规则、回归分析、分类分析、聚类分析、预测与时间数据分析等方面阐述了典型数据挖掘技术及其应用,并在最后介绍了当前教育的热点——教育大数
本书的主要目的是给读者启动和实施数据治理计划提供一个坚实的基础,同时作为其他数据治理书籍的有益补充。如果您的企业已经开始数据治理实践但仍摇摆不定,本书将为您提供许多建议并尽可能提供中立的立场和流程。在大量的背景、定义和推荐实践之外,本书将展现开展数据治理的通用的步骤和活动,并在附件中提供了交付物和工作成果模板,可以作为
在这本书中,作者给出在过程工业中所需要的先进控制技术的概念和术语。这本书是为熟悉传统控制过程却在先进控制领域缺少相关经验的控制工程师编写的。这本书的每一章的结构允许快速了解技术及如何应用。应用大量实例来说明什么是需要处理应用程序。而且,每一章的第一段介绍相关技术的数学基础,章末则给出探索性的内容。读者可通过转到本书附带
本书共九章,主要内容包括:综述、光电检测系统的关键器件、光电信息检测技术与系统、光电图像检测技术与系统、光电干涉检测技术与系统、光电衍射检测技术与系统、光电扫描技术工程、光纤传感检测技术与系统、光谱检测技术与系统。
《数据科学导论(面向新工科专业建设计算机系列教材)》主要介绍数据科学的通识入门知识,可以作为高等院校数据科学与大数据专业的专业基础课程教材。该书以“建立知识体系、掌握基本原理、学会初级实践、了解前沿技术”为原则,为数据科学与大数据及相关专业的学生深入学习数据科学和大数据技术奠定基础。该书系统讲授数据科学的基本概念和知识
本教材在选题与整体结构设计时,对大数据基础知识和技术应用做了详细的解析,同时全面介绍了如何运用方法和工具对大数据应用案例进行分析,是一本特色鲜明、理论与实践相结合、具有广泛使用价值的教材。使本科生从整体上了解大数据基础的内容与技能。