本书围绕全国职业技能大赛大数据技术与应用赛项的技能要点:大数据平台的搭建与运维、大数据的采集与存储、大数据的处理、数据的分析、数据的可视化等内容展开,详细讲述了Numpy数值分析、Pandas统计分析、基于Matplotlib的数据可视化、Hadoop平台及组件部署、Spark组件部署、python数据采集方法等内容,
本书针对目前大数据发展的方向,就数据获取领域介绍数据获取原理和技术而专门编写的教材。本选题在讲解理论的同时突出实践,在实践中理解爬虫的原理、爬虫库的使用,在讲解技术的同时辅以案例来帮助读者领会和掌握技术。本选题分为三大板块,分别是基础篇、实践篇和拓展篇。基础篇主要讲述了爬虫的基本原理、爬虫的基本配置以及爬虫相关库的使用
本书分为基础篇和技术篇两部分,在每部分的章节中贯穿课程思政,通过本书的学习,能够让读者在了解和掌握大数据的基本知识和基本技能的基础上,培养读者的家国情怀、工匠精神;同时,本书系统、全面地介绍大数据相关专业在“数据经济”政策引领下的学习指导。以“数字经济”的大数据驱动为出发点,一是介绍大数据的基础知识,包括大数据的概念及
近年来,多媒体技术的飞速发展,极大地促进了大数据数据的增长。人们对大数据的需求有着不同的应用,如大数据信息检索、识别与合成等。然而,在混合大数据中,相互干扰给大数据信息处理带来了巨大的障碍。如何从混合大数据中提取所需信号已成为一个重要的研究课题。因此,本书主要研究鲁棒主成分分析(RPCA)及其扩展模型的方法实现大数据分
本书着重分析了满足高阶内模规律、存在多重非严格重复问题的被控系统的学习控制律设计问题。基于λ范数,给出了一种P型迭代学习控制律设计的严格理论分析。在此基础上,针对逐步复杂的分析对象,设计了几种自适应迭代学习控制律。研究对象从单输入、单输出,扩展到多输入、多输出,从系统中存在高阶内模变化的未知参数且跟踪非严格重复变化的参
本书综合当前数据挖掘领域的最新研究成果,系统地介绍了数据挖掘的基础理论、技术原理、算法和应用,以使读者对数据挖掘有一个系统、全面的了解。本书主要介绍数据挖掘的基本概念和数据挖掘的过程;数据挖掘的主要技术、各类典型算法及其编程实现,包括数据存储、数据预处理技术、数据相似度与异常检测、关联规则挖掘技术、分类技术、聚类技术等
随着互联网和移动设备的普及,我们生产的数据越来越庞大,大数据的应用也逐渐成为了各行各业的趋势。特别是在决策分析领域,大数据的应用能够帮助我们更加准确、高效地做出决策,提高决策的成功率和效果。本书基于这一未来既定趋势,从大数据基本理论开始介绍,意在帮助各行各业的人能够认识大数据,理解大数据,意识到大数据给未来生产生活中带
本书分四章,第一章介绍如何搭建一个以R为中心的语料库研究和处理平台,包括如何安装和配置TreeTagger软件以及Perl和Python解释环境;第二章讲解R编程的基本方法;第三章介绍用编程方式实现语料库语言学的主要方法;第四章通过一些实例讲解如何综合运用这些方法,以实现更复杂的语料库研究需求。
本书内容涵盖机械结构、电气线路、传感器检测等自动化生产线的基础技术,以及气压传动、变频调试、交流伺服等运动控制技术,还包括自动化生产线基本组成单元的机电系统的装调、PLC控制程序设计、人机界面设计、控制系统通信、系统运行及维护等方面的技术实践操作。
本书内容包括两个部分,第一部分是技术理论部分,包括大数据概述、大数据采集和分析、科学数据与资源共享、大数据治理、数据工程与数据挖掘以及大数据时代的理解等;第二部分是实践应用部分,包括大数据应用的模式和价值、大数据应用的基本策略、大数据与教育行业应用、大数据与公共安全应用、大数据与人工智能应用、大数据与医疗健康应用、大数