"本书从职业院校学生理论、技能水平和企业应用实际出发,按照项目引领、任务驱动的体例编写,将自动化生产线安装与调试相关的知识点和实操技能点分解到不同项目中,力争教师与学生真正实现“教、学、做一体化”。本书共设置了7个实训项目,14个实训任务,每个项目以工作过程为导向、以任务为驱动,引导学生认识YL-335B自动化生产线,
复杂性是大数据区别于小数据的本质特性,也是当前大数据质量控制与数据治理面临的核心挑战。本书围绕大数据的复杂性开展研究,旨在探索当前数据资源建设与利用过程中面临的挑战和技术难题,促进数据价值的充分释放。全书分为6部分,共24章。第1部分概述(第1、2章),综述所研究数据控制技术的基本概念和任务定位,以及国内外的研究进展;
本书分为10章,其中第1~9章探讨了排序、推荐系统、聚类、线性回归等内容,每章都以一个具体的实际问题开始,其主要目的是激发对某一特定大数据分析技术的研究。接下来探讨其背后的数学原理——包括重要的定义、辅助陈述和得出的结论。案例研究有助于将所学知识应用于跨学科的环境中,包括对逐步任务的描述和有用的提示。每章之后都配有习题
讨论大数据技术时,首先需要了解大数据的基本处理流程,主要包括数据采集、存储、分析和结果呈现等环节。数据无处不在,互联网网站、政务系统、零售系统、办公系统、自动化生产系统、监控摄像头、传感器等,每时每刻都在不断产生数据。这些分散在各处的数据,需要采用相应的设备或软件进行采集。采集到的数据通常无法直接用于后续的数据分析,因
本书共分为六个部分:基础入门、研究设计和基础工具、文本挖掘基础、人文社会科学与文本分析、计算机科学与文本挖掘、写作和展示,在内容安排上由浅入深、循序渐进。相较于单一且详尽的方法教程,本书的目的更多是在于指导学生运用社会世界的文本数据来设计一项可行的社会科学研究。本书涵盖了文本挖掘研究多个方面的关键问题,包括网络抓取和爬
大数据技术与应用发展不仅改变着网络信息环境,而且决定数据的存在形态与数字信息资源的分布和利用结构,直接关系到用户的认知需求表达与数字信息交互机制。在这一背景下,本书从大数据技术基础、数据内容管理和数字信息利用出发,按照大数据应用与服务基础构架进行理论和实践的归纳;通过基本问题的分析和实证探索,围绕大数据需求、数字资源形
本教材立足“大数据”的时代背景,面向企业数字化转型升级对数字化人才的需求,坚持大数据通识教育核心理念,采用理论与实践相结合的方式,选取了六个项目,助力读者提升大数据分析相关的数字技能与数字素养,培养学生的大数据意识、大数据思维、大数据安全和大数据基本处理能力。本教材根据行业企业大数据的实际应用和高职学生认知规律,选取了
本书以项目任务为载体串联知识与技能,介绍基于SparkSQL技术的大数据分析方法,培养学习者使用SparkSQL技术解决实际数据分析问题的能力,主要内容有大数据分析概述、实践环境准备、学生信息处理分析、房产大数据分析与探索、电商大数据分析与探索、Zepplin数据可视化。在实现任务的过程中详细阐述了Scala语言基础、
本书从初学者的角度详细介绍大数据的核心技术。全书共11章,包括绪论、Linux的基础操作、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、ZooKeeper分布式协调服务、YARN资源管理器、HBase分布式数据库、Hive数据仓储、PySpark数据处理与分析及综合案例。此外,本
架构大数据系统涉及的技术和工具种类繁多,但技术和工具背后的大数据处理需求和解决问题的思维逻辑却恒久不变。本书采用软件工程化方法,从大数据架构的需求出发,籍由理性和常识的指引,推导和梳理大数据架构之术(大数据处理的基本原理和技术方法),进而讨论大数据架构之器(具体软件工具的功能、设计、实现以及使用方法),建立大数据架构教