"本书结合国内外**的研究成果和实践经验,融合传统纸质媒体和新兴数字媒体,系统地介绍大数据治理的基本概念、原则、框架、技术、工具和实践等内容,注重理论与实践相结合,注重案例分析和应用演练,帮助读者全面掌握大数据治理的核心知识和方法。全书共分两篇16章:第一篇大数据治理理论包括总论、大数据架构管理、元数据管理、主数据管理
在大数据时代,数据的获取、传输和存储融入了人类生产生活的方方面面,而大数据核心价值体现为人们对数据的分析、理解与应用。面对如此海量、高速和异构的数据,仅靠人类的认知和理解能力远不能满足价值发现的需要。同时,计算机总是针对最细粒度数据进行迭代优化的求解模式在特定场景下也不能满足数据分析的时限需求。粒计算作为一种模拟人类知
"本书从职业院校学生理论、技能水平和企业应用实际出发,按照项目引领、任务驱动的体例编写,将自动化生产线安装与调试相关的知识点和实操技能点分解到不同项目中,力争教师与学生真正实现“教、学、做一体化”。本书共设置了7个实训项目,14个实训任务,每个项目以工作过程为导向、以任务为驱动,引导学生认识YL-335B自动化生产线,
复杂性是大数据区别于小数据的本质特性,也是当前大数据质量控制与数据治理面临的核心挑战。本书围绕大数据的复杂性开展研究,旨在探索当前数据资源建设与利用过程中面临的挑战和技术难题,促进数据价值的充分释放。全书分为6部分,共24章。第1部分概述(第1、2章),综述所研究数据控制技术的基本概念和任务定位,以及国内外的研究进展;
本书分为10章,其中第1~9章探讨了排序、推荐系统、聚类、线性回归等内容,每章都以一个具体的实际问题开始,其主要目的是激发对某一特定大数据分析技术的研究。接下来探讨其背后的数学原理——包括重要的定义、辅助陈述和得出的结论。案例研究有助于将所学知识应用于跨学科的环境中,包括对逐步任务的描述和有用的提示。每章之后都配有习题
讨论大数据技术时,首先需要了解大数据的基本处理流程,主要包括数据采集、存储、分析和结果呈现等环节。数据无处不在,互联网网站、政务系统、零售系统、办公系统、自动化生产系统、监控摄像头、传感器等,每时每刻都在不断产生数据。这些分散在各处的数据,需要采用相应的设备或软件进行采集。采集到的数据通常无法直接用于后续的数据分析,因
本书共分为六个部分:基础入门、研究设计和基础工具、文本挖掘基础、人文社会科学与文本分析、计算机科学与文本挖掘、写作和展示,在内容安排上由浅入深、循序渐进。相较于单一且详尽的方法教程,本书的目的更多是在于指导学生运用社会世界的文本数据来设计一项可行的社会科学研究。本书涵盖了文本挖掘研究多个方面的关键问题,包括网络抓取和爬
大数据技术与应用发展不仅改变着网络信息环境,而且决定数据的存在形态与数字信息资源的分布和利用结构,直接关系到用户的认知需求表达与数字信息交互机制。在这一背景下,本书从大数据技术基础、数据内容管理和数字信息利用出发,按照大数据应用与服务基础构架进行理论和实践的归纳;通过基本问题的分析和实证探索,围绕大数据需求、数字资源形
本教材立足“大数据”的时代背景,面向企业数字化转型升级对数字化人才的需求,坚持大数据通识教育核心理念,采用理论与实践相结合的方式,选取了六个项目,助力读者提升大数据分析相关的数字技能与数字素养,培养学生的大数据意识、大数据思维、大数据安全和大数据基本处理能力。本教材根据行业企业大数据的实际应用和高职学生认知规律,选取了
本书以项目任务为载体串联知识与技能,介绍基于SparkSQL技术的大数据分析方法,培养学习者使用SparkSQL技术解决实际数据分析问题的能力,主要内容有大数据分析概述、实践环境准备、学生信息处理分析、房产大数据分析与探索、电商大数据分析与探索、Zepplin数据可视化。在实现任务的过程中详细阐述了Scala语言基础、