本书主要介绍大数据关键技术中的大数据采集和数据预处理技术,是大数据专业的入门级的专业基础课教程(含教学课件、源代码与视频教程),旨在为学生搭建起大数据的知识架构,讲述大数据采集和数据预处理的基本原理,开展相关的实验,为学生在大数据以及相关领域的学习奠定坚实的基础。全书共分四部分:第一部分是理论基础(第1~2章和第6章)
近年来,基础软件的发展越来越受到重视,越来越多的计算机从业者对数据管理系统和大数据的知识产生了强烈的需求。 本书既介绍了数据管理系统的技术发展史,又介绍了数据管理系统的关键技术内涵,同时还介绍了一系列主流的商业化产品及其架构,并对前沿技术进行了讨论分析,给出作者自己的见解和洞察。本书内容主要包括数据库与大数据的诞生、
信息时代,大数据的应用无处不在。手机中“淘宝”“抖音”的商品推送、短视频内容推送背后,是大数据用户画像及推荐算法;道路上的“一路绿灯”背后,是智能交通——交通管理部门分析、调整交通情况;新冠肺炎疫情不漏一人的流调背后,是智慧“战疫”——有关部门以“大数据+网格化”的方式识别和挖掘目标人群迁徙轨迹;智慧电厂“一键启停、无
伴随人类社会数字化进程的深入,数据正不断渗透于日常的生活、生产、分配、流通、消费等各个环节,对人类社会的影响日益凸显。数据已成为继土地、劳动力、资本、技术之后的第五大生产要素,对其他生产要素的整合能力也使其成为既有要素中最重要的和最难替代的关键要素,并成为值得重点讨论的时代性议题与理解数字时代的基本入手点。 对数据要素
本书在介绍测量误差理论、测量系统特性及系统可靠性基本知识的基础上,系统地阐述了温度、压力、流量、液位、成分分析等过程参数以及运动控制系统中的位置、速度(转速)、转矩及功率测量等参数的检测原理、测量方法、测量系统构成及测量误差分析,同时还注意介绍各种测量装置的安装使用条件,以保证检测系统的测量精度。本书可作为高等院校自动
本书的编写目的是向读者介绍大数据分析的基本概念和相应的技术应用。全书共10章,分别介绍大数据概述、爬虫和大数据相关技术、Scrapy爬虫、Python与MySQL数据库连接与查询、数据可视化基础与应用、大数据存储与清洗、数据格式与编码技术、数据抽取与采集、pandas数据分析与清洗以及综合实训。本书将理论与实践操作相结
本书为电气化铁路变电所预应力混凝土圆杆(TBT2824-2008)的英文译本CircularPrestressedConcretePoleforSubstationofElectrifiedRailway。为国家铁路局颁布的2022年第2批英文铁标(共9种,国铁科法[2022]10号文)的一种。本标准规定了电气化铁路变
本书系统地介绍了大数据的基础知识和前沿技术。全书共8章,内容包括大数据概述、大数据处理平台Hadoop、数据采集与预处理、数据存储与管理、数据处理与分析、数据可视化、大数据思维与安全、城市空气质量大数据分析实战。
为落实国家战略,加速新一代信息技术人才培养,满足数字经济发展的人才需求,为实现经济高质量发展提供人才支撑,中国科协策划并主编中国科协新一代信息技术系列丛书,中国自动化学会受中国科协委托组编《智能控制导论》一书。本书系统地阐述了主流的智能控制概念、框架、流程、方法、算法及典型案例,希望有助于读者全面深入地了解智能控制理论
本书分为三篇,涵盖11个项目。第一篇为概论篇,介绍了大数据导论、大数据中的数据库等内容;第二篇为分析篇,介绍了大数据采集、大数据预处理基础、大数据预处理实施等内容;第三篇为附录篇,介绍了大数据中的统计学、大数据前沿等内容。