本书通过实践操作介绍大数据爬取、清洗与可视化的具体实施方案,共10章,包括大数据爬取、清洗与可视化概述,爬虫概述,Requests库,BeautifulSoup爬虫,自动化测试工具Selenium,中型爬虫框架Scrapy,数据存储,数据清洗,Matplotlib可视化,Pyecharts可视化。书中的案例均经过实践验
数据挖掘技术在文本等数据上的应用研究
作者均为一线资深架构师和技术顾问,具有丰富的云数据管理实践经验。因此,本书具有很好的实践指导意义。从数据保护解决方案出发,结合云时代数据管理的特点,基于来自VeeamSoftware的工具和软件详细阐述了在云数据管理中各种新技术的实现方法和应用方式。针对云数据管理所面临的挑战和问题,通过一些工具的组合使用给出了相应的实
过程控制系统及工程(孙洪程)(第四版)
本书从检测系统设计与应用工程师需要掌握的核心技能出发,系统介绍了检测技术基础知识及基本概念,包括检测系统组成、检测系统特性分析、静动态特性测试、误差分析、经典传感器技术、传感器信号调理与采集等,并对近年来广泛应用的数字脉冲传感器、半导体集成传感器、辐射测温技术、激光测距技术、机器视觉等现代检测系统做了较为深入的阐述。为
我国提出新基建概念,要加快大数据中心、人工智能等新型基础设施的建设进度,这无疑需要更多的大数据人才。PySpark可以对大数据进行分布式处理,降低大数据学习门槛,本书正是一本PySpark入门教材,适合有一定Python基础的读者学习使用。本书分为7章,第1章介绍大数据的基本概念、常用的大数据分析工具;第2章介绍Spa
教材系统地介绍文本数据挖掘的相关概念,利用Python作为工具进行相关试验,其内容主要包括:文本挖掘产生的背景及发展;文本挖掘的概念、文本模型表示、文本内容的预处理,包括分词、去停用词以及特征抽取;文本相似度的概念等。介绍文本分类的概念及常用方法,如KNN算法、SVM算法等,并对分类结果进行评价;在介绍文本聚类聚类的概
MATLAB及其模块化仿真工具Simulink是当今世界上*的数值计算和系统仿真软件之一。本书充分考虑自动化专业课程设置的情况,以MATLABR2015b为主要工具,较为全面地介绍了自动控制系统的建模、分析、仿真与设计的基本原理和方法。全书共分8章,内容包括:自动控制系统仿真概述、控制系统计算机数字仿真基础、MATLA
本书主要以美国罗克韦尔公司的MicroLogix1500系列PLC作为控制器,利用RSView32进行上位机监控界面的设计。书中从实际应用的角度出发,设置了5个学习情境,这5个情境分别是电动机运行监控系统人机界面的设计、水箱水位监控系统人机界面的设计、交通灯控制系统人机界面的设计、触摸屏远程监控电机运转人机界面的设计和
本书根据作者多年的教学经验,主要介绍了经典控制原理的基础知识,包含自动控制原理的基本概念、线性系统的模型、时域分析、根轨迹、频域分析、校正这六部分内容。但我们在章节设计上,为了便于老师授课与学生学习把握,采用平均分配知识点的方式,将其划分为21章,基本上每一章都围绕自动控制原理的某一个比较独立的知识点展开进行介绍。因此