本书引导读者从数据科学基本概念出发,全面了解数据科学相关知识,掌握数据科学中数据处理的流程和方法。本书在理论上突出可读性和完整性,力求兼具一定的广度和深度;在实践上强调对常用技术工具的操作性,力求体现数据科学应用的多样性和代表性。全书共12章,可分为三大部分:第1、2章是数据科学概述部分;第3~6章是数据科学理论基础和
本书以任务为导向,较为全面地介绍Hadoop大数据技术及其生态系统组件Hive、HBase的相关知识。全书共8章,具体内容包括Hadoop介绍、Hadoop集群的搭建及配置、Hadoop基础操作、MapReduce入门编程、MapReduce进阶编程、Hive数据仓库、HBase分布式数据库,以及一个项目案例(电影网站
本书从基础认知出发,兼顾实训操作,内容分为NXMCD基础篇和实训篇。基础篇针对西门子NXMCD的基本机电对象、运动副和约束、耦合副、传感器和执行器、运行时行为、仿真过程控制、虚拟调试协同连接的相关知识和实操技巧进行了系统介绍;实训篇针对小型自动化生产线控制面板、出料、传送、装配、仓储等典型机构的仿真和调试进行了细致阐述
大数据平台运维是大数据应用人才培养的基本技能之一。本书讲解了大数据平台运维过程中的各个主要阶段及其任务,主要包括安装部署、优化监控、架构原理、生态系统、运维工具等。本书内容全面,涵盖了Hadoop生态绝大部分组件的运维,兼具基础理论与运维实践经验;主要特色是将知识点凝练到图形中,通过视觉记忆,看图联想,理解知识点的含义
本书介绍大数据技术的基本概念和相应的技术应用。全书共为10章,分别是大数据介绍、云计算基础、大数据架构、数据采集、数据清洗、大数据存储、大数据分析与挖掘、大数据可视化、大数据安全和大数据的行业应用。本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据相关基本技术,并对书中重要的、核心的知识点加大练习的
本书以面向应用、面向实战为指导思想,紧扣企业技术人才培养的特点,在知识点讲解和实验中避免复杂的理论,使学生能快速上手体验、验证大数据处理的魅力,以激发学生的学习兴趣。本书覆盖了大数据生命周期主要技术要点,全书共8章。第1章介绍大数据的产生和特点及思维的变革,第2章了解大数据生态环境,第3章-第7章是按照大数据的生命周期
该书通过对数据库和信息系统中的数据与信息质量的现状和未来发展进行充分、完整而全面的综述,对组成数据与信息质量研究核心的技术进行了深入探讨,包括对象识别、数据集成、错误定位与纠正等,并在一个原创框架下对相关技术进行比较研究。该书除了将数据与信息质量作为独立研究领域进行系统描述,还包括了从其他领域借鉴的研究成果,如概率论、
本书采用项目驱动方式,从理论到实践,由浅入深地设计了17个项目,包括认识大数据分析、Python数据分析工具、numpy数据分析和处理、Pandas数据分析和处理、Matplotlib数据分析可视化、基于HADOOP的数据分析和机器学习。
本书系统阐述了Pandas基础知识、应用原理,以及应用流程和应用技巧等实战知识。全书共分为5篇:第一篇为入门篇(第1和2章),第二篇为基础篇(第3和4章),第三篇为基础强化篇(第5-7章),第四篇为进阶篇(第8-11章),第五篇为案例篇(第12章)。书中主要内容包括Python简介、NumPy基础、Pandas入门、数
这是一本从实战角度解读如何进行智能数据分析及搭建智能数据分析平台的工具书,目的是帮助读者全面认识并在实际工作中灵活使用智能数据分析,同时构建可用的智能数据分析环境。本书不仅包含关于智能数据分析的基础知识,还包含进行智能数据分析必备的方法、工具、案例,以及平台的搭建方案。全书共分为8章。第1-2章在全面剖析了智能数据分析