目前,社会对大数据工程技术人才的需求大大增加,因此向计算机和电子信息类相关专业学生传授大数据知识和技术方法,提高他们在各领域应用大数据的能力具有重大意义。本书共9章,围绕大数据的基本概念和大数据处理的主要环节编写。第1章主要介绍大数据的概念、特点和构成;第2章主要介绍在Windows系统中安装Linux虚拟机及构建Ha
大数据治理是传统信息治理的延续和扩展,其涉及的内容非常广泛。大数据治理确保以正确的方式对数据和信息进行管理,为大数据的有效应用保驾护航,使得数据成为一个有机整体而不是各自为政。大数据治理所需的技术支撑需要涵盖大数据管理、存储、质量、共享与开放、安全与隐私保护等多个方面。本书首先对大数据治理的背景和基本概念进行简要介绍,
本书围绕大数据背景下的数据挖掘及应用技术,从大数据挖掘的基本概念入手,由浅入深、循序渐进地介绍大数据挖掘分析过程中的数据认知与预处理、数据可视化技术、数据挖掘的基本方法、Hadoop大数据分布式处理生态系统及分析应用等内容。其中数据挖掘的基本方法不仅包括数据关联分析、数据分类分析及数据聚类分析,还包括深度学习等重要的数
本书是在大数据与人工智能快速发展并对人们的科学研究、生活产生了重要影响的大形势下,结合教育部计算机公共课教指委提出的加强在校大学生计算思维能力培养的指导思想,为高等院校《大学计算机应用基础》类课程的教学而编写的。本书从信息处理与数据科学的视角入手,依据大学计算机公共课的课程体系及本书的设计理念,重点探索与分析了信息在计
《Textdatamining》offersthoroughanddetailedintroductiontothefundamentaltheoriesandmethodsoftextdatamining,rangingfrompre-processing(forbothChineseandEnglishtexts)
本书介绍了数据工程的基本概念和理论基础,围绕数据资源建设的规划和管理问题,介绍数据资源规划和管理的概念、特征、作用和功能,系统介绍了数据资源规划理论的发展过程、核心思想基础、主流方法体系和具体实施步骤,以及数据资源管理涉及的治理、质量、集成等理论知识、支撑平台、关键技术和主流工具。本书内容划分为数据工程基础篇、数据资源
本书的内容涉及智能视频监控系统中的采集及编码技术、数据传输技术、数据存储技术、现实技术等方面,介绍了产品技术特点、技术应用的相关知识、工程应用规范。
在微服务架构下,分布式事务一直是痛点和难点。Seata是阿里巴巴开源的分布式事务中间件,致力于以高效且对业务无侵入的方式,解决在微服务场景下面临的分布式事务问题。本书作者是阿里巴巴GTS创始人和Seata作者,结合其多年在分布式事务领域设计、研发和应用的经验,深入浅出地阐述了分布式事务技术基础、SeataAT模式、TC
阿里云数字新基建系列包括5本书,涉及Kubernetes、混合云架构、云数据库、CDN原理与流媒体技术、云服务器运维(Windows),囊括了领先的云技术知识与阿里云技术团队独到的实践经验,是国内IT技术图书又一重磅作品。 数据库技术,被称为计算机三驾马车之一,几十年来,持续支持着全球亿万数字业务的运行,而云计算的出现
内容提要 本书全面系统地介绍了大数据的测试技术与质量体系建设。本书共11章,第1~4章涵盖认识大数据,大数据技术生态,数据仓库的设计与构建,以及大数据项目开发流程;第5~7章讲解大数据测试方法、大数据测试实践和数据质量管理;第8~10章介绍大数据测试平台实践、数据治理平台建设,以及DataOps的理念与实践;第