本书的编写目的是向读者介绍大数据治理与安全的基本概念和相应的技术应用。本书共9章,内容分别为数据治理概述、数据采集与数据道德、数据质量与数据管理、数据交换与数据集成、数据库设计与治理、架构设计与治理、数据仓库设计与治理、大数据安全与治理及综合实训。本书将理论与实践操作相结合,通过大量的案例帮助读者快速了解和应用大数据治理的相关技术,并对书中重要的、核心的知识点加大练习的比例,以达到帮助读者熟练应用的目的。本书可作为高等院校大数据专业、人工智能专业、软件技术专业、云计算专业、计算机网络专业的专业课
"数据科学项目日益增多,每个项目在提出原型到生产的过程中都需要可靠的基础设施。使用《Effective数据科学基础设施》介绍的一些新技术和新工具,你将能建立一个适用于各类组织(无论是初创企业还是大型企业)的基础设施堆栈。《Effective数据科学基础设施》可帮助你建立数据流程和项目工作流,为你开发项目带来强大动力。《Effective数据科学基础设施》呈现Netflix数据操作的**进工具和概念,并在此基础上介绍一种可定制的基于云的模型开发和MLOps方法,可轻松适应公司的特定需求。当团队把数
本书系统讲述ApacheSpark/PySpark大数据计算平台的原理,以及如果将ApachePySpark应用于大数据的实时流处理、批处理等各个场景。通过原理深入学习和实践示例、案例的学习应用,使读者了解并掌握ApacheSpark/PySpark的基本原理和技能,接近理论与实践的距离。全书共分为8章,主要内容包括:Spark架构原理与集群搭建、开发和部署PySpark应用程序、PySpark核心编程、PySparkSQL、PySparkSQL高级分析、PySpark结构化流、PySpark结
数据作为数字经济的血液、知识经济的基石,是企业的战略性资源。将数据转化为可被企业直接使用的有价值的资产,即“数据资产化”,已经成为企业数字化转型的重要目标。本书阐明了数据资产化的意义,围绕数据资产的确认、登记、质量评估、价值评估、入表,数据高效流通及价格发现等方面,系统阐述了数据资产化的理论和实践问题。本书可以帮助读者深入了解数据资产化这一全新且充满机遇的领域,提高数据资产的管理和利用水平,推动企业数字化转型的进步和升级。
本书主要研究决策蕴涵的逻辑理论及形式概念分析中的知识表示与推理。具体内容包括:决策蕴涵、模糊决策蕴涵和可变决策蕴涵的逻辑理论,决策蕴涵规范基和模糊决策蕴涵规范基的逻辑理论,决策蕴涵规范基的生成方法和性能分析,决策蕴涵的知识表示能力及其与概念规则和粒规则的比较,模糊属性约简等。
本书系统讲述ApacheSpark大数据计算平台的原理,以及如果将ApacheSpark应用于大数据的实时流处理、批处理、图计算等各个场景。通过原理深入学习和实践示例、案例的学习应用,使读者了解并掌握ApacheSpark大数据计算平台的基本原理和技能,接近理论与实践的距离。全书共分为13章,主要内容包括Spark架构原理与集群搭建、开发和部署Spark应用程序、Spark核心编程、SparkSQL、SparkSQL高级分析、SparkStreaming流处理、Spark结构化流、Spark结构
本书内容有基于多通道图神经网络的信息源估计、基于超子结构网络的链路预测器、基于子图网络的宽度学习图分类方法、子图增强及其在图数据挖掘中的应用、基于图的对抗攻击:如何隐藏你的结构信息等。
本书系统地阐述了工业控制系统——监督控制与数据采集(SCADA)系统的技术问题,包括系统组成、特点、应用及与集散控制系统等其他控制系统的比较。对SCADA系统设计与开发中的关键技术,包括工业数据采集技术、通信与网络技术、SCADA系统应用软件开发、经典OPC与OPCUA标准、功能安全与工业控制系统信息安全等都结合应用实例进行了详实的分析和论述,并通过对不同行业领域典型SCADA系统工程案例的剖析来加深读者对内容的理解,帮助读者掌握SCADA系统的分析、设计、开发与调试技能。此外,对SCADA系统
本书通过大量的绘图和详细的说明,从技术层面以简单易懂的形式讲述大数据分析。这是一本从系统结构搭建到实际开发逐步推进的教科书。书中的知识点包括大数据分析时所需的分布式处理、机器学习,以及分布式存储、分布式计算、开发时可能遇到的瓶颈,还包括大数据的收集、积累、活用以及元数据的使用与管理等。本书适合大数据领域的广大爱好者、商务人士和工程技术人员用于了解、学习、掌握、运用大数据技术进行大数据分析,也适合作为该领域的职业院校和高校本科相关专业的教材及研究生辅助教材。