《数据资产管理核心技术与应用》深入探讨数据资产管理的核心技术与应用,融入作者在大数据领域多年的丰富经验。《数据资产管理核心技术与应用》为读者提供一套可以落地的数据资产管理框架,并详解两个基于该框架进行数据资产管理的应用案例,使读者能更好地了解数据资产管理底层所涉及的众多核心技术,让数据可以发挥出更大的价值。《数据资产管
本书系统介绍了大数据基础知识和相关技术,全书分为大数据基础、大数据存储与管理篇、大数据采集与预处理、大数据分析与挖掘、大数据平台Hadoop实践与应用案例5篇,共17章,主要内容包括大数据基本概念、大数据平台Hadoop基础、大数据存储与管理基本概念、大数据分布式文件系统HDFS、大数据分布式数据库系统HBase、大数
《Hadoop海量数据处理》从Hadoop的基础知识讲起,逐步深入Hadoop分布式文件系统(HDFS)和MapReduce分布式编程框架的核心技术,帮助读者全面、系统、深入地理解Hadoop海量数据处理技术的精髓。本书在讲解技术原理时穿插大量的典型示例,并详解两个典型项目实战案例,帮助读者提高实际项目开发水平。《Ha
本书通过鲁棒优化的核心原理和应用,揭开不确定性的神秘面纱,为读者提供应对不可预测的挑战所需的见解和工具。作者首先简要介绍了不确定线性规划,然后深入分析了适当不确定性集的构建与经典机会约束(概率)方法之间的相互联系。接着,提出了针对不确定的锥二次优化和半定优化问题以及动态(多阶段)问题的鲁棒优化理论。最后,通过来自金融、
本书采用项目任务式编写方法,以合理的结构、通俗易懂的语言、丰富实用的案例、学练结合的讲解方式,全面系统、循序渐进地介绍了大数据存储的相关技术和实际应用。全书共分为7个项目,分别为大数据存储概述、数据仓库Hive、列式数据库HBase、文档数据库MongoDB、图数据库Neo4j、键值数据库Redis、NewSQL数据库
本教材是大数据时代下,大数据行业蓬勃发展,大数据技术也在不断涌现革新,本书对大数据体系架构lambda进行梳理,介绍了一些重要的大数据平台技术原理与编程实践,包括数据收集层的Kafka,数据存储层的HDFS、HBase,计算框架层的MapReduce、Spark、Flink,资源管理与协调层的YARN、ZooKeepe
本书首先介绍了大数据应用基础:重点讲解了如何搭建Hadoop分布式集群平台,使用Java语言进行MapReduce分布式编程;HBase及Hive数据库环境的安装和数据的增、删、改、查操作;Spark平台的搭建、RDD操作及SparkSQL查询;Flink平台的搭建,Kafka消息中间件的使用及流批一体计算。其次对数据
本书共分两部分:第一部分是网络数据采集与预处理的基础理论实践,包括任务1-任务6,主要讲解如何使用Python编写网络数据采集和预处理程序,内容包括Python环境搭建,Python基础语法、语句与函数,网络基础知识,常用网络数据采集与预处理库和解析库、数据持久化保存,以及requests库、Numpy库、Pandas
本书针对本科生控制理论课程中的典型难点问题开展了针对性的研究,包括物理建模、实验辨识建模、动态误差系数法、时滞系统稳定性分析、描述函数法、串联校正、状态反馈和最优控制数值解法等内容。书中给出了典型案例的Matlab源程序及Simulink模型。通过对本书的学习,读者能够对控制理论有更加清晰的把握,提高编程能力。
机器学习应用需要大量的数据,因此有必要保护这些数据集中敏感信息的隐私和安全。从数据收集和导入到模型开发和部署,隐私保护发生在机器学习过程中的每个环节。这本实用的图书将讲授确保数据管道端到端安全所需的技能。 《隐私保护机器学习》通过面部识别、云数据存储等真实世界中的用例来探讨隐私保护技术。你将了解到现在就可以部署的切实