《吉布斯分布的局部、动态与快速采样算法》由爱丁堡大学博士后凤维明撰写,内容荣获2021年度CCF优秀博士学位论文奖。全书立足大数据背景下的新问题,从分布式采样和动态采样两个具体问题入手,给出了有理论保障的算法并研究了新模型下采样问题的复杂性。《吉布斯分布的局部、动态与快速采样算法》共十章,分为四个部分:第零部分(第1~
本书对大数据挖掘与应用的基本算法进行了系统的介绍,每种算法不仅包括对算法基本原理的介绍,而且配有大量的例题以及基于阿里云大数据平台(数加平台)的演示,这种理论与实践相结合的方式极大地方便了读者对抽象的数据挖掘算法的理解和掌握。本书共11章,内容覆盖了数据预处理、分类算法、聚类算法及常见的数据挖掘应用,具体章节包括大数据
Centreon是一款分布式开源监控平台,易于安装、管理,可支持大规模的网络监控。本书基于作者实践经验讲述如何使用Centreon。全书共15章,大致可分为4部分:第1章和第2章为基础部分,主要介绍分布式监控平台Centreon的主要特征、功能;第3~5章介绍系统部署,用ISO镜像文件部署Centreon及在CentO
本书采用“问题描述+解决方案”模式,通过500个案例介绍了使用Pandas进行数据分析和数据处理的技术亮点。全书共分为8章,主要案例包括:读写CSV、Excel、JSON、HTML等格式的数据;根据行标签、列名和行列数字索引筛选和修改数据,使用各种函数根据数据大小、日期范围、正则表达式、lambda表达式、文本类型等多
本书系统介绍Spark大数据处理框架。全书共8章,内容包括大数据技术概述、Spark大数据处理框架、SparkRDD编程、SparkSQL结构化数据处理、HBase分布式数据库、SparkStreaming流计算、SparkMLlib机器学习、数据可视化。本书可作为高等院校计算机科学与技术、信息管理与信息系统、软件工程
本书从系统的角度,成体系地研究动态数据驱动原理与方法。以数据驱动为根本出发点,揭示了复杂系统的设计、运行、控制与优化规律,从信号感知、结构感知、环境感知、情景感知、语境感知、能量感知、过程感知、网络感知、系统感知等不同维度,介绍了主流的理论与方法,提供了研究复杂系统问题的新思路、新方法。
本书系统介绍了大数据领域的相关知识,帮助读者快速了解大数据的相关理论知识和技术。全书一共包含十个章节,分别为大数据概述、大数据与其他新型技术、大数据技术基础、大数据预采集、大数据预处理、大数据存储、大数据处理框架、大数据挖掘、大数据可视化、大数据安全。全书全面系统地对大数据的相关知识进行了讲述,能够帮助读者后续更好地学
本专著主要介绍基于数据驱动的个性化需求预测理论与方法。根据交互场景的特点,分别从基本交互、交互广度、交互深度和交互多样性四个角度介绍最新个性化需求预测理论与方法。在基本交互场景中,主要研究了基于用户和产品的交互的个性化需求预测;在交互广度方面,主要研究了融合用户与好友关系交互以及融合用户与群组交互场景的个性化需求预测;
数据是组织的重要资产,做好数据管理是盘活数据资源,释放数据价值的有效手段。本书以数据管理为主题,分为背景篇、标准篇、贯标篇、评估篇和政策篇五个篇章,首先梳理了数据管理的概念、背景和发展历程,为读者建立对数据管理的总体认识;其次详细解读国家标准——数据管理能力成熟度评估模型(以下简称DCMM),帮助读者深入理解DCMM标
本书是在大数据时代已经到来之际,在商业、经济及其他领域中,在基于数据和分析去发现问题并做出科学、客观的决策越来越重要的背景下,为了满足日益增长的数据分析人才需求,特开设基于Python的《数据挖掘与数据分析》课程。通过本课程的学习,使学生学会使用Python进行科学计算、可视化绘图、数据处理,分析与建模,并详细拆解学习