本书提出采用对等计算模式组织分布式时空索引的建立,主要从节点同构和异构两个角度出发,并结合用户的时空查询类型,从面向历史查询、面向将来预测查询和面向描述时空信息的数据的查询出发,研究设计查询性能良好、更新能力稳定、支持半结构化描述查询的分布式时空索引机制。
本书共8章,具体内容包括:数据与大数据、大数据感知与获取、大数据处理、大数据分析、大数治理、大数据安全与隐私及大数据行业应用。本书既可共高校相关专业教学使用,也可供大数据领域工程师或者有志于大数据领域工作或研究的科技人员使用。
本书作者比尔·钱伯斯和马太·扎哈里亚在强调Spark2.0的改进和新功能的同时,将Spark题分为不同的部分,每个部分都有其独特的目标。你将探索Spark的结构化API的基本操作和常见功能以及StructuredStreaming,后者是用于构建端到端流应用的一种全新的高层API。开发人员和系统管理员会学Spark监控
《MATLAB语言与控制系统仿真》根据实际需要,系统地介绍数学软件MATLAB7.0的基本功能,包括数值计算功能、符号运算功能和图形处理功能等,在此基础上精心设计了丰富的实例,并且有一些导入案例、知识拓展和MATLAB实验,这样可以更好地拓展知识,提高读者的实践应用能力。MATLAB语言与控制系统仿真的结合,使得MAT
本书系统地介绍了图对称性基础理论,包括基于图对称的复杂性度量模型与图距离度量模型、复杂对称网络生成模型以及基于图对称的网络约简理论等,介绍了一系列基于图对称性的应用方法,包括利用图对称实现社交网络隐私保护、利用图对称实现高效的*短路径索引与查询等。
《案例驱动的大数据原理技术及应用》从大数据的定义、特征、关键技术及其平台和主要应用出发,密切结合相关案例,揭示了案例对于大数据的驱动关系。针对这一关系,书中分别介绍了Spark系统和编程方式,大数据分析基础算法和实例,面向大数据的流数据分析算法和实例、图算法和实例,大数据应用编程案例,基于时间序列数据的预测等内容。《案
非结构化数据是与结构化数据相对应的概念。结构化数据具有固定的格式,看上去非常规整。与结构化数据相反,非结构化数据是指无固定格式的数据,例如,文本、网页、图像、视频、数据流、序列、社交网络、图结构等。现有数据中绝大多数数据都是非结构化数据。本书介绍了四种典型非结构化数据的分析和挖掘技术,分别是:文本数据、社交网络数据、数
阿布·埃拉·哈桑尼、艾哈迈德·塔赫尔·阿萨、哈维尔·斯纳谢尔、亚努什·卡茨匹奇克、杰马勒·阿巴瓦耶等编著的《复杂系统中大数据分析与实践(精)》从复杂系统与大数据的结合点出发,在基础理论知识的基础上,首先通过在多个应用背景下
本书通过原理加案例的方式系统地讲解了Hadoop大数据开发,让读者能够全面地了解大数据开发流程。书中精心安排了原理分析、环境搭建、案例开发等多个过程,使读者对解决大数据问题有清晰的思路。全书共7章:前6章系统讲解大数据Hadoop架构,包括大数据处理平台Hadoop、分布式文件系统HDFS、并行计算模型MapReduc
Kibana是广泛地应用在数据检索和数据可视化领域的ELK中的一员。本书专门介绍Kibana,通过不同的用例场景,带领读者全面体验Kibana的可视化功能。全书共9章,主要包括数据驱动架构简介、安装和配置Kibana5.0、用Kibana进行业务分析、用Kibana进行日志分析、用Kibana和Metricbeat进行