本书分7个单元。内容包括:Web数据可视化概述、新能源汽车大数据可视化监测平台、Web基础、前端框架、数据可视化设计基础、数据可视化整合、新能源汽车数据大屏。
这本书的目的是帮助所有人通过R使用ApacheSpark。第1章~第5章,简单地介绍了如何大规模执行数据科学和机器学习项目。第6~9章介绍了使用Spark进行集群计算中令人激动的基本概念。第10章~第13章涵盖一些高级主题,包括分布式R、Streaming和社区贡献等。
《大数据处理:从采集到可视化》共分为9章,章数据采集,主要介绍了大数据的概念、类型及其特征,常见的数据采集方法;第2章数据清洗,主要讨论数据质量的维度,数据可能存在的质量问题,常见的数据清洗方法;第3章数据ETL,重点介绍了MGO方法;第4章数据存储,主要介绍了大数据时代的一些主流数据存储平台和相关技术;第5章回归算法
《大数据计算机基础(第2版)/大数据分析统计应用丛书》是中国人民大学、北京大学、中国科学院大学、中央财经大学、首都经济贸易大学五所高校联合培养大数据分析硕士实验班的计算机基础教材,目标是培养学生掌握大数据分析处理必备的计算机基础知识与技能。
l数据仓库、大数据、数据科学的简单介绍。l了解企业建立数据湖的各种途径。l探索如何构建自助服务模型,以及如何让分析师便捷访问数据的最佳实践。l使用不同的方法来构建数据湖。l了解不同行业专家实现数据湖的方法。
这是一个大数据爆发的时代。面对信息的激流,多元化数据的涌现,大数据已经为个人生活、企业经营,甚至国家与社会的发展都带来了机遇和挑战,大数据已经成为IT信息产业中最具潜力的蓝海。“大数据导论”是一门理论性和实践性都很强的课程。本书是为高等职业院校大数据技术与应用专业“大数据导论”课程全新设计改编的,是一本具有丰富实践特色
近年来,以ApacheSpark为代表的大数据处理框架在学术界和工业界得到了广泛的使用。本书以ApacheSpark框架为核心,总结了大数据处理框架的基础知识、核心理论、典型的Spark应用,以及相关的性能和可靠性问题。本书分9章,主要包含四部分内容。第一部分大数据处理框架的基础知识(第1~2章):介绍大数据处理框架的
本书以独特的方式讲解数据科学,不仅让读者可以轻松学习数据科学理论,又可以动手(手算和机算)进行数据科学实战。本书特色:全彩印刷,图形、表格、思维导图丰富;避免深奥的数学证明,采用简单的数学说明;用各种学习图将本书内容贯穿起来;实战计算,包含小型数据的演算和大型数据的实战程序。 本书共13章,内容涵盖丰富的数据科学
概述了OPCUA;介绍如何操作已经建立好的OPCUA信息模型;OPCA的应用程序架构和系统架构,*后本书对OPCUA协议子集进行介绍,并对OPCUA与传统OPC的性能进行了对比。对于那些需要进一步查询OPCUA详情的读者,本书的附录给出了参考。
本书由国际数据挖掘领域泰斗、UIUC韩家玮教授和其学生张超博士(现为佐治亚理工学院助理教授)合著。介绍了将非结构化文本数据转换为多维知识的数据挖掘技术,并讲解了他们开发的文本多维数据集框架的原理和使用方法。