本书是计算机、信息管理和大数据等相关专业的专业英语教材,选材广泛,覆盖大数据的数据挖掘、数据分析等各个方面,同时兼顾了相关发展热点。本书所选取的文章包括以下内容:大数据的基本概念、大数据的数据挖掘、大数据的数据分析、大数据的影响、大数据的商业价值、大数据在各个领域的应用以及大数据如何改变人们的生活等。每章所选用文章均来
本书由浅入深地介绍了如何快速搭建Airflow集群,包括不同操作系统的快速搭建方法、Airflow的安装方法、Airflow集群的部署方法、Airflow中的核心概念和其他重要概念、Airflow的架构和组件、Airflow的系统管理、实践经验以及其他常见的调度系统。附录提供了Docker和Kubernetes的简介。
《中国大数据应用发展报告No.7》(2023)卷分为总报告、热点篇、案例篇、探究篇四个部分,对大数据在数字政府、教育、文旅、金融、工业制造等多个领域及行业应用的最新态势进行了跟踪。报告收集了大数据服务地方政府精准决策、大数据在文化和旅游资源普查与评价中的应用、教育大数据治理及应用、工业互联网在玻璃制造行业的应用等热点案
本书全面介绍了最新的因果推断方法,并以实践应用为辅,方便读者理解。本书化繁为简,层层深入地引导读者了解因果推断方法发展的历程和现状。通过本书,读者可以获得关于因果推断方法的全局视角。本书共5章,以递进的方式展开对因果推断方法的介绍。第1章从广泛熟悉的相关关系出发,通过介绍相关关系与因果关系的联系与区别过渡到对因果关系的
写作本书的目的是希望让不懂编程的读者也能使用ChatGPT生成代码,轻松实现Excel数据处理自动化,让读者从零基础成为高手;让懂编程的读者也能收获良多,快速提升工作效率。书中用ChatGPT自动生成代码,实现了Excel数据处理自动化的绝大部分内容,包括数据导入和导出、数据整理、数据预处理、数据统计分析、数据可视化和
本书是PySpark大数据分析的入门读物,适合有一定Python基础的读者学习使用。本书基于最新版本的PySpark3.4.x编写,全书共11章,系统地介绍了PySpark大数据分析的方法和技巧,内容涵盖了大数据的相关技术、PySpark的基本概念、Spark环境搭建、数据分析的基本概念及相关工具、开发工具的选择、Sp
安徽省省级研究生规划教材。教育部产学合作协同育人项目“新工科背景下人工智能专业建设的探索与实践”、安徽省教学研究项目(重点)“新工科背景下自动化专业实践教学体系改革研究”等项目的研究成果。本书从现代工业过程向连续化、集成化、大规模方向发展等特点出发,系统介绍了网络化多模态切换系统的主要模型,生产全流程运行过程中的连续回
大数据是个非常新的领域,但它的应用却是如此广泛。从银行和保险、零售和快速消费品、工业和能源、交通和物流到医疗保健和政府等,大数据在几乎任何行业都扮演着不可或缺的角色。本书是一本针对大数据实际应用的深入浅出的教材,旨在系统讲解大数据相关技术的基本原理、核心概念与实现方式,以及在实际应用中的使用。作为一本大数据实战教材,本
本书介绍了Spark大数据技术的相关知识和实际应用。共分为7个项目,分别为Spark入门、SparkRDD——弹性分布式数据集、SparkSQL——结构化数据处理、SparkStreaming——实时计算框架、SparkMLlib——机器学习库、GraphFrames——图计算框架、综合案例——分析银行个人信贷业务数据
半小时科学漫画百科是一套适合612岁孩子阅读的科普漫画书。该系列书共10册,范围涵盖物理学、化学、生命科学、地球科学、天文学、人类学、动物学等多个学科领域科学知识。以逗趣漫画形式呈现科学,激发孩子的学习兴趣。《核科学与能源》讲述了核科学与能源的故事。能源与人类的生存发展息息相关。原始时代,人们利用人力和火;蒸汽时代,蒸