在数字化浪潮中,大数据技术无处不在,包括互联网、体育、工业、医疗、交通等在内的社会各行各业,都融入了大数据的印迹,大数据对人类的社会生产和生活产生了重大而深远的影响。一早醒来,多篇你感兴趣的推送文章早已占领手机屏幕;走在路上,智能手环实时监测着你的健康信息;想点外卖,小程序优先推荐最符合你口味的商家;骑车出行,导航系统
利用这本书,你将学习以下内容:了解如何选择Spark转换实现优化的解决方案。探索强大的转换和归约,包括reduceByKey()、combineByKey()和mapPartitions()。理解数据分区以实现优化查询。使用PySpark设计模式构建和应用模型。对图数据应用motif查找算法。使用GraphFrames
本书是写给技术管理者、程序员的技术管理书籍。以技术团队的工作数据为基础,以技术团队为核心,用严谨的思维逻辑总结了研发容量、研发能力、研发投入率、研发人效等数据指标,以及个人胜任力、团队胜任力和技术价值等管理模型;用幽默的文字阐述了技术团队的选、用、育、留的标准,以及技术工作的衡量、评价的标准;讲述数字化技术管理的理论如
本书围绕数据中心业务如何经营这一主题展开论述,以数据中心产业演变为切入点,围绕“布局-建设-服务”三大核心环节,针对数据中心产业面临的集群化布局、低碳化建设、智能化服务的机遇与挑战,通过变革中的数据中心产业、数据中心产业面临的挑战、数据中心布局之道、数据中心低碳建设之道、数据中心智能服务之道、数据中心产业政策实施之道、
本书先带领读者了解工业网络技术的发展脉络,再以三菱iQ-FX、iQ-R、MELSEC-Q系列PLC为主控CPU,通过项目形式全面学习以太网通信、简单CPU通信、串行通信、CC-Link通信、CC-LinkIEField通信、CC-LinkIEControl通信、CC-LinkIETSN通信、Modbus通信和综合网络通
Hive是大数据领域的一个重要开发工具。本书基于Hive3.1.3版本进行编写,首先,简单介绍了Hive的起源和发展,以及Hive的安装和部署;其次,分别介绍了Hive的数据定义语言、数据操作语言、查询语言,以及各种函数,其中穿插安排了大量的综合案例练习;再次,讲解了分区表和分桶表,以及文件的压缩;最后,重点讲解了Hi
本书共分8章,主要内容如下: 第1章介绍数据的认知与研究任务,大数据概念特征及技术挑战等。 第2章介绍大数据内容、知识和结果表达概念,以及元数据和知识图谱技术。 第3章介绍数据存储基础、大数据存储要求以及应对技术和典型系统。 第4章介绍数据管理基础,新型数据管理模型及其相应大数据管理系统。 第5章介绍数据计算基础,大数
本书以信息技术工具与大数据分析为核心,结合当前时代信息技术的发展动态,通过10个具有代表性的实验,对与大数据分析相关的工具、方法及其应用进行了详细介绍。本书一方面涵盖了信息技术基础知识、AIStudio平台、Python程序设计语言、网络数据获取、文本和表格数据处理与数据分析等大数据分析基础知识体系内容,另一方面加入了
本书是一本全面关注数据资产管理体系、方法与实践的工具书,主要内容分为数据资产管理概述、数据资产管理体系、数据资产管理技术、数据资产管理实践、数据资产管理未来共5章。第1章概要介绍数据资产管理的定义与内涵、数据资产管理关注的焦点、数据资产化的战略意义等;第2章介绍数据资产管理体系,涵盖数据管理组织、战略规划、保障机制、运
数据要素作为继土地、劳动力、资本、技术之后的第五大生产要素,在2020年4月国务院《关于构建更加完善的要素市场化配置体制机制的意见》首次出现并明确提出"加快培育数据要素市场”后,中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》中也提出了"发展数字经济,推进数字产业化和产业数字化,推动数字经