本书主要介绍了Spark运行原理及性能调优的相关实践,从Spark框架内部及外部运行环境等不同角度分析Spark性能调优的过程。第1章介绍了Linux系统中各种监控工具的使用,对CPU、内存、网络、I/O等方面进行介绍,并提供了集群监控报警的解决方案。第2章介绍了Java虚拟机(JVM)的基本知识、垃圾回收机制,以及对
本书主要介绍数据挖掘和数据分析的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据立方体和OLAP技术、频繁模式挖掘、回归分析、分类、聚类、离群点分析。每一部分先介绍基本概念、理论基础、应用实例、思考习题。书中涉及的模型和算法均给予了相应的实例,便于读者更好的理解和使用模型。
本书是作者在多年科学研究的基础上整理完善而成的,是自然语言处理技术在文本分类领域应用的综述和总结,本书专业性较强,注重对技术理论依据和解决思路的精细讲解,读者可通过对本书的学习了解和掌握人工智能相关技术在网络文本处理时的实现方法和操作流程。本书的内容包括:文本预处理、特征表示与降维、文本分类算法、多标签文本分类技术、短
要成为RPA的专家,需要参与到引进该技术的相关活动中,也需要了解RPA软件,并了解一部分机器人系统是如何开发的。本书将对RPA的引进形式、结构、程序到机器人开发、系统开发、引进流程、运行管理和安全以及相关互补技术进行介绍,全方面讲解RPA的“原理”。当然,不需要样样精通,读者可以结合自己擅长的领域,参与到创新、机器人开
全书共有12章,从Hadoop概述开始,介绍了Hadoop的安装与配置管理,并对Hadoop的生态体系架构进行了介绍,包括HDFS技术、YARN技术、MapReduce技术、HadoopI/O操作、海量数据库技术HBase、ZooKeeper技术、分布式数据仓库技术Hive、分布式数据分析工具Pig,以及数据迁移工具S
本书介绍了大数据的概念、特点、市场、技术、分析、应用,还专门讨论了云计算、人工智能和区块链等热点新技术及应用,教学设计层次清晰,每个单元都遵循同样的编排体系,内容图文并茂,对口语技能、阅读技能、翻译技能的学习任务进行了合理的设计。而且,本书还对每个单元的教学重点和专业词汇进行了注释,设置了基于内容的阅读理解练习、词汇练
本书将古典、非线性和现代控制理论结合起来,借助MATLAB库函数、仿真工具、硬件平台对象完成控制理论的分析和设计实验。通过实时观察实物的动作,增强学生的兴趣和感知能力,帮助学生更好理解自动控制理论,并增强学生的研究能力和创新能力。学术价值体现在: (1)利用硬件实验平台,学生可以理解控制器参数的作用,掌握调整直流伺服
本书的主要章节包括分位数回归、等分线性回归、数据包络分析法、随机前沿分析法、层次分析法、灰关联分析、模糊理论、粗糙集理论、小波时间序列、组合优化问题等。此外,本书引入了最新的R数据挖掘方法;摒除掉艰深难懂的理论,以最浅显的方式介绍数据挖掘理论,让读者迅速掌握,轻松入门;力求最简单的R程序或安装包运行数据挖掘案例分析,详
图分析可以揭示复杂系统和大规模网络的运作机制,图算法为构建智能应用程序提供了快速建模的框架,有助于更准确、更快速地做出预测。包括商品推荐和欺诈检测在内的许多人工智能问题能转换为图论问题。本书基于Spark和Neo4j讲解近20种常用的图算法,帮助读者拓展重要图分析类型的相关知识和能力,更快速地发现数据中的模式并找到更优
本书以培养职业岗位能力为目标,融知识、理论、实践为一体,体现“理实一体化”教学思想,涵盖省级“十二五”规划课题的研究成果。