本书主要介绍数据挖掘和数据分析的基本概念和方法,包括数据的基本属性和概念、数据预处理技术、数据立方体和OLAP技术、频繁模式挖掘、回归分析、分类、聚类、离群点分析。每一部分先介绍基本概念、理论基础、应用实例、思考习题。书中涉及的模型和算法均给予了相应的实例,便于读者更好的理解和使用模型。
本书是作者在多年科学研究的基础上整理完善而成的,是自然语言处理技术在文本分类领域应用的综述和总结,本书专业性较强,注重对技术理论依据和解决思路的精细讲解,读者可通过对本书的学习了解和掌握人工智能相关技术在网络文本处理时的实现方法和操作流程。本书的内容包括:文本预处理、特征表示与降维、文本分类算法、多标签文本分类技术、短
全书共有12章,从Hadoop概述开始,介绍了Hadoop的安装与配置管理,并对Hadoop的生态体系架构进行了介绍,包括HDFS技术、YARN技术、MapReduce技术、HadoopI/O操作、海量数据库技术HBase、ZooKeeper技术、分布式数据仓库技术Hive、分布式数据分析工具Pig,以及数据迁移工具S
本书介绍了大数据的概念、特点、市场、技术、分析、应用,还专门讨论了云计算、人工智能和区块链等热点新技术及应用,教学设计层次清晰,每个单元都遵循同样的编排体系,内容图文并茂,对口语技能、阅读技能、翻译技能的学习任务进行了合理的设计。而且,本书还对每个单元的教学重点和专业词汇进行了注释,设置了基于内容的阅读理解练习、词汇练
本书将古典、非线性和现代控制理论结合起来,借助MATLAB库函数、仿真工具、硬件平台对象完成控制理论的分析和设计实验。通过实时观察实物的动作,增强学生的兴趣和感知能力,帮助学生更好理解自动控制理论,并增强学生的研究能力和创新能力。学术价值体现在: (1)利用硬件实验平台,学生可以理解控制器参数的作用,掌握调整直流伺服
本书的主要章节包括分位数回归、等分线性回归、数据包络分析法、随机前沿分析法、层次分析法、灰关联分析、模糊理论、粗糙集理论、小波时间序列、组合优化问题等。此外,本书引入了最新的R数据挖掘方法;摒除掉艰深难懂的理论,以最浅显的方式介绍数据挖掘理论,让读者迅速掌握,轻松入门;力求最简单的R程序或安装包运行数据挖掘案例分析,详
图分析可以揭示复杂系统和大规模网络的运作机制,图算法为构建智能应用程序提供了快速建模的框架,有助于更准确、更快速地做出预测。包括商品推荐和欺诈检测在内的许多人工智能问题能转换为图论问题。本书基于Spark和Neo4j讲解近20种常用的图算法,帮助读者拓展重要图分析类型的相关知识和能力,更快速地发现数据中的模式并找到更优
本书以培养职业岗位能力为目标,融知识、理论、实践为一体,体现“理实一体化”教学思想,涵盖省级“十二五”规划课题的研究成果。
本课程面向非计算机专业学生,以普及大数据基础知识和工具为目标,力图构建一门新的大数据入门学习课程。课程包括数据获取、数据挖掘、数据呈现和数据思维等四部分内容。课程立足应用入门,突出八爪鱼、Weka和Tableau等主流工具应用,强调案例教学。通过本课程学习,学生们能够掌握一定的数据获取、分析与呈现技能,初步建立数据思维
本书从系统集成与应用角度介绍自动测试技术理论知识和实践训练项目。全书共6章,分为三个部分。第一部分(第1章~第3章)为理论知识篇,主要介绍自动测试简介和虚拟仪器技术、测试总线技术和软件开发技术;第二部分(第4章和第5章)为教学实验系统篇,主要介绍教学实验系统所采用的教学实验开发软件(MicrosftVisualStud