本教材从数据科学概念入手,系统介绍数据处理的统计学基础、数据处理的方法及Python程序设计。整套教材体现了数据处理的各个阶段:数据采集、数据整理、数据存储、数据分析和数据可视化。教材内容的安排适合培养学生的计算机思维、互联网思维和数据思维能力,有利于让数据科学与学生专业深度融合,促进计算机基础课程与其他学科的深度交叉
"为解决基层企业开展数据挖掘工作难以开展的困难,本书以SPSSModeler工具为载体,以企业典型工作任务为基础设计案例和学习情境,将开展数据挖掘的基本流程、使用的工具和方法按项目制组织为不同的项目和工作任务。本书将工作中开展数据挖掘的具体过程和方法作为重点,突出技能培养和锻炼。以案例及过程性表述,简化基础理论介绍,力
本书为自动控制类理实一体化教材,主要介绍了工控组态软件MCGS在各种控制系统中的应用,以实用、易用为目的,利用项目化的编写方式对多种控制系统进行了详细的讲解,力求使读者能够有所借鉴。全书共分为四个模块,模块一介绍了MCGS工控组态软件的基本知识及部分组态设备;模块二介绍了多种开关量MCGS监控系统的构建方法;模块三介绍
本书共4个项目15个任务,项目由易到难、从单一到综合,各个项目间既有机联系又相互独立,授课教师可以根据所教学生的学情分析结果选择某一个项目单独教学并进行任务实施。4个项目分别是:安装环境准备、Hadoop集群完全分布式部署、Hadoop生态系统常用组件部署、HadoopHA集群部署。每个项目的任务都包含了任务目标、知识
在诸如上市公司财务风险预测等多源异构数据场景中,多智能体系统凭借其独特的群智决策优势受到高度关注,具有广阔的应用前景。与此同时,由于人工智能黑箱现象的普遍存在,人们在理解、管理和信任智能系统过程中面临十分严峻的问题。因此,如何增强多智能体系统决策支持的可解释性成为十分重要而富有挑战性的前沿课题之一。本书结合认知心理学中
本书系统介绍了MATLABR2022a仿真软件在自动控制领域的功能亮点和MATLAB编程基础,由浅入深地介绍了基于Simulink模块编程的仿真系统搭建与分析方法。本书第1章介绍了MATLAB基础知识;第2章阐述了经典控制理论中的数学建模、时域分析、根轨迹分析、频域分析、系统校正与设计和非线性控制系统分析等关键理论与M
实体识别在数据质量管理中起着重要作用,它是数据质量管理的重要研究方向。实体识别的目的是识别出数据集中描述同一真实世界实体的元组。实体识别的结果可以在数据质量管理的其他阶段(如数据清洗阶段和数据质量评估阶段)得到广泛应用。在一个或多个数据库中,同一个现实世界实体可能具有多种描述方式,这一问题在各种应用领域的信息系统中普遍
本书在R语言和Python的基础上开发了基于云计算的可视化云平台。全书内容包括:大数据分析基础、简单数据挖掘、基本统计方法、统计分析模型、时间序列预测技术、多元决策分析方法、大数据分析进阶七章。
"数据科学项目日益增多,每个项目在提出原型到生产的过程中都需要可靠的基础设施。使用《Effective数据科学基础设施》介绍的一些新技术和新工具,你将能建立一个适用于各类组织(无论是初创企业还是大型企业)的基础设施堆栈。《Effective数据科学基础设施》可帮助你建立数据流程和项目工作流,为你开发项目带来强大动力。《
从什么是数据,数据与优化的关系入手,以经典的传统数据分析方法和最新的深度学习算法为例,系统介绍了数据分析的算法设计思想及实现方法。内容涉及了数据的可视化、特征选择与降维、神经网络基本原理、无监督学习、有监督学习、深度学习的鲁棒性等,全书提供了丰富的实例以及完整的可实现的Pyth从什么是数据,数据与优化的关系入手,以经典