本书以广泛使用的Alluxio2.8.0版本为基础编写,深入介绍Alluxio相关技术原理与实践案例。本书主要内容包括Alluxio系统入门与使用、Alluxio系统内核组件设计实现原理,同时详细介绍了Alluxio在大型企业中的经典应用案例与生产实践,并附有Alluxio的开源社区开发者指南。本书是工业界和学术界从事
本书为高等职业教育计算机类新形态——工作手册式教材,内容包括基础环境的搭建与配置,Hadoop完全分布式集群的搭建与运行,Hadoop核心组件的应用案例,Hive组件的安装、配置与应用,ZooKeeper的安装、配置与应用,HBase的安装、配置与应用,Sqoop组件的安装、配置与应用,Flume组件的安装、配置与应用
本书是数据标注领域领先的实训讲义。本书着重对常见的文本、语音和图像标注任务类型进行介绍,帮助从事标注工作的学习者快速地完成系统化学习,进行标注实战。本书对文本、语音及图像标注的多种任务类型逐一进行讲解和分析,每种标注类型均配有对应的规范、举例分析、习题及解析。同时,本书还针对各类标注配套多种子任务类型或多个领域的实操练
本书是一本专门面向数据标注人才培养的实训教材,适用于有意从事人工智能训练师和数据标注工作的人员。为了使学习更具有针对性,本书特别选择了能代表行业普遍需求的标注项目管理知识及典型文本、语音和图像标注任务进行讲解与训练,辅助学习者快速完成系统化学习,进行标注实战工作。本书对文本的事件标注和关系标注、语音的采集和质检、图像的
随着“十四五”规划纲要中提出“协同发展云服务与边缘计算服务”的观点,边云智能已成为未来发展的重要趋势。本书依托于政策大背景,旨在向读者介绍边云智能的基础知识和应用。书中分为四个篇章,第一篇章介绍了边云架构的骨架和基础概念,第二篇章介绍了人工智能算法和深度学习模型,第三篇章介绍了云端决策算法和边缘端轻量化算法,第四篇章介
本书系统讲述ApacheSpark/PySpark大数据计算平台的原理,以及如果将ApachePySpark应用于大数据的实时流处理、批处理等各个场景。通过原理深入学习和实践示例、案例的学习应用,使读者了解并掌握ApacheSpark/PySpark的基本原理和技能,接近理论与实践的距离。全书共分为8章,主要内容包括:
本书是一本全面介绍数据挖掘基本原理、核心算法以及典型应用方法的专业书籍。第4版在前三版的基础上,对数据挖掘的方法论和知识点进行了重新归纳,按照基础篇、提高篇和应用篇进行设计。从方法论上说,数据挖掘是一个方法和原理逐步演变的过程。首先,最基础的数据挖掘方法主要有“关联规则”“分类”“聚类”,它们是数据挖掘的灵魂和基础,因
数据作为数字经济的血液、知识经济的基石,是企业的战略性资源。将数据转化为可被企业直接使用的有价值的资产,即“数据资产化”,已经成为企业数字化转型的重要目标。本书阐明了数据资产化的意义,围绕数据资产的确认、登记、质量评估、价值评估、入表,数据高效流通及价格发现等方面,系统阐述了数据资产化的理论和实践问题。本书可以帮助读者
本书共9章,采用总分总结构,首先整体介绍什么是画像平台,然后分模块详细介绍画像平台的实现方案,最后从实践的角度介绍如何构建和使用画像平台。各章详细内容介绍如下。第1章的重点是了解画像平台。第2章描述画像平台的主要功能、技术架构和数据模型。第3-6章分别介绍了画像平台的四种主要功能(标签生产、标签服务、分群功能、画像分析
本书介绍了人工智能与语言知识的结合特点。通过理论概念讲解、具体实例分析,介绍语言知识的构建方法、类型案例、应用领域,辅助学习者快速了解行业基础和发展动态。本书首先介绍语言知识库的基本理论和构建方法,通过例子介绍资源类语言知识、语料库语言知识的概念和结构。为了方便理解,本书结合大量案例介绍语言知识在自然语言处理及在司法、