新書推薦:

《
秦律简牍志
》
售價:NT$
796

《
西法兰克王国(843-987)领地大公国研究
》
售價:NT$
449

《
Misch现代口腔种植学 原书第4版 国际经典口腔学译著 一本贯通口腔种植基础与临床的国际专著
》
售價:NT$
3050

《
古典云雾的钟声--戏剧之美的嬗变
》
售價:NT$
296

《
导读拉康《著作集》.第四卷
》
售價:NT$
500

《
我们一无所有
》
售價:NT$
347

《
精品咖啡学·实务篇(新版)
》
售價:NT$
408

《
经济学通识课 中央党校原副校长王东京近30年教学笔记
》
售價:NT$
449
|
| 內容簡介: |
本书针对“从数据到信息”和“从数据到知识”两个目标,深入浅出地讲解数据分析与数据挖掘的相关理论方法,学会“如何发现事实背后的真相”,进而学会“用数据说话”,分别以数据分析和数据挖掘两个技术为主线,将统计学、数据库、机器学习等理论技术进行有机融合,循序渐进地讲解相关核心概念、基本方法和应用技术。
本书适合作为信息大类专业本科生教材,以及计算机技术和软件工程相关学科的研究生教材,也可作为数据资源开发利用相关研发人员的自学参考书。
|
| 目錄:
|
目 录
第1章 概述
1.1 引言
1.2 数据分析与数据挖掘定义
1.3 数据分析与数据挖掘相关核心概念
1.4 数据分析与数据挖掘的主要功能及任务
1.5 数据分析与数据挖掘的基本过程
1.6 数据分析与数据挖掘的技术可行性
1.7 总结
1.8 习题
第2章 数据预处理与特征工程
2.1 数据预处理概述
2.2 数据清理
2.3 数据集成
2.4 数据归约
2.5 数据变换
2.6 特征工程
2.7 总结
2.8 习题
第3章 数据探索分析
3.1 数据探索分析简介
3.2 数据集基本结构
3.3 从几何、代数视角认识数据
3.4 从概率视角认识数据
3.5 描述性统计
3.6 总结
3.7 习题
第4章 数据的差异性比较
4.1 数据差异显著性检验
4.2 均值差异性比较
4.3 多组样本的均值差异性比较
4.4 分布特征的差异性比较
4.5 总结
4.6 习题
第5章 数据的相关性比较
5.1 相关分析与回归分析的概念
5.2 相关分析
5.3 回归分析
5.4 总结
5.5 习题
第6章 数据降维
6.1 降维方法简介
6.2 主成分分析
6.3 因子分析
6.4 对应分析
6.5 局部线性嵌入
6.6 总结
6.7 习题
第7章 关联规则挖掘
7.1 关联规则及其度量指标
7.2 关联规则挖掘的步骤
7.3 关联规则挖掘算法
7.4 由关联挖掘到相关分析
7.5 总结
7.6 习题
第8章 预测分析
8.1 预测模型简介
8.2 决策树分类
8.3 贝叶斯分类
8.4 支持向量机分类
8.5 神经网络分类
8.6 总结
8.7习题
第9章 聚类分析
9.1 聚类的概念
9.2 数据的相似性度量
9.3 基于划分的聚类方法
9.4 基于层次的聚类方法
9.5 基于密度的聚类方法
9.6 聚类评估
9.7总结
9.8习题
参考文献
|
| 內容試閱:
|
前 言
随着信息技术和人类生产生活交汇融合,互联网快速普及,全球数据呈现爆发增长、海量集聚的特点,对经济发展、社会治理、国家管理、人民生活都产生了重大影响。世界各国都把推进经济数字化作为实现创新发展的重要动能,在军事领域,部分欧美国家军队已经将数据资源的开发利用能力作为综合军力的重要组成部分,通过深度分析和挖掘军事数据信息资源,缩减指挥决策周期,夺取决策优势及行动优势,提升体系对抗能力,已成为世界军事强国关注的新焦点,也是大国之间军力博弈的全新空间。
本书针对“从数据到信息”和“从数据到知识”两个目标,深入浅出地讲解数据分析与数据挖掘的相关理论方法,具有3个方面的特色。一是紧贴工作实际需求,从身边常见量化决策问题入手引入相关知识点,注重理论与实践相结合,通过描述性统计分析学会“如何一眼看透数据”,通过差异性分析、相关性分析和多元统计分析学会“如何发现事实背后的真相”,进而学会“用数据说话”,通过关联规则挖掘学会“如何发现同时、先后或扎堆发生的事”,通过分类和预测学会“分辨这是什么,预测将发生什么事”,等等,进而学会“用数据创新”。二是着眼夯实相关理论基础,注重相关概念辨析和原理分析,以及知识体系之间的逻辑性,从科学研究的定量方法引入数据分析与数据挖掘的概念,在此基础上,分别以数据分析与数据挖掘两个技术为主线,将统计学、数据库、机器学习等理论技术进行有机融合,循序渐进地讲解相关核心概念、基本方法和应用技术。三是强调领域应用特色,同时最大限度体现计算机相关学科特点。本书大部分的案例分析均能结合实际工作场景中面临的“规模数量是否合适”“结构比例是否合理”“质量水平对比”“影响因素分析”“真实程度估计”“事物间有哪些隐藏关系”“未来会发生什么事”“如何对事物自动分组”“存在哪些异常现象”等决策问题,阐述数据分析与数据挖掘相关理论技术和实现途径。
本书总共分为9章。第1章为概述,从数据分析与数据挖掘的3个核心要素入手,引入数据分析与数据挖掘的内涵、相关核心概念、主要功能、基本过程和技术可行性等内容。第2章为数据预处理相关内容,主要介绍数据清理、数据集成、数据归约和数据变换等内容。第3~6章为数据分析相关内容,其中第3章为数据探索性分析,介绍了数据统计描述指标和统计图形等内容;第4章为数据差异性比较分析,介绍了数据差异显著性检验的基本原理,以及T检验、方差分析和非参数检验等内容;第5章为数据相关性比较分析,重点介绍了相关分析与回归分析:第6章为线性降维,主要介绍了主成分分析、因子分析和对应分析等内容。第7~9章为数据挖掘相关内容,其中第7章为关联规则挖掘,主要介绍关联规则挖掘的基本原理和算法,以及关联规则的评价方法;第8章为分类与预测,主要介绍决策树归纳、贝叶斯分类、神经网络分类等分类预测方法;第9章为聚类分析,主要介绍聚类分析的基本概念、数据表示及相似性度量,以及主要的聚类分析方法。本书相关的数据集及代码文件统一提供在二维码中,可扫描获取。
本书第1、3、4、5章由郝文宁教授编写,第6章由余晓晗教授和谢晓宇讲师共同编写,第7章由程恺副教授和邵天浩讲师共同编写,第8章由程恺副教授编写,第2、9章由邹世辰讲师编写。全书由郝文宁教授统稿。由于时间仓促,作者水平有限,书中难免存在不足之处,欢迎读者批评指正。
本书适合作为大数据相关专业本科生教材,以及计算机科学与技术和软件工程相关专业的研究生教材,也可作为数据资源开发利用相关研发人员的自学参考书。
编 者
2025年8月
|
|