登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

『簡體書』Python数据分析技术手册:基础·实战·强化

書城自編碼: 3729257
分類: 簡體書→大陸圖書→計算機/網絡程序設計
作者: 明日科技 编著
國際書號(ISBN): 9787122405166
出版社: 化学工业出版社
出版日期: 2022-03-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 742

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
引导的秘诀:通过团队合作获得结果的SMART指南(最新修订版)(白金版)
《 引导的秘诀:通过团队合作获得结果的SMART指南(最新修订版)(白金版) 》

售價:NT$ 554.0
文史星历:秦汉史丛稿
《 文史星历:秦汉史丛稿 》

售價:NT$ 661.0
神灵衰落:祈雨与乾隆朝的信仰危机
《 神灵衰落:祈雨与乾隆朝的信仰危机 》

售價:NT$ 498.0
深度营销:成就营销领导力的12大原则(麦肯锡年度经管好书,12大原则揭秘营销本质,带好团队就是从领导力到影响力!)
《 深度营销:成就营销领导力的12大原则(麦肯锡年度经管好书,12大原则揭秘营销本质,带好团队就是从领导力到影响力!) 》

售價:NT$ 325.0
新质生产力:发展新动能
《 新质生产力:发展新动能 》

售價:NT$ 493.0
状态比能力更重要:108个状态调整法
《 状态比能力更重要:108个状态调整法 》

售價:NT$ 308.0
中国上市公司担保行为的影响因素及其效应研究
《 中国上市公司担保行为的影响因素及其效应研究 》

售價:NT$ 202.0
企业级数据架构:核心要素、架构模型、数据管理与平台搭建    李杨
《 企业级数据架构:核心要素、架构模型、数据管理与平台搭建 李杨 》

售價:NT$ 554.0

建議一齊購買:

+

NT$ 782
《 PHP 编程从入门到实践 》
+

NT$ 806
《 C#入门经典:更新至C# 9和.NET 5 》
+

NT$ 503
《 Visual Basic从入门到精通(第5版) 》
+

NT$ 1001
《 流畅的Python 》
+

NT$ 561
《 推荐系统算法实践 》
+

NT$ 642
《 机器学习实战【利用Python透析主流机器学习算法,配合日常用例,强劲实战导向,程序员人手必备!】 》
編輯推薦:
①分层学习,学以致用。本书将核心知识、案例和应用分成三个层级进行循序渐进的学习和实践,力争短时间快速掌握相关技能。 ②案例丰富,通过大量案例、实例讲解所学技能,举一反三,提高读者应用技能的能力。 ③本书配备了视频录像、资源库、社区技术支持、QQ在线等服务。
內容簡介:
《Python数据分析技术手册:基础·实战·强化》是“计算机科学与技术手册系列”图书之一,该系列图书内容全面,以理论联系实际,能学到并做到为宗旨,以技术为核心,以案例为辅助,引领读者全面学习基础技术、代码编写方法和具体应用项目,旨在为想要进入相应领域或者已经在该领域深耕多年的技术人员提供新而全的技术性内容及案例。
本书是一本侧重数据分析基础 实践的Python数据分析图书,为了保证读者可以学以致用,在内容编排方面循序渐进地进行了3个层次的讲解:基础知识铺垫、案例进阶实战和综合项目强化应用。
本书提供大量的资源,包含235个实例、9个方向的应用案例和一个大型数据分析项目,力求为读者打造一本基础 应用 实践一体化精彩的Python数据分析图书。
本书不仅适合Python初学者、数据分析人员、从事与数据分析相关工作的人员、对数据分析感兴趣的人员学习,而且适合从事其他岗位想掌握一定的数据分析技能的职场人员学习。
目錄
基础篇
第1章 认识数据分析
1.1 数据分析概述 2
1.1.1 数据分析的概念 2
1.1.2 数据分析的重要性 2
1.2 数据分析的基本流程 4
1.2.1 熟悉工具 4
1.2.2 明确目的 4
1.2.3 获取数据 4
1.2.4 数据处理 4
1.2.5 数据分析 5
1.2.6 验证结果 5
1.2.7 结果呈现 5
1.2.8 数据应用 5
1.3 数据分析常用工具 6
1.3.1 Excel 6
1.3.2 Python 6
第2章 搭建Python数据分析环境
2.1 Python概述 7
2.1.1 Python简介 7
2.1.2 Python的版本 8
2.2 搭建Python开发环境 8
2.2.1 什么是IDLE 8
2.2.2 安装Python 8
2.2.3 使用IDLE编写“hello world” 11
2.3 集成开发环境PyCharm 12
2.3.1 下载PyCharm 12
2.3.2 安装PyCharm 14
2.3.3 运行PyCharm创建工程 15
2.3.4 个Python程序“Hello World!” 17
2.4 数据分析标准环境Anaconda 18
2.4.1 下载Anaconda 19
2.4.2 安装Anaconda 20
2.5 Jupyter Notebook开发工具 22
2.5.1 认识Jupyter Notebook 22
2.5.2 新建一个Jupyter Notebook文件 22
2.5.3 在Jupyter Notebook中编写“Hello World” 23
第3章 NumPy基础:数组、矩阵计算
3.1 初识NumPy 25
3.1.1 NumPy概述 25
3.1.2 安装NumPy模块 26
3.1.3 数组相关概念 27
3.2 创建数组 28
3.2.1 创建简单的数组 28
【实例3.1】演示如何创建数组 28
【实例3.2】为数组指定数据类型 29
【实例3.3】复制数组 29
【实例3.4】修改数组的维数 30
3.2.2 以不同的方式创建数组 30
【实例3.5】创建指定维数和数据类型未初始化的数组 30
【实例3.6】创建指定维数(以0填充)的数组 30
【实例3.7】创建指定维数并以1填充的数组 31
【实例3.8】创建指定维数和数据类型并以指定值填充的数组 31
3.2.3 从数值范围创建数组 31
【实例3.9】通过数值范围创建数组 32
【实例3.10】创建马拉松赛前训练等差数列数组 33
【实例3.11】通过logspace()函数解决棋盘放置小麦的问题 33
3.2.4 生成随机数组 34
【实例3.12】随机生成0到1之间的数组 34
【实例3.13】随机生成满足正态分布的数组 35
【实例3.14】生成一定范围内的随机数组 35
【实例3.15】生成正态分布的随机数组 36
3.2.5 从已有的数组中创建数组 36
【实例3.16】使用asarray()函数创建数组 37
【实例3.17】将字符串“mingrisoft”转换为数组 37
【实例3.18】通过可迭代对象创建数组 38
【实例3.19】创建未初始化的数组 38
【实例3.20】创建以0填充的数组 39
【实例3.21】创建以1填充的数组 39
【实例3.22】创建以指定值“0.2”填充的数组 40
3.3 数组的基本操作 40
3.3.1 数据类型 40
3.3.2 数组运算 41
【实例3.23】数组加法运算 42
【实例3.24】数组的减法、乘法和除法运算 42
【实例3.25】数组的幂运算 43
【实例3.26】数组的比较运算 43
【实例3.27】数组的标量运算 44
3.3.3 数组的索引和切片 44
【实例3.28】获取一维数组中的元素 44
【实例3.29】获取二维数组中的元素 45
【实例3.30】实现简单的数组切片操作 45
【实例3.31】常用的切片式索引操作 46
【实例3.32】二维数组的简单索引操作 47
【实例3.33】二维数组的切片操作 47
3.3.4 数组重塑 48
【实例3.34】将一维数组重塑为二维数组 48
【实例3.35】将一行古诗转换为4行5列的二维数组 48
【实例3.36】将2行3列的数组重塑为3行2列的数组 49
【实例3.37】将二维数组中的行列转置 49
【实例3.38】转换客户销售数据 50
3.3.5 数组的增、删、改、查 51
【实例3.39】为数组增加数据 51
【实例3.40】删除指定的数组元素 51
【实例3.41】修改指定的数组元素 52
【实例3.42】按指定条件查询数组 52
3.4 NumPy矩阵的基本操作 53
3.4.1 创建矩阵 53
【实例3.43】创建简单矩阵 53
【实例3.44】使用mat()函数创建常见的矩阵 54
3.4.2 矩阵运算 56
【实例3.45】矩阵加法运算 56
【实例3.46】矩阵减法、乘法和除法运算 56
【实例3.47】修改矩阵并进行乘法运算 57
【实例3.48】数组相乘与数组点乘比较 57
【实例3.49】矩阵元素之间的相乘运算 58
3.4.3 矩阵转换 58
【实例3.50】使用T属性实现矩阵转置 58
【实例3.51】实现矩阵逆运算 58
3.5 NumPy常用统计分析函数 59
3.5.1 数学运算函数 59
【实例3.52】数组加、减、乘、除运算 60
【实例3.53】计算数组元素的倒数 60
【实例3.54】数组元素的幂运算 61
【实例3.55】对数组元素取余 61
【实例3.56】将数组中的一组数字四舍五入 62
【实例3.57】对数组元素向上取整 62
【实例3.58】对数组元素向下取整 62
【实例3.59】计算数组的正弦值、余弦值和正切值 63
【实例3.60】将弧度转换为角度 63
3.5.2 统计分析函数 64
【实例3.61】对数组元素求和、对数组元素按行和按列求和 64
【实例3.62】对数组元素求平均值、对数组元素按行和按列求平均值 65
【实例3.63】对数组元素求值和小值 65
【实例3.64】计算电商各活动销售的加权平均价 66
【实例3.65】计算电商活动价格的中位数 67
【实例3.66】求数组的方差和标准差 67
3.5.3 数组的排序 67
【实例3.67】对数组元素排序 68
【实例3.68】对数组元素升序排序 68
【实例3.69】通过排序解决成绩相同学生的录取问题 69
3.6 综合案例——NumPy用于图像灰度处理 69
3.7 实战练习 70
第4章 Pandas入门
4.1 初识Pandas 72
4.1.1 Pandas概述 72
4.1.2 安装Pandas 73
4.2 Pandas家族成员 74
4.2.1 Series对象 75
【实例4.1】创建一列数据 75
【实例4.2】创建一列“物理”成绩 76
4.2.2 DataFrame对象 76
【实例4.3】通过列表创建成绩表 77
【实例4.4】通过字典创建成绩表 78
4.3 索引 78
4.3.1 什么是索引 78
【实例4.5】设置索引 78
4.3.2 索引的作用 79
4.3.3 Series对象的索引 79
【实例4.6】手动设置索引 79
【实例4.7】重新设置物理成绩的索引 80
【实例4.8】向前和向后填充数据 81
【实例4.9】通过位置索引获取学生物理成绩 81
【实例4.10】通过标签索引获取学生物理成绩 81
【实例4.11】通过标签切片获取数据 82
【实例4.12】通过位置切片获取数据 82
4.3.4 DataFrame对象的索引 83
【实例4.13】设置“姓名”为索引 83
【实例4.14】重新为“学生成绩表”设置索引 84
【实例4.15】删除数据后索引重置 85
4.4 综合案例——构建身体数据并计算体质指数 85
4.5 实战练习 86
第5章 数据读取与处理
5.1 数据读取与写入 87
5.1.1 读取与写入Excel文件 87
【实例5.1】读取Excel文件 89
【实例5.2】读取指定Sheet页中的数据 90
【实例5.3】读取Excel文件并指定行索引 91
【实例5.4】读取Excel文件中的第1列数据 91
【实例5.5】将数据写入Excel文件中 92
5.1.2 读取与写入CSV文件 93
【实例5.6】读取CSV文件 94
5.1.3 读取文本文件 95
【实例5.7】读取文本文件 95
5.1.4 读取HTML网页 96
【实例5.8】Pandas也可以实现的简单爬虫 97
5.2 读取数据库中的数据 98
5.2.1 读取MySQL数据库中的数据 98
【实例5.9】读取MySQL数据库中的数据 100
5.2.2 读取MongoDB数据库中的数据 100
【实例5.10】读取MongoDB数据库中的数据 101
5.3 数据抽取 103
5.3.1 按行抽取数据 104
【实例5.11】抽取一行学生成绩数据 104
5.3.2 抽取多行数据 104
【实例5.12】抽取多行学生成绩数据 104
【实例5.13】抽取多个连续的学生成绩数据 105
5.3.3 抽取指定列数据 105
【实例5.14】抽取学生的“语文”和“数学”成绩 105
【实例5.15】抽取指定学科的成绩 106
5.3.4 抽取指定的行、列数据 106
【实例5.16】抽取指定学科和指定学生的成绩 107
5.4 数据的增、删、改、查 107
5.4.1 增加数据 108
【实例5.17】增加一列“物理”成绩 108
【实例5.18】使用loc属性增加一列“物理”成绩 108
【实例5.19】在列后面插入“物理”成绩 108
【实例5.20】在成绩表中增加一行数据 109
【实例5.21】在成绩表中增加多行数据 109
5.4.2 删除数据 109
【实例5.22】删除学生成绩数据 110
【实例5.23】删除符合条件的学生成绩数据 110
5.4.3 修改数据 110
【实例5.24】修改“数学”的列名 110
【实例5.25】修改多个学科的列名 111
【实例5.26】将行标题统一修改为数字编号 111
【实例5.27】修改学生成绩数据 111
5.4.4 查询数据 112
【实例5.28】通过逻辑运算符查询数据 112
【实例5.29】通过复合运算符查询数据 113
【实例5.30】使用query()方法简化查询代码 113
【实例5.31】使用isin()方法查询数据 113
【实例5.32】查询女生的学习成绩数据 114
【实例5.33】使用between()方法查询数据 115
5.5 数据排序与排名 115
5.5.1 数据排序 115
【实例5.34】按“销量”降序排序 116
【实例5.35】按照“图书名称”和“销量”降序排序 117
【实例5.36】对分组统计数据进行排序 117
【实例5.37】按行数据排序 118
5.5.2 数据排名 118
【实例5.38】对产品销量按顺序进行排名 119
【实例5.39】对产品销量进行平均排名 119
5.6 综合案例——电商产品转化率分析 120
5.7 实战练习 121
第6章 数据清洗
6.1 处理缺失值 122
6.1.1 什么是缺失值 122
6.1.2 查看缺失值 123
【实例6.1】查看数据概况 123
【实例6.2】判断数据是否存在缺失值 123
6.1.3 处理缺失值 124
【实例6.3】将NaN填充为0 125
6.2 处理重复值 125
【实例6.4】处理淘宝电商销售数据中的重复数据 125
6.3 异常值的检测与处理 126
6.4 字符串操作 126
6.4.1 字符串对象方法 127
【实例6.5】字符串大小写转换 127
【实例6.6】去掉字符串中的空格 128
6.4.2 字符串替换方法 129
【实例6.7】使用replace()方法替换数据中指定的字符 129
【实例6.8】使用replace()方法替换标题中指定的字符 129
6.4.3 数据切分方法 130
【实例6.9】使用split()方法切分地址 130
6.4.4 字符串判断方法 131
【实例6.10】使用contains()方法筛选数据并归类 131
6.5 数据转换 132
6.5.1 使用字典映射进行数据转换 132
【实例6.11】使用map()函数将数据中的性别转换为数字 132
6.5.2 数据分割 132
【实例6.12】分割成绩数据并标记为“优秀”“良好”“一般” 133
6.5.3 分类数据数字化 134
【实例6.13】将分类数据转换为数字 134
6.6 综合案例——缺失值比例分析 135
6.7 实战练习 135
第7章 数据计算与分组统计
7.1 数据计算 136
7.1.1 求和 136
【实例7.1】计算语文、数学和英语三科的总成绩 137
7.1.2 求均值 137
【实例7.2】计算语文、数学和英语各科成绩的平均分 137
7.1.3 求值 138
【实例7.3】计算语文、数学和英语各科成绩的分 138
7.1.4 求小值 138
【实例7.4】计算语文、数学和英语各科成绩的分 139
7.1.5 求中位数 139
【实例7.5】计算学生各科成绩的中位数1 140
【实例7.6】计算学生各科成绩的中位数2 140
7.1.6 求众数 140
【实例7.7】计算学生各科成绩的众数 141
7.1.7 求方差 141
【实例7.8】通过方差判断谁的物理成绩更稳定 142
7.1.8 标准差 142
【实例7.9】计算各科成绩的标准差 143
7.1.9 求分位数 143
【实例7.10】通过分位数确定被淘汰的35%的学生 143
【实例7.11】计算日期、时间和时间增量数据的分位数 144
7.2 数据格式化 144
7.2.1 设置小数位数 145
【实例7.12】四舍五入保留指定的小数位数 145
7.2.2 设置百分比 146
【实例7.13】将指定数据格式化为百分比数据 146
7.2.3 设置千位分隔符 146
【实例7.14】将金额格式化为带千位分隔符的数据 147
7.3 数据分组统计 147
7.3.1 分组统计函数groupby() 147
【实例7.15】根据“一级分类”列统计订单数据 148
【实例7.16】根据“一级分类”列和“二级分类”列统计订单数据 148
【实例7.17】统计各编程语言的7天点击量 148
7.3.2 对分组数据进行迭代 149
【实例7.18】迭代“一级分类”的订单数据 149
【实例7.19】迭代“一级分类”和“二级分类”的订单数据 150
7.3.3 对分组的某列或多列使用聚合函数 150
【实例7.20】对分组统计结果使用聚合函数 150
【实例7.21】针对不同的列使用不同的聚合函数 150
【实例7.22】通过自定义函数实现分组统计 151
7.3.4 通过字典和Series对象进行分组统计 151
【实例7.23】通过字典分组统计“北上广”销量 151
【实例7.24】通过Series对象分组统计“北上广”销量 152
7.4 数据移位 153
【实例7.25】统计学生英语周测成绩的升降情况 153
7.5 数据合并 154
7.5.1 merge()方法 154
【实例7.26】合并学生成绩表 155
【实例7.27】通过索引合并数据 155
【实例7.28】对合并数据去重 156
【实例7.29】根据共有列进行合并数据 156
【实例7.30】合并数据并相互补全 157
7.5.2 concat()方法 157
7.6 数据透视表 159
7.6.1 pivot()方法 159
【实例7.31】数据透视表按年份统计城市GDP 160
7.6.2 pivot_table()方法 160
【实例7.32】数据透视表统计各部门男、女生
人数 160
7.7 综合案例——商品月销量对比分析 161
7.8 实战练习 162
第8章 日期处理与时间序列
8.1 日期数据处理 163
8.1.1 DataFrame的日期数据转换 163
【实例8.1】将各种日期字符串转换为指定的日期格式 164
【实例8.2】将一组数据组合为日期数据 164
8.1.2 dt对象的使用 165
【实例8.3】获取日期中的年、月、日、星期数等 165
8.1.3 获取日期区间的数据 165
【实例8.4】获取指定日期区间的订单数据 166
8.1.4 按不同时期统计并显示数据 166
【实例8.5】从日期中获取不同的时期 168
8.2 日期范围、频率和移位 169
8.2.1 生成日期范围 169
【实例8.6】按频率生成时间段 169
【实例8.7】按复合频率生成时间段 171
8.2.2 日期频率转换 171
【实例8.8】将按天的频率转换为按5小时的频率 171
8.2.3 移位日期 172
【实例8.9】查看日期向前和向后分别移动两次后的数据 172
8.3 时间区间与频率转换 173
8.3.1 创建时间区间 173
【实例8.10】使用Period类创建不同的时间区间 173
【实例8.11】使用period_range()函数创建时间区间 174
8.3.2 频率转换 175
【实例8.12】时间区间频率转换 175
8.4 重采样与频率转换 175
8.4.1 重采样 175
【实例8.13】将1分钟的时间序列转换为3分钟的时间序列 176
8.4.2 降采样处理 177
【实例8.14】按周统计销售数据 177
8.4.3 升采样处理 178
【实例8.15】每6小时统计一次数据 178
8.5 移动窗口函数 178
8.5.1 时间序列数据汇总 178
【实例8.16】统计数据的open、high、low和close值 179
8.5.2 移动窗口数据计算 179
【实例8.17】创建淘宝每日销量数据 180
【实例8.18】在实例8.17的基础上,使用rolling()函数计算每3天的均值 180
【实例8.19】用当天的数据代表窗口数据 180
8.6 综合案例——股票行情数据分析 181
8.7 实战练习 182
第9章 可视化数据分析图表
9.1 数据分析图表的作用 183
9.2 如何选择适合的图表类型 184
9.3 数据分析图表的基本组成 184
9.4 Matplotlib概述 185
9.4.1 Matplotlib简介 185
9.4.2 安装Matplotlib 188
9.4.3 Matplotlib图表之初体验 189
【实例9.1】绘制张图表 189
【实例9.2】绘制散点图 189
9.5 图表的常用设置 190
9.5.1 基本绘图函数plot () 190
【实例9.3】绘制简单折线图 190
【实例9.4】绘制体温折线图 190
9.5.2 设置画布 192
【实例9.5】自定义画布 193
9.5.3 设置坐标轴 193
【实例9.6】为体温折线图设置标题 193
【实例9.7】为体温折线图设置刻度1 194
【实例9.8】为体温折线图设置刻度2 194
【实例9.9】为体温折线图设置坐标轴范围 195
9.5.4 添加文本标签 196
【实例9.10】为体温折线图添加基础体温文本标签 196
9.5.5 设置标题和图例 196
9.5.6 添加注释 198
【实例9.11】为图表添加注释 198
9.5.7 调整图表与画布边缘的间距 199
9.5.8 设置坐标轴 200
9.6 常用图表的绘制 200
9.6.1 绘制折线图 201
【实例9.12】绘制学生语文、数学、英语各科成绩分析图 201
9.6.2 绘制柱形图 201
【实例9.13】绘制简单的柱形图 202
【实例9.14】绘制2013—2019年线上图书销售额
分析图 202
【实例9.15】绘制各平台图书销售额分析图 203
9.6.3 绘制直方图 204
【实例9.16】绘制简单直方图 205
【实例9.17】利用直方图分析学生数学成绩分布情况 205
9.6.4 绘制饼形图 206
【实例9.18】绘制简单饼形图 206
【实例9.19】通过饼形图分析各省、市、自治区销量占比情况 207
【实例9.20】绘制分裂饼形图 207
【实例9.21】利用环形图分析各省、市、自治区销量占比情况 208
【实例9.22】利用内嵌环形图分析各省、市、自治区销量占比情况 209
9.6.5 绘制散点图 209
【实例9.23】绘制简单散点图 210
【实例9.24】利用散点图分析销售收入与广告费的相关性 210
9.6.6 绘制面积图 211
【实例9.25】绘制简单面积图 211
【实例9.26】利用面积图分析线上图书销售情况 212
【实例9.27】利用堆叠面积图分析各平台图书销售情况 212
9.6.7 绘制热力图 213
【实例9.28】绘制简单热力图 213
【实例9.29】利用热力图对比分析学生各科成绩 213
9.6.8 绘制箱形图 214
【实例9.30】绘制简单箱形图 215
【实例9.31】绘制多组数据的箱形图 215
【实例9.32】通过箱形图判断异常值 216
9.6.9 绘制3D图表 217
【实例9.33】绘制3D柱形图 217
【实例9.34】绘制3D曲面图 218
9.6.10 绘制多个子图表 218
【实例9.35】使用subplot()函数绘制多子图表的空图表 219
【实例9.36】绘制包含多个子图表的图表 219
【实例9.37】使用subplots()函数绘制包含多子图表的空图表 221
【实例9.38】使用subplots()函数绘制多子图表 221
【实例9.39】使用add_subplot()函数绘制多子图表 222
9.6.11 图表的保存 222
9.7 Seaborn图表 223
9.7.1 Seaborn图表概述 223
9.7.2 Seaborn图表之初体验 224
【实例9.40】绘制简单的柱形图 224
9.7.3 Seaborn图表的基本设置 225
9.7.4 常用图表的绘制 226
【实例9.41】使用relplot()函数绘制学生语文成绩折线图 226
【实例9.42】使用lineplot()函数绘制学生语文成绩折线图 226
【实例9.43】利用多折线图分析学生各科成绩 226
【实例9.44】绘制简单直方图 227
【实例9.45】利用条形图分析学生各科成绩 228
【实例9.46】利用散点图分析“小费” 228
【实例9.47】利用线性回归图表分析“小费” 230
【实例9.48】利用箱形图分析“小费”异常数据 231
【实例9.49】利用核密度图分析“鸢尾花” 232
【实例9.50】利用提琴图分析“小费” 232
9.8 综合案例——电商单品销量同比增长情况分析 233
9.9 实战练习 235
第10章 机器学习Scikit-Learn
10.1 Scikit-Learn简介 236
10.2 安装Scikit-Learn 236
10.3 线性模型 237
10.3.1 小二乘法回归 238
【实例10.1】智能预测房价 239
10.3.2 岭回归 239
【实例10.2】使用岭回归函数实现智能预测房价 240
10.4 支持向量机 240
【实例10.3】“波士顿房价”预测 241
10.5 聚类 242
10.5.1 什么是聚类 242
10.5.2 聚类算法 243
10.5.3 聚类模块 243
【实例10.4】对一组数据进行聚类 244
10.5.4 聚类数据生成器 245
【实例10.5】生成用于聚类的测试数据 245
10.6 综合案例——预测考试成绩 246
10.7 实战练习 247
实战篇
第11章 处理大型数据集
11.1 概述 249
11.2 案例效果预览 250
11.3 案例准备 251
11.4 业务流程 251
11.5 实现过程 251
11.5.1 数据准备 251
11.5.2 数据分块 251
11.5.3 查看与处理数据 252
11.5.4 保存分块数据 253
11.5.5 合并分块数据 253
11.6 关键技术 253
第12章 快速批量合并和处理Excel
12.1 概述 255
12.2 案例效果预览 255
12.3 案例准备 258
12.4 业务流程 258
12.5 实现过程 258
12.5.1 数据准备 258
12.5.2 将多个Excel合并为一个Excel 258
12.5.3 合并指定的Excel的指定列到一个Excel 259
12.5.4 合并指定的Excel到一个Excel的多个Sheet 260
12.5.5 批量合并文件夹中所有的Excel到一个Excel的多个Sheet 260
12.6 关键技术 261
第13章 爬取分析NBA球员薪资数据
13.1 概述 263
13.2 案例效果预览 263
13.3 案例准备 264
13.4 业务流程 264
13.5 实现过程 265
13.5.1 数据准备 265
13.5.2 确定网页格式 265
13.5.3 爬取数据 265
13.5.4 清洗数据 267
13.5.5 绘制水平柱形图分析湖人队薪资状况 268
13.6 关键技术 268
第14章 获取和分析股票行情数据
14.1 概述 270
14.2 案例效果预览 270
14.3 案例准备 272
14.4 业务流程 272
14.5 实现过程 272
14.5.1 安装第三方模块 272
14.5.2 获取股票历史数据 273
14.5.3 数据归一化处理 274
14.5.4 可视化股票走势图 275
14.5.5 股票收盘价格走势图 275
14.5.6 股票涨跌情况分析图 275
14.5.7 股票k线走势图 276
14.6 关键技术 277
第15章 基于文本数据的商家评论数据分析
15.1 概述 280
15.2 案例效果预览 280
15.3 案例准备 281
15.4 业务流程 281
15.5 实现过程 281
15.5.1 安装第三方模块 281
15.5.2 数据准备 282
15.5.3 数据清洗 282
15.5.4 总体评价状况分析 283
15.5.5 差评商品分析 284
15.5.6 利用词云图分析负面评价 284
15.6 关键技术 285
第16章 基于MySQL网站平台注册用户分析
16.1 概述 287
16.2 案例效果预览 287
16.3 案例准备 288
16.4 业务流程 288
16.5 导入MySQL数据 288
16.5.1 导入MySQL数据 288
16.5.2 连接MySQL数据库 289
16.6 实现过程 290
16.6.1 数据准备 290
16.6.2 数据检测 290
16.6.3 年度注册用户分析 291
16.6.4 新注册用户分析 292
第17章 二手房房价分析与预测
17.1 概述 293
17.2 案例效果预览 293
17.3 案例准备 294
17.4 业务流程 295
17.5 图表工具模块 295
17.5.1 绘制饼形图 295
17.5.2 绘制折线图 296
17.5.3 绘制条形图 296
17.6 实现过程 298
17.6.1 数据清洗 298
17.6.2 各区二手房均价分析 298
17.6.3 各区二手房数量及占比分析 299
17.6.4 全市二手房装修程度分析 300
17.6.5 热门户型均价分析 301
17.6.6 二手房房价预测 301
第18章 Python实现客户价值分析
18.1 概述 305
18.2 案例效果预览 305
18.3 案例准备 305
18.4 业务流程 306
18.5 分析方法 306
18.5.1 RFM模型 307
18.5.2 聚类 307
18.6 实现过程 307
18.6.1 数据准备 307
18.6.2 数据抽取 308
18.6.3 数据探索分析 308
18.6.4 计算RFM值 308
18.6.5 数据转换 309
18.6.6 客户聚类 310
18.6.7 标记客户类别 310
18.7 客户价值结果分析 312
第19章 电商销售数据分析与预测
19.1 概述 314
19.2 案例效果预览 314
19.3 案例准备 314
19.4 业务流程 315
19.5 分析方法 315
19.6 实现过程 316
19.6.1 数据处理 316
19.6.2 日期数据统计并显示 316
19.6.3 销售收入分析 317
19.6.4 销售收入与广告费相关性分析 317
19.6.5 销售收入预测 320
19.6.6 预测评分 321
强化篇
第20章 电视节目数据分析系统
20.1 系统需求分析 323
20.1.1 系统概述 323
20.1.2 功能性需求分析 323
20.2 系统设计 324
20.2.1 系统功能结构 324
20.2.2 系统业务流程 324
20.2.3 系统预览 324
20.3 系统开发 327
20.3.1 系统开发环境 327
20.3.2 界面设计环境安装与配置 327
20.4 主窗体设计 328
20.4.1 功能草图 328
20.4.2 创建主窗体 328
20.4.3 工具栏设计 329
20.4.4 其他控件设计 331
20.4.5 ui文件转为py文件 332
20.5 数据准备 333
20.6 功能代码设计 333
20.6.1 查看数据情况模块 333
20.6.2 数据处理模块设计 334
20.6.3 数据分析及可视化模块 334
20.6.4 显示主窗体模块 337
內容試閱
随着我国“十四五”规划的提出,国家在提升企业技术创新能力、激发人才创新活力等方面加大力度,也标志着我国信息时代正式踏上新的阶梯,电子设备已经普及,在人们的日常生活中随处可见。信息社会给人们带来了极大的便利,信息捕获、信息处理分析等在各个行业得到普遍应用,推动整个社会向前稳固发展。
计算机设备和信息数据的相互融合,对各个行业来说都是一次非常大的进步,已经渗入到工业、农业、商业、军事等领域,同时其相关应用产业也得到一定发展。就目前来看,各类编程语言的发展、人工智能相关算法的应用、大数据时代的数据处理和分析都是计算机科学领域各大高校、各个企业在不断攻关的难题,是挑战也是机遇。因此,我们策划编写了“计算机科学与技术手册系列”图书,旨在对想要进入相应领域的初学者或者已经在该领域深耕多年的从业者提供新而全的技术性内容,以及丰富、典型的实战案例。
大数据、人工智能时代,数据无处不在。无论身处哪种行业,能够掌握一定的数据分析技能必然是职场的加分项!
Python语言简单易学、数据处理精准高效,对于初学者来说容易上手,由于它的第三方扩展库不断更新,使得其应用范围越来越广。在科学计算、数据分析、数学建模和数据挖掘方面,Python也占据越来越重要的地位,因此本书采用Python作为数据分析工具。
本书全面介绍了数据分析知识,从初学者的角度出发,按照基础知识铺垫、案例进阶实战、综合项目强化3个层次逐渐展开内容,以帮助读者快速掌握数据分析的各项技能,拓宽职场的道路。本书通过各种实例将知识点与实际应用相结合,打造轻松学习、零压力学习的环境,通过案例对所学知识进行综合应用,通过开发实际项目将数据分析与各项技能应用到实际工作中。
本书内容
全书共分为20章,主要通过“基础篇(10章) 实战篇(9章) 强化篇(1章)”3大维度一体化的讲解方式,具体的学习结构如下图所示:
本书特色
1.突出重点、学以致用
书中每个知识点都结合了简单易懂的实例代码以及非常详细的注释信息,力求读者能够快速理解所学知识,提高学习效率,缩短学习路径。
2.提升思维、综合运用
本书以知识点综合运用的方式,带领读者制作各种实用性较强的办公自动化案例、数据分析案例,让读者不断提升数据处理、数据分析技能,从而加强对知识点的理解以及快速提升综合运用的能力。
3.综合技术、实际项目
本书在强化篇中提供了一个贴近实际应用的项目,力求通过实际应用使读者更容易地掌握数据分析技术与应对业务的需求。该项目是根据实际开发经验总结而来,包含了在实际开发中所遇到的各种问题。项目结构清晰、扩展性强,读者可根据个人需求进行扩展开发。
4.精彩栏目、贴心提示
本书根据实际学习的需要,设置了“注意”“说明”“技巧”等许多贴心的小栏目,辅助读者轻松理解所学知识,规避编程陷阱。
致读者
本书由明日科技的Python开发团队策划并组织编写,主要编写人员有高春艳、王国辉、李磊、李再天、王小科、赛奎春、申小琦、赵宁、张鑫、周佳星、葛忠月、李春林、宋万勇、田旭、王萍、张宝华、李颖、杨丽、刘媛媛、庞凤、谭畅、何平、李菁菁、依莹莹、吕学丽、吴晶鑫、程瑞红、钟成浩、徐丹、王欢、张悦、岳彩龙、牛秀丽等。在编写本书的过程中,我们本着科学、严谨的态度,力求精益求精,但疏漏之处在所难免,敬请广大读者批评斧正。
感谢您阅读本书,希望本书能成为您编程路上的领航者。
祝您读书快乐!
编著者

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.