登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

2023年02月出版新書

『簡體書』Python与大数据分析应用

書城自編碼: 3638134
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 朱荣
國際書號(ISBN): 9787302571346
出版社: 清华大学出版社
出版日期: 2021-05-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 325

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
聊不完的艺术家:跨界设计师穆夏
《 聊不完的艺术家:跨界设计师穆夏 》

售價:NT$ 549.0
失去的过去与未来的犯罪
《 失去的过去与未来的犯罪 》

售價:NT$ 279.0
质子交换膜燃料电池系统及其控制   戴海峰,余卓平,袁浩 著
《 质子交换膜燃料电池系统及其控制 戴海峰,余卓平,袁浩 著 》

售價:NT$ 1114.0
绘画的基础 彩色铅笔技法入门教程
《 绘画的基础 彩色铅笔技法入门教程 》

售價:NT$ 279.0
听闻远方有你2
《 听闻远方有你2 》

售價:NT$ 240.0
牛津分配正义手册
《 牛津分配正义手册 》

售價:NT$ 2016.0
全域增长:从战略制定到战术执行
《 全域增长:从战略制定到战术执行 》

售價:NT$ 661.0
澎湖湾的荷兰船:十七世纪荷兰人怎么来到台湾
《 澎湖湾的荷兰船:十七世纪荷兰人怎么来到台湾 》

售價:NT$ 370.0

建議一齊購買:

+

NT$ 379
《 “十三五”普通高等教育规划教材:FlashCS6动画制作实例教程 》
+

NT$ 324
《 3ds Max 2015中文版基础案例教程 》
+

NT$ 1188
《 经济学原理(第8版)(套装微观经济学分册+宏观经济学分册 曼昆) 》
+

NT$ 363
《 新世纪高等学校教材 学前教育专业系列教材:学前儿童发展心理学 》
+

NT$ 551
《 医学寄生虫学 》
編輯推薦:
Python语言语法简单、实践性强,提供了大量用于处理大数据的库,使得处理任何类型的数据都非常方便,是大数据处理应用的语言。本书介绍了一些大数据分析常用的算法,并给出一些应用实例。本书不是仅侧重于理论讲解,主要侧重于编程操作的Python实现,强化了Python教材的实践性。可以使学习者快速的入手使用python去进行大数据分析.
內容簡介:
本书使用Python编程语言分析大数据,全书以案例为主线,通过大量实例演示了Python在大数据分析应用中的强大功能。本书共分为9章,内容包括Python编程环境的搭建,变量、常量与数据类型,常用的内置函数,列表、元组及字典的用法,顺序结构、选择结构及循环结构三种控制流的用法,函数定义及使用,模块导入及常用模块的用法,数据获取、数据预处理及导入外部数据的方法,matplotlib数据可视化方法,常用的聚类、分类及回归算法的Python实现,决策树及随机森林算法的Python实现。 本书可作为高等院校计算机科学与技术、大数据专业或者相关专业的教材,也可作为读者自学Python数据处理的参考书。本书封面贴有清华大学出版社防伪标签,无标签者不得销售。
關於作者:
朱荣,女,45岁,博士,副教授,硕士研究生导师。主编出版教材一部,参编出版教材五部。已在国内外核心学术期刊及国际学术会议上发表论文30余篇,SCI或EI收录近20篇,申请并已授权国家发明专利1项。
目錄
第1章初识Python1
1.1Python是什么1
1.2图解Windows操作系统下安装Python的步骤1
1.2.1下载Python安装程序1
1.2.2安装Python环境1
1.3个Python程序6
1.4安装Anaconda8
1.5Anaconda初体验11
1.5.1Anaconda Prompt12
1.5.2集成开发环境Spyder的使用13
1.5.3管理虚拟环境15
习题16
第2章Python基础17
2.1变量、常量、数据类型与运算符17
2.1.1变量与常量17
2.1.2数据类型19
2.1.3运算符23
2.2Python常用的内置函数27
2.2.1数学函数27
2.2.2类型转换函数28
2.2.3字符串函数28
2.3列表29
2.3.1创建列表29
2.3.2添加列表元素30
2.3.3删减列表元素31
2.3.4列表切片32
2.3.5列表之间的运算34
2.3.6列表常用的操作函数35
2.3.7二维列表36
2.4元组38
2.4.1创建元组38
2.4.2删除元组38
2.4.3访问元组39
2.4.4元组常用的操作函数41
2.5字典41
2.5.1创建字典42
2.5.2访问字典里的值42
2.5.3删除字典与删除字典元素43
2.5.4修改字典44
2.6控制流45
2.6.1输出语句45
2.6.2顺序结构48
2.6.3分支结构48
2.6.4循环结构52
习题58
第3章函数与模块64
3.1函数64
3.1.1自定义函数64
3.1.2实参与形参67
3.1.3变量的作用域68
3.1.4lambda表达式69
3.1.5案例精选70
3.2模块72
3.2.1导入模块的方法72
3.2.2常用的几个内置模块74
3.2.3创建自己的模块77
3.3数值计算模块numpy78
3.3.1创建ndarray数组78
3.3.2数组的基本索引和切片81
3.3.3数组的转置82
3.3.4常用的统计方法83
3.3.5数组的去重及集合运算84
3.3.6生成随机数85
3.3.7改变数组形态87
3.3.8数组的组合和分割88
3.3.9创建矩阵90
3.3.10矩阵乘法92
3.3.11矩阵的转置和逆93
3.3.12方阵的迹93
3.3.13计算矩阵的秩94
3.3.14计算矩阵的特征值和特征向量94
3.4类的定义与使用95
习题97
第4章数据处理基础101
4.1获取数据101
4.1.1爬虫简介101
4.1.2数据抓取实践107
4.2pandas模块111
4.2.1Series类型111
4.2.2DataFrame类型112
4.3导入外部数据114
4.3.1导入.csv 文件 114
4.3.2导入.xls 文件116
4.3.3导入.txt 文件116
4.3.4利用head 预览前几行118
4.4数据预处理119
4.4.1查看缺失值119
4.4.2删除缺失值120
4.4.3填充缺失值120
4.4.4重复值处理121
4.4.5合并数据122
4.4.6数据统计125
4.4.7保存数据到本地126
4.5sklearn提供的自带的数据集127
习题130
第5章Python绘图及数据可视化133
5.1matplotlib库基础 133
5.1.1创建画布133
5.1.2绘制图形函数136
5.1.3保存图形137
5.2plt.plot()绘图137
5.3划分子图143
5.4条形图149
5.4.1简单条形图150
5.4.2多组条形图151
5.4.3叠加条形图152
5.4.4给条形图添加图例153
5.4.5在条形图柱上显示数值154
5.5散点图155
5.6饼图161
5.7直方图164
5.8箱线图165
5.8.1简单箱线图166
5.8.2并列绘制多个箱线图167
5.8.3对数据框中每列绘制箱线图168
5.9小提琴图169
5.10热力图170
5.11词云图177
5.12利用可视化结果分析大数据应用实例180
习题185
第6章Python的聚类分析方法188
6.1机器学习库sklearn简介188
6.2KMeans聚类算法189
6.2.1sklearn.cluster中的KMeans用法189
6.2.2使用make_blobs()方法生成测试数据192
6.2.3使用CalinskiHarabasz指数评价聚类结果193
6.3层次聚类195
6.3.1利用sklearn中的AgglomerativeClustering类实现层次聚类195
6.3.2利用scipy中的hierarchy绘制层次聚类树198
6.4基于密度的聚类方法202
6.5谱聚类算法204
6.6Birch聚类算法206
6.7调参208
6.8使用sklearn构建聚类模型综合实例211
6.8.1划分数据集212
6.8.2数据预处理214
6.8.3数据降维216
6.8.4对预处理后的数据进行聚类分析219
习题221
第7章Python的分类算法222
7.1K近邻分类器222
7.2支持向量机分类器229
7.2.1SVC229
7.2.2非线性SVM——NuSVC231
7.2.3线性SVM——LinearSVC233
7.3朴素贝叶斯分类器238
7.3.1GaussianNB238
7.3.2MultinomialNB240
7.3.3BernoulliNB241
7.4分类模型评估244
7.5分类器应用实例——文本分类的实现250
习题252
第8章Python的回归算法253
8.1小二乘线性回归253
8.2Lasso模型260
8.3岭回归265
8.4逻辑回归267
8.5回归模型评估270
习题273
第9章Python决策树274
9.1分类决策树276
9.2导出决策树数据并绘制决策树图形278
9.3回归决策树282
9.4随机森林的实现285
9.4.1RandomForestClassifier286
9.4.2特征的重要性评估289
9.4.3RandomForestRegressor291
9.5交叉验证294
9.5.1cross_val_score()评估模型295
9.5.2sklearn.model_selection.KFold302
9.6综合实例303
9.6.1UCI数据库简介303
9.6.2综合实例——糖尿病预测306
习题309
参考文献310
內容試閱
Python语言是目前流行的编程语言之一,在各领域应用中已经受到越来越多的重视。Python语言已经成为各高等院校的计算机专业、大数据专业等相关专业的必修课程,有的高等院校已经把Python语言作为非计算机专业学生的公共必修课,甚至有些中学已经开设了Python程序设计课程。
在众多的高级编程语言中,Python语言是非常适合作为数据分析的编程语言之一。Python语言语法简洁、功能强大,具有非常丰富的扩展库,并且易学易用。目前,市面上已经出版了许多Python语言类的教程。但是编者在多年的教学中感觉一些Python基础教程还存在一些问题,特别是学生通过基础教程的学习,了解了Python的基本语法,掌握了一些编程技巧,但是仍然不能有效地利用Python解决一些实际问题。所以,编者以提高学生的实际应用能力为出发点编写了本书。本书以培养学生的逻辑思维能力、实践编程能力及解决实际问题能力为目标,精心设计了教学内容,通过大量的应用实例,让学生真正地理解Python在解决实际问题时的魅力,从而可以真正学会如何应用Python解决实际问题。
本书主要供高等院校计算机专业、大数据专业及信息技术相关专业的学生使用。建议读者在学习本书的过程中一定要对每一个实例都亲自实践练习,在能把本书的实例调试运行成功的基础上,再尝试换不同的数据集或换不同的算法进行改进实践。读者在实践过程中遇到问题时要多思考,可以上网搜索产生问题的原因,及时解决发现的问题,在不断发现问题并解决问题的过程中总结经验、积累经验,从而有效地实现知识与技能及综合实践能力的提升。
本书内容共分为9章。
第1章主要介绍Python环境的搭建,重点介绍Anaconda环境的搭建及集成开发环境Spyder的使用方法。
第2章主要介绍Python中的主要基础语法知识,包括变量、常量与数据类型,Python中常用的内置函数用法,列表、元组及字典的用法,顺序结构、分支结构及循环结构三种控制流的语法格式及应用实例。第3章主要介绍Python中自定义函数、函数的实参与形参及变量的作用域等用法,lambda表达式的用法,Python中导入模块的方法,几种常见模块的使用方法,使用numpy模块创建ndarray数组,数组的切片、转置、去重、集合运算及常用的统计方法,创建矩阵、矩阵乘法运算、矩阵的转置和逆运算、方阵的迹运算、矩阵的秩、矩阵的特征值及特征向量的计算方法,类的定义及使用方法。
第4章主要介绍利用爬虫技术获取网络数据的方法,利用pandas模块的series和DataFrame数据类型的使用方法,导入外部.csv、.xlsx及.txt文件的使用方法,查看数据集的缺失值、删除数据集中的缺失值、填充数据集中的缺失值、重复值处理、合并数据及数据统计等数据预处理方法,将处理好的数据保存到本地磁盘的使用方法,还简单介绍sklearn库提供的一些自带数据集。
第5章主要介绍在matplolib中如何创建画布、绘制图形及保存图形,划分子图的方法,绘制折线图、条形图、饼图、散点图、直方图、箱线图、小提琴图、热力图及词云图的方法,后通过一个应用实例演示如何利用数据可视化结果分析大数据。
第6章主要介绍K均值聚类、层次聚类、基于密度的聚类、谱聚类及Birch聚类算法的Python实现方法,利用这些聚类方法创建模型时的调参方法,后用一个综合实例演示了聚类模型在大数据分析中的应用步骤。
第7章主要介绍KNN分类器、非线性支持向量机、线性支持向量机及三种朴素贝叶斯的分类算法在Python中的实现方法,分类模型的评估方法,以文本分类的实现演示了分类模型在实际数据分析中的应用方法。
第8章主要介绍小二乘线性回归、Lasso回归、岭回归及逻辑回归算法在Python中的实现方法,回归模型的评估方法,并利用波士顿房价数据集对比各种回归算法的预测效果。
第9章主要介绍分类决策树、导出决策树、绘制决策树、回归决策树及几种随机森林算法的Python实现方法,交叉验证的评估方法的实现,UCI数据库简介,后用一个综合实例对比各种算法在糖尿病数据集上的预测效果,并用图形可视化的方法显示算法的对比结果。
本书提供了全套的配套教学课件(PPT文件)、各章实例的源代码(.py源文件)及每章的课后习题参考答案,配套资源可以登录清华大学出版社官方网站进行下载。
感谢山东省教育服务新旧动能转换专业对接产业项目(曲阜师范大学精品旅游)对本书的资助。同时,感谢山东省社会科学规划研究项目·重点项目(21BTQJ02)对本书的支持。
本书由朱荣主编,尚军亮、赵景秀副主编,吴俊华、王永及代凌云参与编写。
在本书编写过程中,编者参考了大量文献,在此对文献作者一并表示感谢。Python语言的应用发展非常迅速,虽然编者在编写本书时尽了的努力,但难免会有不足和遗漏之处,真诚地希望各位专家及读者朋友们多提宝贵意见,编者将不胜感激。
编者

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.