登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年04月出版新書

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

『簡體書』Python数据采集与分析(微课视频版)

書城自編碼: 3931786
分類: 簡體書→大陸圖書→教材研究生/本科/专科教材
作者: 王瑞胡、杨文艺、谢壹、王春宝
國際書號(ISBN): 9787302637875
出版社: 清华大学出版社
出版日期: 2024-01-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 223

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
妈妈,我想为自己而活
《 妈妈,我想为自己而活 》

售價:NT$ 325.0
再造大唐:郭子仪评传
《 再造大唐:郭子仪评传 》

售價:NT$ 437.0
人性的博弈:为什么做个好人这么难
《 人性的博弈:为什么做个好人这么难 》

售價:NT$ 381.0
不完美的自我:接纳与放手,让自己活得更有韧性
《 不完美的自我:接纳与放手,让自己活得更有韧性 》

售價:NT$ 330.0
苏菲的世界(漫画版):寻找自我的旅程
《 苏菲的世界(漫画版):寻找自我的旅程 》

售價:NT$ 442.0
让改变发生:学校改进视角下的办学思考与实践叙事
《 让改变发生:学校改进视角下的办学思考与实践叙事 》

售價:NT$ 258.0
麦肯锡原则:成就全球顶级公司的11条经验    (美) 达夫·麦克唐纳
《 麦肯锡原则:成就全球顶级公司的11条经验 (美) 达夫·麦克唐纳 》

售價:NT$ 498.0
今日宜偏爱(全二册)
《 今日宜偏爱(全二册) 》

售價:NT$ 447.0

編輯推薦:
本教材以Python为编程工具,以数据采集、数据分析、数据决策为主线,以任务驱动的教学方式,穿插“知识点”“小贴士”等相关知识介绍,以学情分析为出发点,形成知识-任务-解决方案链条,增强学习的趣味性和体验感,通过任务驱动学习的能动性,有效训练学习者解决问题的复合能力。
內容簡介:
本书以Python数据采集与数据分析作为中心,不求面面俱到,但求精练并强调实用性,注重提高学生应用Python解决实际问题能力的培养与训练。全书内容共分三篇13章,第一篇先介绍Python开发环境,然后从Python数据类型、程序控制流程、函数、字符编码与文件读写、面向对象的编程思想等方面介绍了Python编程的基础内容; 第二篇主要从网络爬虫、Scrapy爬虫框架等方面介绍如何应用Python进行网页数据的采集; 第三篇则是对采集到的数据进行分析,介绍Python中常用到的两种数据结构——Series和DataFrame,以及基于这两种数据对象的基本操作,还介绍如何绘制常用的基本图形,如折线图、饼图、箱线图等,包括统计学中的相关分析与关联分析,最后介绍文本挖掘与分析相关内容。 本书在内容组织与编写上尽量做到逻辑严密、结构合理,可供计算机、大数据、人工智能等相关专业的学生使用,也可供经管类等其他专业的学生用于商业数据分析。
目錄
第一篇Python开发环境部署和编程基础
第1章Python开发环境部署
1.1Anaconda3的安装与部署
1.2Anaconda3的使用
1.3Jupyter Notebook的使用
第2章Python编程基础
2.1Python编程语言概述
2.2第一个Python程序
2.3Python中模块的应用
第3章数据类型
3.1数字
3.2字符串
3.3列表
3.4字典
3.4.1列表和字典的区别与联系
3.4.2字典的几种操作
3.5元组
第4章程序控制流程
4.1for循环语句
4.2while循环语句
4.3break语句
4.4continue语句
4.5pass语句
4.6选择分支结构的实现
4.7随机数的应用
第5章函数的使用
5.1函数的创建与调用
5.2变量作用域
5.3模块与包
5.3.1模块导入
5.3.2模块的查找方式
5.3.3包
5.4模块应用举例
5.4.1time模块的使用
5.4.2收发电子邮件相关模块的使用
第6章字符编码与文件读写
6.1常见的编码类别
6.2文件读写
6.2.1文件打开
6.2.2文件读
6.2.3文件写
6.2.4文件关闭
6.3csv文件的读写操作
6.3.1写csv文件
6.3.2读csv文件
6.4Excel文件的读写操作
6.4.1向Excel文件中写入数据
6.4.2读取Excel文件中的数据
第7章Python面向对象编程
7.1面向对象思想简介
7.2类的创建
7.2.1初始化方法的定义
7.2.2类的继承
7.2.3类的定制
第二篇Python数据采集
第8章网络爬虫原理
8.1爬虫的工作步骤
8.2爬虫伦理
8.2.1Robots协议
8.2.2robots.txt的使用方法
8.3使用BeautifulSoup解析和提取网页中的数据
8.3.1find()与find_all()的应用
8.3.2select()的应用
8.3.3静态网页与动态网页
8.3.4带参数的URL请求
8.3.5JSON数据的解析
8.4反反爬虫技术
8.5携程网站酒店评论信息的抓取
8.6携程网站某景区评论信息抓取
8.7天气信息的抓取
8.8selenium的应用
8.8.1selenium的配置
8.8.2工作原理和步骤
8.8.3selenium提取数据的方法
8.8.4selenium操作元素的常用方法
第9章Scrapy爬虫框架
9.1安装Scrapy爬虫框架并创建爬虫项目
9.1.1安装Scrapy爬虫框架
9.1.2创建并启动Scrapy爬虫项目
9.1.3Scrapy爬虫项目的组成
9.2使用Scrapy提取网页数据
9.2.1Response对象的属性和方法
9.2.2xpath选择器
9.2.3Selector对象
9.2.4css选择器
9.3多层级网页抓取
9.3.1相同结构页面抓取
9.3.2不同结构网页数据的抓取
9.3.3request与对应的response间的数据传递
第三篇Python数据分析

第10章pandas库
10.1pandas库的数据结构
10.1.1Series数据结构
10.1.2Series的创建方法
10.1.3Series的索引和切片
10.1.4Series的几种操作
10.1.5DataFrame数据结构
10.1.6DataFrame数据排序
10.1.7Series 对象和 DataFrame 对象的联系
10.2分组聚合操作
10.2.1groupby()方法的应用
10.2.2单层分组聚合
10.2.3多层分组聚合操作
10.2.4聚合操作agg()方法的应用
第11章matplotlib数据可视化
11.1图形绘制的一般步骤
11.2折线图的绘制
11.2.1单条折线图的绘制
11.2.2多条折线图的绘制
11.3饼图的绘制
11.3.1使用Series绘图
11.3.2使用matplotlib绘图
11.4散点图的绘制
11.5箱线图的绘制
第12章相关分析与关联分析
12.1概述
12.2相关分析
12.2.1相关分析的描述与测度
12.2.2相关系数
12.2.3偏相关分析
12.2.4距离相关分析
12.3Apriori关联分析
12.3.1支持度、置信度与提升度
12.3.2Apriori算法
12.3.3Apriori算法应用举例
12.3.4Apriori算法的Python实现
第13章文本挖掘与分析
13.1文本挖掘概述
13.1.1文本挖掘的定义
13.1.2文本挖掘的过程
13.1.3Python中的文本挖掘包
13.2Python文本特征提取与特征选择
13.2.1中文分词
13.2.2词频统计
13.2.3词云分析
13.2.4文本特征提取
13.3文本分类实例: 垃圾邮件识别
13.3.1文本分类概述
13.3.2文本分类的Python实现
参考文献
內容試閱

在《“十四五”规划纲要》全文中,“数字”关键词出现了 75 处,“第五篇 加快数字化发展 建设数字中国”单独点题,强调要迎接数字时代,激活数据要素潜能,加快建设数字经济、数字社会等,以数字化转型整体驱动生产方式、生活方式和治理方式变革。因此,专业办学应主动对接产业数字化、数字产业化发展需求,瞄准未来前沿新格局,基于未来社会及行业发展需求原点,瞄准新业态,融入新技术,重视多学科交叉前沿理念,突出大数据智能化等在专业建设中的作用,推动传统专业建设与人才培养的转型与升级。
本书的出发点是对传统的教材进行结构优化及内容重组,并结合传统人文社科类专业数字化改造需求,聚焦数据分析中的Python数据采集与分析,让相关专业学生通过系统学习,具备一定的数字素养与解决实际问题的复合能力。
本书主要介绍了Python编程中常用到的数据类型及程序编写中的控制流程与设计逻辑,函数的创建与调用,常见编码类别及文件的读写与打开、关闭操作。在此基础上,以数据采集与分析为主线,介绍了网络爬虫原理与实现技术、Scrapy爬虫框架,以及numpy、pandas、matplotlib数据整理与分析工具包的应用,最后结合文本挖掘与分析,介绍了文本特征提取、文本分类及文本分析的原理与应用。
本书由王瑞胡和杨文艺任主编,谢壹、王春宝任副主编。第1~8章由王瑞胡编写,第9章和第13章由杨文艺编写,第10章和第11章由王瑞胡、谢壹共同编写,第12章由王瑞胡、王春宝共同编写,全书由王瑞胡完成统稿。
本书的出版得到重庆市2020年高等教育教学改革研究重点项目(项目编号: 202075)、重庆文理学院“合格 ”多元人才培养试点项目(未来数字文旅创新人才培养实验班)等资助。在本书的编写过程中,参阅了Python数据采集与分析相关书籍、网上的一些资料和一些在线学习平台的课程,在此向这些文献资料的作者及团队表示感谢。
最后,特别感谢清华大学出版社的大力支持,使得本书得以顺利出版。
由于编者水平有限,书中难免有疏漏之处,敬请读者批评指正。


编者2023年6月







源码下载

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.