新書推薦:

《
观乎动植:康乾时代的清宫博物绘画
》
售價:NT$
857

《
香港电影:反思与观照
》
售價:NT$
347

《
掌握提问驱动AI:速通大模型提示工程
》
售價:NT$
505

《
一切都会过去的(当代极具影响力的心灵作家索达吉全新重磅力作!)
》
售價:NT$
286

《
孤注一掷:大规模变革如何真正发生
》
售價:NT$
265

《
圣林:艾略特诗论集
》
售價:NT$
230

《
清嘉录 文白对照全译本 中华民俗文化之旅 中国岁时风俗大百科 民间生活美学之书
》
售價:NT$
296

《
中国古代玉器 中国国家博物馆展览系列丛书
》
售價:NT$
3468
|
| 編輯推薦: |
·核心亮点:B 站超受欢迎课程纸质化!全网播放超过500 万! ·学习优势:转为初学者设计的丝滑学习曲线,理论 + 案例 + 练习,轻松从听得懂到用得上 ·知识覆盖:无死角知识网络覆盖,基础语法、反爬应对、数据清洗、可视化、实战分析全流程 ·额外福利:附赠电子版完整案例!
|
| 內容簡介: |
|
这是一本让你学完立马就能上手的实用指南。本书从零开始带你玩转Python网络爬虫与数据分析,全书分为基础篇、进阶篇和实战篇三部分。基础篇手把手教你搭建Python 环境掌握核心语法、数据处理和文件操作,为数据分析打下坚实基础。进阶篇介绍实用技能,涵盖网络爬虫开发、数据解析、高效存储,以及数据分析利器NumPy和pandas,更有炫酷的数据可视化方法。实战篇通过两大真实项目,完整演示从数据采集、清洗存储到分析可视化的全流程。本书内容清晰实用,特别适合想快速掌握Python爬虫技术与数据分析的读者,让你学完就能用!
|
| 關於作者: |
|
李巍,中国计算机学会会员,哔哩哔哩科技UP主(IT私塾),B站课堂签约教师,华为开发者学堂认证讲师。
|
| 目錄:
|
基础篇 第1章 Python数据分析准备工作 ............1 1.1 搭建Python数据分析环境 .................1 1.1.1 下载Python ............................1 1.1.2 正确安装Python .....................3 1.1.3 配置环境变量 ..........................5 1.1.4 配置开发环境PyCharm ...........7 1.1.5 测试Python和开发环境是否能正常工作 .......................9 1.2 编写第一个Python程序 ..................12 第2章 Python基本语法 ..........................15 2.1 注释 ..................................................15 2.1.1 单行注释 ...............................15 2.1.2 多行注释 ...............................16 2.2 标识符和关键字 ................................16 2.2.1 每个数据或者信息都有名字——标识符 .....................17 2.2.2 关键字 ...................................17 2.3 变量及变量的数据类型 .....................18 2.3.1 变量到底是什么 .....................18 2.3.2 变量的数据类型 .....................19 2.4 输入和输出 .......................................22 2.4.1 处理来自键盘的输入 .............22 2.4.2 输出的几种情况 .....................23 2.5 运算符 ..............................................24 2.5.1 算术运算符 ............................24 2.5.2 比较运算符 ............................25 2.5.3 赋值运算符 ............................25 2.5.4 位运算符 ...............................26 2.5.5 逻辑运算符 ............................26 2.5.6 成员运算符 ............................28 2.5.7 身份运算符 ............................28 2.5.8 运算符优先级 ........................28 2.6 实战演练 ...........................................31 第3章 流程控制语句 .................................32 3.1 条件判断语句....................................32 3.1.1 单分支结构 ............................32 3.1.2 双分支结构 ............................33 3.1.3 多分支结构 ............................34 3.1.4 嵌套条件语句 ........................35 3.1.5 条件判断语句实例 .................36 3.2 循环控制语句....................................38 3.2.1 for循环 .................................38 3.2.2 while循环 .............................39 3.2.3 break和continue语句 .........41 3.2.4 循环控制语句实例 .................42 3.3 实战演练 ...........................................44 第4章 常用的容器数据类型 .....................47 4.1 字符串——文字也可以进行运算 .......47 4.1.1 定界符 ...................................47 4.1.2 转义字符 ...............................48 4.1.3 字符串的截取和连接 .............50 4.1.4 字符串的常见操作 .................52 4.1.5 字符串的格式化操作 .............53 4.1.6 字符串实例 ............................55 4.2 列表 ..................................................56 4.2.1 列表的创建与访问 .................57 4.2.2 列表的常见操作 .....................58 4.2.3 列表的嵌套 ............................62 4.2.4 列表实例 ...............................63 4.3 元组 ..................................................64 4.3.1 元组的创建与访问 .................64 4.3.2 元组的常见操作 .....................65 4.4 字典 ..................................................66 4.4.1 字典的创建与访问 .................66 4.4.2 字典的常见操作 .....................68 4.4.3 字典实例 ...............................72 4.5 集合 ..................................................72 4.5.1 创建集合 ...............................73 4.5.2 集合的常见操作 .....................73 4.6 实战演练 ...........................................74 第5章 函数 .................................................77 5.1 定义和调用函数 ................................77 5.1.1 定义函数 ...............................77 5.1.2 调用函数 ...............................78 5.1.3 函数参数 ...............................79 5.1.4 函数返回值 ............................81 5.1.5 实例 ......................................81 5.2 局部变量和全局变量 .........................82 5.2.1 局部变量 ...............................82 5.2.2 全局变量 ...............................83 5.2.3 全局变量和局部变量重名怎么办 ...................................84 5.2.4 匿名函数 ...............................85 5.2.5 实例 ......................................85 5.3 实战演练 ...........................................86 第6章 文件操作和异常处理 .....................89 6.1 文件操作 ...........................................89 6.1.1 文件的打开与关闭 .................89 6.1.2 文件读写操作 ........................91 6.1.3 访问模式 ...............................94 6.1.4 上下文管理器 ........................96 6.1.5 文件操作实例 ........................96 6.2 错误与异常 .......................................97 6.2.1 几种常见错误与异常 .............97 6.2.2 找出并处理异常 ..................100 6.3 实战演练 .........................................104 第7章 模块和库 .......................................105 7.1 模块和库的介绍 ..............................105 7.2 库的安装和导入 ..............................105 7.2.1 安装库 .................................106 7.2.2 导入库 .................................106 7.3 常用标准库 .....................................107 7.3.1 随机模块 —— random ........108 7.3.2 日期时间模块——datetime ...109 7.3.3 操作系统模块——os ...........110 7.3.4 json模块 .............................112 进阶篇 第8章 网络与前端技术基础 ...................115 8.1 网络基本概念..................................115 8.2 网页的构成 .....................................116 8.2.1 网页结构与内容 ...................117 8.2.2 HTML网页常用标签 ............118 8.2.3 网页样式 .............................120 8.2.4 网页交互 .............................128 8.3 实战演练 .........................................132 第9章 网络数据爬取技术 .......................134 9.1 网络爬虫概述..................................134 9.1.1 网络爬虫的基本概念 ...........134 9.1.2 合法合规使用网络爬虫技术 ....................................135 9.1.3 数据爬取流程 ......................135 9.2 Requests库 ...................................135 9.2.1 发送HTTP请求 ...................136 9.2.2 获取HTTP响应的内容 ........137 9.2.3 爬取图片文件 ......................139 9.3 Selenium库 ..................................139 9.3.1 安装浏览器驱动 ...................139 9.3.2 查找单个元素 ......................142 9.3.3 获取元素属性信息 ...............143 9.3.4 等待 ....................................144 9.3.5 网页的前进和后退 ...............145 9.4 实战演练 .........................................145 第10章 网站数据解析 .............................147 10.1 lxml库 .........................................147 10.2 Beautiful Soup库 ........................150 10.2.1 BeautifulSoup对象的属性 ................................151 10.2.2 beautifulsoup4库标签对象的属性 ......................152 10.2.3 find()方法和find_all()方法 ................................153 10.2.4 select()方法 ....................154 10.3 re库 ............................................154 10.3.1 re库常用方法 ..................156 10.3.2 re库基本操作示例 ...........156 10.4 实战演练 .......................................158 第11章 存储数据 .....................................165 11.1 把数据保存到Excel ......................165 11.1.1 基础的xlwt库 .................165 11.1.2 强大的xlwings库 ............166 11.1.3 跨平台的openpyxl库 ......170 11.2 把数据保存到MySQL ...................173 11.3 实战演练 .......................................179 第12章 科学计算库NumPy .................181 12.1 NumPy库的基本使用方法 ...........181 12.1.1 创建数组的基本流程 ........181 12.1.2 NumPy数组的运算..........182 12.1.3 NumPy数组的属性..........183 12.2 创建数组 .......................................184 12.2.1 根据现有数据创建数组 ....184 12.2.2 根据形状或数值创建数组 ................................185 12.3 获取数组元素 ................................186 12.3.1 通过索引获取元素 ...........186 12.3.2 通过切片获取元素 ...........187 12.4 数组的操作 ...................................188 12.4.1 修改数组形状 ...................188 12.4.2 数组扁平化 ......................189 12.4.3 数组转置 ..........................190 12.4.4 数组去重 ..........................191 12.4.5 数组合并 ..........................191 12.4.6 数组分割 ..........................192 12.4.7 数组复制 ..........................193 12.4.8 数组元素的修改 ...............193 12.5 数组的运算 ...................................196 12.5.1 广播机制 ..........................196 12.5.2 基本运算 ..........................197 12.6 常用API .......................................199 12.6.1 数组统计 ...........................199 12.6.2 文件读写 ...........................202 12.7 实战演练 .......................................202 第13章 数据处理库pandas .................208 13.1 pandas入门 .................................208 13.1.1 pandas数据结构及相关方法 ................................208 13.1.2 pandas访问数据 .............213 13.2 数据处理常用操作 ........................217 13.2.1 缺失值处理 ......................217 13.2.2 运算 .................................218 13.2.3 合并与分组 ......................222 13.2.4 堆叠和透视 ......................224 13.2.5 时间序列和分类数据 ........226 13.3 数据的读入与写出 ........................228 13.4 实战演练 .......................................230 第14章 静态图表可视化 .........................235 14.1 Matplotlib实现静态图表 ..............235 14.2 基础绘图功能 ...............................237 14.2.1 Matplotlib图像结构 ........237 14.2.2 添加辅助元素 ...................238 14.2.3 绘制多条折线 ...................241 14.2.4 绘制子图 ..........................242 14.3 常见图形绘制 ...............................246 14.3.1 折线图 .............................246 14.3.2 散点图 .............................247 14.3.3 柱形图 .............................248 14.3.4 三维图形 ..........................250 14.4 实战演练 .......................................252 第15章 动态图表可视化 .........................254 15.1 Pyecharts.....................................254 15.1.1 Pyecharts的安装和基本使用 ................................254 15.1.2 Pyecharts绘制其他基本图形 ................................257 15.1.3 组合图表 ..........................260 15.1.4 设置主题 ..........................261 15.1.5 轮播图 .............................265 15.2 实战演练 .......................................266 第16章 Flask框架实现数据可视化系统 .............................................269 16.1 完成第一个网站 ............................269 16.2 路由与网页 ...................................270 16.3 页面动态加载后台数据 .................273 16.3.1 Flask在页面上显示表格 ................................273 16.3.2 数据来自Excel文件 .........274 16.3.3 数据来自数据库 ...............276 16.4 Flask接收参数,分页显示数据 ....276 实战篇 第17章 豆瓣电影Top250信息爬取实战..............................289 17.1 项目概述.................................289 17.2 准备工作.................................290 17.2.1 分析页面....................292 17.2.2 新建项目....................293 17.2.3 引入模块....................295 17.3 数据爬取.................................296 17.4 数据解析.................................296 17.5 数据存储.................................297 17.5.1 保存到Excel文件......298 17.5.2 保存到SQLite数据库.......................299 17.6 数据分析与展现......................301 17.7 实战小结.................................302 第18章 招聘网站信息爬取实战.......303 18.1 项目概述.................................303 18.2 准备工作.................................30418.2.1 分析页面....................306 18.2.2 新建项目....................307 18.2.3 引入模块....................308 18.2.4 定义全局变量.............308 18.3 获取数据.................................309 18.3.1 首页输入搜索关键词.......................309 18.3.2 爬取列表页信息.........312 18.3.3 爬取详情页信息.........313 18.4 解析内容.................................314 18.4.1 解析列表页数据.........314 18.4.2 解析详情页数据.........316 18.5 保存数据.................................318 18.6 项目小结.................................320
|
|