《深度学习处理结构化数据实战》 - 463.0新台幣 - [加]马克·瑞安[Mark Ryan]史跃东译 - HongKong Book Store

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台( 0 )　\|　在線留言板　 \|　付款方式　 \|　聯絡我們　 \|　運費計算　 \|　幫助中心　\|　加入書簽
		會員登入新註冊 \|　新用戶登記

HOME

新書上架

暢銷書架

好書推介

2023年度TOP

香港／國際用戶

最新/最熱/最齊全的簡體書網

品種：超過100萬種書，正品正价，放心網購，悭钱省心

送貨：速遞 / EMS，時效：出貨後2-3日

『簡體書』深度学习处理结构化数据实战

書城自編碼： 3714112
分類：簡體書→大陸圖書→計算機/網絡→人工智能
作者： [加]马克·瑞安[Mark Ryan]史跃东译
國際書號(ISBN)： 9787302591290
出版社：清华大学出版社
出版日期： 2022-01-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：NT$ 463

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《 1368：历史岔道口的抉择与国运盛衰》
售價：NT$ 325.0

《全球城市发展报告2023：基于全球城市网络的合作与竞争》
售價：NT$ 1277.0

《为什么只见树木不见森林：从简单现象到复杂系统》
售價：NT$ 442.0

《大英帝国的兴衰：跨越海洋征服世界》
售價：NT$ 549.0

《意大利文艺复兴新艺术史》
售價：NT$ 4474.0

《 2023年《咬文嚼字》合订本（精）》
售價：NT$ 437.0

《世界银行营商环境成熟度方法论手册》
售價：NT$ 1501.0

《变革时代的公司契约：法律能否与时俱进？》
售價：NT$ 437.0

建議一齊購買：

NT$ 753
《 AI智能语音技术与产业创新实践》

NT$ 458
《绿色制造理论方法及应用》

NT$ 458
《深度学习理论及实战（MATLAB版）》

NT$ 440
《虚拟人》

NT$ 853
《视觉SLAM十四讲：从理论到实践（第2版）》

NT$ 684
《图深度学习》

編輯推薦：

与其他深度学习技术关注的领域不同，本书侧重于将深度学习技术应用于结构化数据。从数据集的清理，到模型的训练，再到模型的性能指标分析，以及终的模型部署，本书是按照深度学习项目的具体流程来编排章节的，因此各个章节相互衔接，前后呼应，构成了一个完整的体系。同时，在涉及相关的理论知识和新的工具或者技术时，作者都会进行简要的介绍，从而让读者对整个深度学习技术栈建立起全面的认知。至于代码部分，则更是尽量详尽，务求让读者完全理解并充分掌握。

內容簡介：

告诉你一个不太光彩的秘密:在大多数数据科学项目中，有一半的时间都花在清理和准备数据上了。但还有更好的方法:针对表格数据和关系数据库进行优化的深度学习技术，无需密集的特性工程，就能提供洞察和分析。学习使用少量的数据过滤、验证和清洗，就能解锁深度学习性能的技能。
《深度学习处理结构化数据实战》传授面向表格数据和关系数据库的强大数据分析技术。本书从多伦多公交系统的数据集出发，带你领略用深度学习处理表格化数据的简易性和便捷性，并教你解决在生产环境中部署模型和监控模型性能等关键问题。
主要内容
●何时何地使用深度学习技术
●Keras深度学习模型的架构
●训练、部署以及维护模型
●量化评估性能

關於作者：

Mark Ryan 是加拿大多伦多Intact Insurance(加拿大的房产、汽车和商业保险公司，隶属于加拿大Intact Financial Corporation)的数据科学经理。Mark 热衷于宣扬机器学习的好处，常组织机器学习训练营，使参与者能够亲身体验机器学习的世界。他潜心于深度学习，努力解锁深度学习在结构化表格数据处理上的潜力，此外，他还对聊天机器人和自动驾驶汽车的潜力深感兴趣。Mark 拥有加拿大滑铁卢大学的数学学士学位和多伦多大学的计算机科学硕士学位。

第1 章为何要使用结构化数据进行深度学习 1
1.1 深度学习概述 ·2
1.2 深度学习的优缺点 7
1.3 深度学习软件栈概述 10
1.4 结构化数据与非结构化数据 12
1.5 反对使用结构化数据进行深度学习的相关意见 15
1.6 为何要研究基于结构化数据的深度学习问题？ 16
1.7 本书附带的代码概述 18
1.8 你应该知道的内容 19
1.9 本章小结 20
第2 章示例问题和Pandas数据帧简介 23
2.1 深度学习开发环境选项 24
2.2 探索Pandas 的代码 27
2.3 Python 中的Pandas数据帧 28
2.4 将CSV 文件提取到Pandas 数据帧中 31
2.5 使用Pandas 来完成SQL 操作 32
2.6 主示例：预测有轨电车的延误情况 35
2.7 为何真实世界的数据集对于掌握深度学习至关重要 38
2.8 输入数据集的格式和范围 39
2.9 目的地：端到端的解决方案 41
2.10 有关解决方案代码的更多细节 44
2.11 开发环境：普通环境与深度学习专用环境 47
2.12 深入研究反对深度学习的意见 48
2.13 深度学习是如何变得更易于使用的 52
2.14 训练深度学习模型初试 53
2.15 本章小结 56
第3 章准备数据1：探索及清理数据 57
3.1 探索及清理数据的代码 58
3.2 在Python 中使用配置文件 58
3.3 将XLS 文件提取到Pandas 数据帧中 61
3.4 使用pickle 将Pandas数据帧从一个会话保存到另一个会话中 67
3.5 探索数据 69
3.6 将数据分为连续型、分类型以及文本型 74
3.7 清理数据集中存在的问题：数据丢失、错误以及猜测 76
3.8 确定深度学习需要多少数据 82
3.9 本章小结 83
第4 章准备数据2：转换数据 ·85
4.1 准备及转换数据的代码 86
4.2 处理不正确的数值：路线 86
4.3 为何只能用单个替代值来换掉所有错误的值？ 89
4.4 处理不正确的值：车辆 90
4.5 处理不一致的值：位置 92
4.6 去向远方：位置 94
4.7 处理类型不匹配问题 98
4.8 处理依然包含错误数据的行 99
4.9 创建派生列 ·100
4.10 准备非数值型数据来训练深度学习模型 101
4.11 端到端解决方案概述 105
4.12 本章小结 108
第5 章准备并构建模型 111
5.1 数据泄露和数据特征是训练模型的公平博弈 112
5.2 使用领域专业知识和小得分测试来防止数据泄露 113
5.3 防止有轨电车延误预测中的数据泄露问题 114
5.4 探索Keras 和建立模型的代码 ·117
5.5 推导用于训练模型的数据帧 118
5.6 将数据帧转换为Keras 模型期望的格式 122
5.7 Keras 和TensorFlow
简史 123
5.8 从TensorFlow 1.x 迁移到TensorFlow 2 125
5.9 TensorFlow 与PyTorch 126
5.10 Keras 中的深度学习模型架构 127
5.11 数据结构是如何定义Keras 模型的 132
5.12 嵌入的力量 135
5.13 基于数据结构自动构建Keras 模型的代码 138
5.14 探索模型 141
5.15 模型参数 148
5.16 本章小结 149
第6 章模型训练与实验 151
6.1 训练深度学习模型的代码 152
6.2 审核训练深度学习模型的过程 ·152
6.3 回顾有轨电车延误预测模型的总体目标 156
6.4 选择训练、验证以及测试数据集 ·159
6.5 初始训练 160
6.6 评估模型的性能 163
6.7 Keras 回调：从训练中获得收益 167
6.8 从多次训练中获得相同的结果 ·175
6.9 评估捷径 176
6.10 显式保存已训练的模型 178
6.11 运行一系列训练实验 179
6.12 本章小结 186
第7 章对已训练的模型进行更多实验 187
7.1 使用模型进行更多实验的代码 ·188
7.2 验证删除不良值是否可改善模型 ·188
7.3 验证嵌入列是否可提升模型的性能 190
7.4 深度学习模型与XGBoost ·191
7.5 改进深度学习模型可能的后继步骤 198
7.6 本章小结 199
第8 章模型部署 201
8.1 模型部署概述 202
8.2 既然部署工作很重要，那为何又如此艰难？ 204
8.3 回顾一次性评分 204
8.4 Web 部署的用户体验 206
8.5 通过Web 部署来部署模型的步骤 207
8.6 Web 部署的幕后知识 211
8.7 使用Facebook Messenger 部署的用户体验 214
8.8 使用FacebookMessenger 部署的幕后知识 217
8.9 关于Rasa 的更多
背景知识 218
8.10 使用Rasa 在Facebook Messenger 中部署模型的步骤 221
8.11 pipeline 简介 225
8.12 在模型训练阶段定义pipeline 229
8.13 在评分阶段应用pipeline ·232
8.14 部署后维护模型 234
8.15 本章小结 237
第9 章建议的后继步骤 239
9.1 回顾本书目前已述内容 240
9.2 有轨电车延误预测项目的后继工作 241
9.3 将详细的位置信息添加到有轨电车延迟预测项目中 242
9.4 使用天气数据来训练深度学习模型 246
9.5 在有轨电车延误预测项目中增加季节或者一天中的时间
数据 252
9.6 归因：删除包含不良值的记录的替代方法 253
9.7 发布有轨电车延误预测模型的Web部署 254
9.8 使有轨电车延误预测模型适用于新的数据集 256
9.9 准备数据集并训练模型 259
9.10 通过Web 部署来部署模型 261
9.11 使用FacebookMessenger 部署模型 263
9.12 使本书中的方法适用于不同的数据集 ·266
9.13 其他的学习资源 272
9.14 本章小结 274
附录使用Google 协作实验室(GoogleColaboratory) ·275
A.1 Colab 简介 ·275
A.2 使Google 云硬盘适用于Colab会话 277
A.3 在Colab 中使用repo并运行notebook 279
A.4 Colab 和Paperspace的优劣 282

內容試閱：

前言
我深信，当人们回顾过去的50 年并对21 世纪的前20 年进行评价时，深度学习将成为这段时间内排名的技术创新。深度学习的理论基础在20 世纪50 年代就已经建立，但是直到2012 年，非专业人士才意识到深度学习技术的潜力。然后在多年后的今天，深度学习已经渗透到我们的日常生活中了：从能将我们的语音无缝转换为文本的智能扬声器，到可在不断扩展的游戏中击败任何人的AI系统等。本书探讨深度学习领域中一个容易被人忽视的一角：将深度学习技术应用到结构化的表格数据(即按照行和列组织的数据)上。
如果传统的经验告诉你避免对结构化的数据使用深度学习，即大部分的深度学习应用(如图像识别)都是处理非结构化数据的，那么为何还要阅读一本关于用深度学习处理结构化数据的书呢？首先，如第1 章和第2 章所述，一些反对使用深度学习技术解决结构化数据问题的意见(如深度学习过于复杂，或者结构化数据集太小)，在今天其实根本就不成立。在评估哪种机器学习算法适用于结构化数据问题时，我们需要保持开放的态度，并将深度学习视作一种潜在的解决方案。其次，尽管非表格形式的数据支撑着深度学习的许多局部性的应用领域(如图像识别、语音到文本的转换以及机器翻译等)，但作为消费者、员工和公民的我们，在很大程度上依然依赖表中数据来定义我们的生活。每笔银行交易流水、纳税记录、保险索赔，以及我们日常生活中的诸多其他方面都是通过结构化的表格数据进行信息传递的。因此，无论你是深度学习的新手，还是经验丰富的相关从业者，当你试图解决与结构化数据相关的问题时，都应该将深度学习放入你的工具箱里。
通过阅读本书，你将学习到将深度学习运用于各种结构化数据问题时所需要了解的相关知识。你将了解将深度学习应用到真实数据集上的完整过程：从准备数据到训练深度学习模型，再到部署经过训练的模型。本书附带的代码示例使用机器学习的通用语言Python 编写，并利用Keras/TensorFlow 框架(行业中常用的深度学习平台)。

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	香港用户　 \|　台灣用户　\|　海外用户

megBook.com.tw
Copyright (C) 2013 - 2024 （香港）大書城有限公司　All Rights Reserved.