《Hadoop大数据技术基础（Python版）微课视频版》 - 342.0新台幣 - 刘彬斌 - HongKong Book Store

	登入帳戶　 \|　訂單查詢　 \|　購物車/收銀台( 0 )　\|　在線留言板　 \|　付款方式　 \|　聯絡我們　 \|　運費計算　 \|　幫助中心　\|　加入書簽
		會員登入新註冊 \|　新用戶登記

HOME

新書上架

暢銷書架

好書推介

2023年度TOP

香港／國際用戶

最新/最熱/最齊全的簡體書網

品種：超過100萬種書，正品正价，放心網購，悭钱省心

送貨：速遞 / EMS，時效：出貨後2-3日

『簡體書』Hadoop大数据技术基础（Python版）微课视频版

書城自編碼： 3763237
分類：簡體書→大陸圖書→教材→研究生/本科/专科教材
作者：刘彬斌
國際書號(ISBN)： 9787302601302
出版社：清华大学出版社
出版日期： 2022-06-01

頁數/字數： /
書度/開本： 16开釘裝：平装

售價：NT$ 342

我要買件

** 我創建的書架 **
未登入.

新書推薦：

《耳穴治疗青少年近视与保健》
售價：NT$ 274.0

《《中国版画史》》
售價：NT$ 493.0

《最后一章》
售價：NT$ 381.0

《 20世纪中国工艺美术史（上下卷）》
售價：NT$ 2789.0

《为何只有我们：语言与演化（语言学及应用语言学名著译丛）》
售價：NT$ 325.0

《巴西史（区域国别史丛书）》
售價：NT$ 549.0

《科学实验与编程（Python版）》
售價：NT$ 330.0

《直升机突击：美国陆军航空兵：1962—1973 》
售價：NT$ 783.0

建議一齊購買：

NT$ 270
《职业生涯规划与就业创业指导（第2版）（21世纪通识教育系列教材）》

NT$ 598
《神经病学（第8版/本科临床/配增值）》

NT$ 474
《宏观经济学（第十版）（经济科学译丛；“十三五”国家重点出版物出版规划项目）》

NT$ 278
《当代中国政府与政治（新编21世纪公共管理系列教材）》

NT$ 186
《辩论技巧教程（融媒体出版物）》

NT$ 302
《园艺产品贮藏加工学（贮藏篇）（第3版）》

編輯推薦：

1. 《Hadoop大数据技术基础（Python版）微课视频版》从初学者角度出发，通过丰富的实操示例和实战项目解析，详细讲解大数据开发环境、关键技术及其应用。
2. 本书基于Python环境编写，帮助读者在较短时间内同时掌握Python基本语法与大数据入门技术，对大数据技术入门者具有较高价值。
3. 本书设计了丰富的实训内容，提供300分钟微课视频、PPT课件、教学大纲、实例源码、习题答案等资源，适合作为大专院校数据科学与大数据技术、大数据管理与应用及相关专业的教材，也适合作为大数据技术初学者自学用书。

內容簡介：

《Hadoop大数据技术基础（Python版）微课视频版》从初学者角度出发，通过丰富的示例和实战项目，详细讲解大数据开发环境、关键技术及其应用。全书共分10章，第1~9章的内容分别为大数据概述、Linux系统的安装与使用、Python 3语言基础、Hadoop开发环境、HDFS技术、MapReduce技术、Hive数据仓库、HBase分布式数据库、Sqoop工具，第10章详细解析了实战项目“货运车分布分析平台”，帮助初学者快速入门。本书所有知识点都结合具体的编程示例，对于重要知识点提供视频讲解，还设计了多个实训，使读者通过实践环节加强对知识点的理解和掌握。本书适合作为高等院校计算机应用、大数据技术及相关专业的教材，也适合作为大数据技术相关培训的教材和大数据技术初学者的自学资料。

關於作者：

刘彬斌，成都邦飞科技有限公司副总经理，电子科技大学硕士，在读博士，成都市高新人才，四川省软件行业第五届理事会理事，成都市大数据产业联盟理事会理事，CSDN学院技术公开课优秀讲师。拥有10年以上软件研发经验。曾参与国家高技术研究发展计划（863计划）、242国家安全项目、自然科学基金等课题。2014年主持研发“自动构建部署系统”，荣获成都高新区第一批“高新人才计划”创业启动扶持项目。

第1章大数据概述
1.1大数据的产生与发展
1.2大数据的基础知识
1.3大数据架构
1.4本章小结
1.5课后习题
第2章Linux系统的安装与使用
2.1系统安装
2.1.1安装 CentOS 7.x
2.1.2安装步骤
2.2基本命令
2.2.1cd命令
2.2.2打包和解压命令
2.2.3其他常用命令
2.3权限与目录
2.3.1权限
2.3.2目录
2.4文件操作
2.4.1文件与目录管理
2.4.2用户和用户组管理
2.5网络配置
2.6本章小结
2.7课后习题
第3章Python 3语言基础
3.1Python 3简介
3.1.1Python 的发展历史
3.1.2Python的应用
3.2环境搭建
3.2.1Python 3环境的搭建
3.2.2PyCharm
3.3基础语法
3.3.1语法规范
3.3.2数据类型
3.3.3Number数据类型
3.3.4字符串
3.3.5列表
3.3.6元组
3.3.7字典
3.3.8集合
3.3.9函数
3.3.10模块
3.3.11类和对象
3.3.12封装
3.3.13构造函数
3.3.14继承
3.3.15异常
3.3.16操作MySQL
3.4本章小结
3.5课后习题
3.6实训

第4章Hadoop开发环境
4.1Hadoop生态圈工具
4.2环境搭建
4.2.1Linux虚拟机基础配置
4.2.2Xshell工具
4.2.3安装JDK
4.2.4安装Hadoop
4.2.5安装SSH
4.2.6复制虚拟机
4.2.7修改其他虚拟机
4.2.8设置免密
4.2.9启动Hadoop集群
4.3常见问题汇总
4.4本章小结
4.5课后习题
第5章HDFS技术
5.1HDFS架构
5.2HDFS命令
5.2.1version命令
5.2.2dfsadmin命令
5.2.3jar命令
5.2.4fs命令
5.3API的使用
5.3.1hdfs模块
5.3.2pyhdfs模块
5.4本章小结
5.5课后习题
5.6实训
第6章MapReduce技术
6.1MapReduce工作原理
6.1.1MapReduce作业流程
6.1.2早期MapReduce架构存在的问题
6.2YARN运行概述
6.2.1yarn模块介绍
6.2.2YARN的工作流程
6.3利用Python进行MapReduce编程
6.3.1Hadoop Streaming概述
6.3.2Hadoop Streaming原理
6.3.3Hadoop Streaming用法
6.3.4Python编写MapReduce环境搭建
6.3.5用Python编写MapReduce代码入门程序(词频统计)
6.3.6清洗数据
6.4mrjob模块
6.4.1mrjob模块概述
6.4.2安装mrjob模块
6.4.3mrjob模块的第一个例子(词频统计)
6.4.4mrjob模块的运行方式
6.4.5MRJob类的工作原理
6.4.6mrjob模块的数据清洗
6.4.7mrjob模块的两表合并
6.5本章小结
6.6课后习题
6.7实训
第7章Hive数据仓库
7.1Hive模型
7.1.1Hive的架构与基本组成
7.1.2Hive的数据模型
7.2Hive安装
7.2.1Hive的基本安装
7.2.2MySQL的安装
7.2.3Hive的配置
7.3HiveQL详解
7.3.1元数据存储
7.3.2数据存储
7.3.2HQL操作
7.4本章小结
7.5课后习题
7.6实训
第8章HBase分布式数据库
8.1HBase工作原理
8.1.1HBase的表结构
8.1.2体系结构
8.1.3物理模型
8.1.4HBase读写流程
8.2HBase完全分布式
8.2.1安装前准备
8.2.2配置文件
8.2.3集群启动
8.3HBase Shell
8.3.1DDL操作
8.3.2DML操作
8.4本章小结
8.5课后习题
第9章Sqoop工具
9.1Sqoop的安装
9.2Sqoop的使用
9.2.1MySQL数据的导入导出
9.2.2Oracle数据的导入导出
9.3本章小结
9.4课后习题
第10章Hadoop实战——货运车分布分析平台
10.1需求分析
10.2案例1：各个城市中各种货运车的数量
10.2.1业务简介
10.2.2业务模型
10.2.3业务逻辑
10.2.4数据呈现
10.3案例2：报废货运车占比
10.3.1业务简介
10.3.2业务模型
10.3.3业务逻辑
10.3.4数据呈现
10.4案例3：各种货运车的总量
10.4.1业务简介
10.4.2业务模型
10.4.3业务逻辑
10.4.4数据呈现

內容試閱：

1. 为什么要学习本书
随着5G、工业互联网、人工智能等前沿科技的发展，工业大数据将从探索起步阶段迈入纵深发展阶段，迎来快速发展的机遇期，全球工业大数据行业的竞争也将变得更为激烈。随着市场数据增长的加剧，国家对数据服务的要求也越来越多样化、专业化、快速化，大数据的存储和分析无疑对所有数据企业是一个挑战。
Apache Hadoop是用于大规模数据存储及处理的分析引擎，具有高可靠性、高效性、高扩展性、高容错性、低成本等特点，并且在Hadoop生态体系中，包含了分布式文件存储系统、分布式计算系统、分布式列存储数据库、分布式协作服务、数据仓库等多方面的解决方案，深受广大软件开发工程师的喜爱。对于想从事大数据行业的开发人员来说，学好Hadoop尤为重要。
Hadoop技术功能强大，涉及知识面较广，没有基础的读者很难深入Hadoop体系架构之中，因此本书采用理论和案例相结合的讲解方式，将知识点由浅入深、由易到难地进行解析，让初学者能够在逐渐深入的学习过程中掌握Hadoop的生态体系。
2. 本书内容
本书共分10章，各章内容简介如下。
第1章主要介绍大数据的产生与发展，以及大数据技术的生态工具。通过本章的学习，读者应了解为什么要学习大数据、大数据生态系统有哪些成员。
第2章主要介绍Linux系统的安装、基本命令操作、权限与目录管理、文件操作及网络配置。通过本章的学习，读者应掌握Linux系统的常用操作。
第3章主要介绍Python 3语言的基础语法。通过本章的学习，读者应掌握Python 3环境的安装与配置，熟悉Python 3的基础语法。
第4章主要介绍Hadoop生态圈常用工具和Hadoop大数据集群环境的搭建。通过本章的学习，读者应掌握Hadoop大数据集群环境的搭建及Hadoop大数据集群常见问题的处理。
第5章主要介绍HDFS的工作原理及HDFS的操作。通过本章的学习，读者应掌握HDFS的工作原理、HDFS命令与HDFS API的常用操作，并且能够使用API解决实际问题。
第6章主要介绍MapReduce的工作原理及API的操作。通过本章的学习，读者应掌握MapReduce的工作原理和API的常用操作，并且能够使用MRJob模型编程解决实际问题。
第7章主要介绍Hive数据仓库的工作原理、Hive环境的搭建和HiveQL的使用。通过本章的学习，读者应掌握Hive环境的安装与配置，熟悉HiveQL的基础语法，并且能够使用HiveQL解决实际问题。
第8章主要介绍HBase分布式数据库的数据模型以及操作方式。通过本章的学习，读者应掌握部署HBase集群的方法，了解HBase存储数据的架构原理，并且能够使用HBase分布式数据库解决实际问题。
第9章主要介绍Sqoop工具的环境搭建及Sqoop工具的使用。通过本章的学习，读者应掌握Sqoop工具的安装和操作，并且能够使用Sqoop工具实现ETL操作。
第10章主要介绍货运车分布分析平台的构建、开发和部署，该平台是基于HDFS的离线分析项目，使用Python语言对分析结果进行了可视化展示。通过本章的学习，读者应掌握如何基于Python语言开发Hadoop程序。
3. 作者与致谢
本书由刘彬斌著，参与本书的编写、资料整理、书稿校对、课件制作等工作的有周磊、廖云华、胡涵等。感谢清华大学出版社专业严谨的工作态度，为本书的顺利出版提供了宝贵的意见，并付出了辛勤的劳动。
4. 配套资源
读者在学习本书时，可以配合与本书配套的讲解视频、教学大纲、PPT课件、习题和实例源码等资源，快速提升编程水平和解决实际问题的能力。
读者扫描本书封底“文泉云盘”涂层下的二维码，绑定微信后，即可扫描书中的二维码观看对应视频来进行学习（配有视频的章节已在目录中标出）。
教学大纲、PPT课件、习题答案和实例源码等资源可以从清华大学出版社官方微信公众号“书圈”（见封底）下载。关于本书及资源使用中的问题，请联系404905510@qq.com。
编者2022年1月

書城介紹　 \|　合作申請　\|　索要書目　 \|　新手入門　\|　聯絡方式　 \|　幫助中心　\|　找書說明　 \|　送貨方式　\|　付款方式	香港用户　 \|　台灣用户　\|　海外用户

megBook.com.tw
Copyright (C) 2013 - 2024 （香港）大書城有限公司　All Rights Reserved.