登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

2023年02月出版新書

『簡體書』R语言:实用数据分析和可视化技术(原书第2版)

書城自編碼: 3441648
分類: 簡體書→大陸圖書→計算機/網絡程序設計
作者: [美]贾里德P.德[Jared,P.Lander]
國際書號(ISBN): 9787111633624
出版社: 机械工业出版社
出版日期: 2019-11-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 876

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
与孤独对抗:弗洛姆眼中的爱、自由与身份认同危机
《 与孤独对抗:弗洛姆眼中的爱、自由与身份认同危机 》

售價:NT$ 442.0
严复传
《 严复传 》

售價:NT$ 325.0
格调与文明:维多利亚时代极情尽致的浮世生活
《 格调与文明:维多利亚时代极情尽致的浮世生活 》

售價:NT$ 549.0
性别麻烦
《 性别麻烦 》

售價:NT$ 330.0
南宋:倔强的抵抗
《 南宋:倔强的抵抗 》

售價:NT$ 717.0
汉语要素教学(第2版)( 国际中文教师专业能力丛书)
《 汉语要素教学(第2版)( 国际中文教师专业能力丛书) 》

售價:NT$ 493.0
寻秦迹:透过秦俑看秦朝
《 寻秦迹:透过秦俑看秦朝 》

售價:NT$ 594.0
秋原四部曲(全5册):地虎噬天王+清代旅蒙商述略+乱世靡音+茶馆之殇
《 秋原四部曲(全5册):地虎噬天王+清代旅蒙商述略+乱世靡音+茶馆之殇 》

售價:NT$ 1587.0

建議一齊購買:

+

NT$ 1002
《 R语言数据可视化之美:专业图表绘制指南(增强版) 》
+

NT$ 579
《 Visual Basic从入门到精通(第2版) 》
+

NT$ 554
《 跟我一起玩Python编程(共2册):教孩子快速掌握编程技巧 》
+

NT$ 549
《 大型网站技术架构:核心原理与案例分析(最接地气的网站架构经验,网站生存技术心要,应对大数据挑战的干货分享!) 》
+

NT$ 624
《 Spring源码深度解析 第2版 》
內容簡介:
本书借鉴数据科学家Jared P. Lander在R语言上丰富的教学经验,通过大量实例,详细讲解R语言的核心功能。对于刚接触统计程序和模型的人,本书的内容组织结构使得学习R语言相当简单和直观。本书主要介绍R语言中20%的核心功能,但是这20%的功能足以让你解决80%的现代数据分析。
书中每一章都是从基础知识开始,提供大量的实例和代码。你将学习下载和安装R语言;设置和使用R语言环境;掌握基本的程序编写,数据导入、操作和可视化;完成几个测验。然后在此基础上,你将构建几个完整的模型,包括线性和非线性模型,学习数据挖掘技术。接着你将在代码中学习使用LaTeX,RMarkdown和Shiny等R语言包。
目錄
译者序

前言
致谢
第1章 获取R语言1
1.1 下载R语言1
1.2 R语言版本2
1.3 32位与64位2
1.4 安装R语言2
1.4.1 在Windows系统上安装2
1.4.2 在Mac OS X系统上安装5
1.4.3 在Linux系统上安装8
1.5 微软开源R语言10
1.6 小结10
第2章 R语言环境11
2.1 命令行界面12
2.2 RStudio13
2.2.1 RStudio项目14
2.2.2 RStudio工具16
2.2.3 Git集成20
2.3 微软Visual Studio22
2.4 小结22
第3章 R语言包23
3.1 安装R语言包23
3.2 加载R语言包25
3.3 构建R语言包26
3.4 小结26
第4章 R语言基础27
4.1 基本数学运算27
4.2 变量28
4.2.1 变量赋值28
4.2.2 删除变量29
4.3 数据类型30
4.3.1 数值型30
4.3.2 字符型31
4.3.3 日期型32
4.3.4 逻辑型32
4.4 向量34
4.4.1 向量操作34
4.4.2 factor向量37
4.5 函数调用38
4.6 函数文档38
4.7 缺失数据39
4.7.1 NA39
4.7.2 NULL40
4.8 管道40
4.9 小结41
第5章 高级数据结构42
5.1 数据框42
5.2 列表48
5.3 矩阵53
5.4 数组56
5.5 小结56
第6章 R语言读取数据57
6.1 读取CSV文件57
6.1.1 read_delim函数59
6.1.2 fread函数60
6.2 读取Excel数据60
6.3 读取数据库数据62
6.4 读取其他统计工具的数据64
6.5 读取R语言二进制文件65
6.6 读取R语言数据67
6.7 读取网页数据68
6.7.1 读取HTML表格68
6.7.2 抽取网页数据69
6.8 读取JSON数据70
6.9 小结72
第7章 统计图73
7.1 基础统计图73
7.1.1 基础直方图74
7.1.2 基础散点图74
7.1.3 箱线图75
7.2 ggplot275
7.2.1 ggplot2:直方图和核密度曲线76
7.2.2 ggplot2:散点图77
7.2.3 ggplot2:箱线图和小提琴图79
7.2.4 ggplot2:曲线图82
7.2.5 主题83
7.3 小结84
第8章 编写R语言函数85
8.1 Hello,World!85
8.2 函数参数86
8.2.1 默认参数87
8.2.2 额外参数87
8.3 返回值88
8.4 do.call函数89
8.5 小结89
第9章 控制语句90
9.1 if和else语句90
9.2 switch语句92
9.3 ifelse函数94
9.4 复合检查95
9.5 小结95
第10章 R语言的循环迭代96
10.1 for循环96
10.2 while循环97
10.3 控制循环98
10.4 小结99
第11章 分组操作100
11.1 apply函数族100
11.1.1 apply函数100
11.1.2 lapply和sapply函数101
11.1.3 mapply函数102
11.1.4 其他的apply函数102
11.2 aggregate函数103
11.3 plyr包105
11.3.1 ddply函数106
11.3.2 llply函数108
11.3.3 plyr的辅助函数109
11.3.4 速度与便利性109
11.4 data.table包109
11.4.1 键值113
11.4.2 data.table聚合115
11.5 小结117
第12章 高效的分组操作:dplyr118
12.1 管道118
12.2 tbl数据类型119
12.3 select函数120
12.4 f?ilter函数127
12.5 slice函数131
12.6 mutate函数132
12.7 summarize函数135
12.8 group_by函数136
12.9 arrange函数137
12.10 do函数137
12.11 dplyr使用数据库139
12.12 小结140
第13章 数据迭代141
13.1 map函数141
13.2 特定类型的map函数143
13.2.1 map_int函数144
13.2.2 map_dbl函数144
13.2.3 map_chr函数144
13.2.4 map_lgl函数145
13.2.5 map_df函数145
13.2.6 map_if函数146
13.3 数据框的迭代147
13.4 map函数的多输入148
13.5 小结149
第14章 数据整理150
14.1 cbind和rbind150
14.2 连接151
14.2.1 合并152
14.2.2 plyr中的join152
14.2.3 合并表156
14.3 reshape2157
14.3.1 melt函数157
14.3.2 dcast函数159
14.4 小结160
第15章 数据重构:Tidyverse161
15.1 合并行和列数据161
15.2 用dplyr包连接162
15.3 行列变换166
15.4 小结169
第16章 字符串操作170
16.1 paste170
16.2 把格式数据写成串(sprintf)171
16.3 提取文本172
16.4 正则表达式175
16.5 小结181
第17章 概率分布182
17.1 正态分布182
17.2 二项分布186
17.3 泊松分布190
17.4 其他分布192
17.5 小结194
第18章 基本统计195
18.1 概括性统计量195
18.2 相关系数和协方差198
18.3 t-检验205
18.3.1 单样本t-检验206
18.3.2 两样本t-检验208
18.3.3 两配对样本t-检验210
18.4 方差分析211
18.5 小结213
第19章 线性模型214
19.1 简单线性回归214
19.2 多元回归219
19.3 小结234
第20章 广义线性模型235
20.1 逻辑斯蒂回归235
20.2 泊松回归238
20.3 其他的广义线性模型241
20.4 生存分析242
20.5 小结246
第21章 模型诊断247
21.1 残差247
21.2 模型比较252
21.3 交叉验证255
21.4 Bootstrap259
21.5 逐步变量选择262
21.6 小结264
第22章 正则化和压缩265
22.1 弹性网络265
22.2 贝叶斯压缩279
22.3 小结282
第23章 非线性模型283
23.1 非线性最小二乘法283
23.2 样条插值285
23.3 广义相加模型288
23.4 决策树293
23.5 boost树295
23.6 随机森林298
23.7 小结299
第24章 时间序列和自相关301
24.1 自回归移动平均模型301
24.2 向量自回归306
24.3 广义自回归异方差模型311
24.4 小结317
第25章 聚类318
25.1 k-均值318
25.2 PAM325
25.3 分层聚类329
25.4 小结332
第26章 模型拟合调优:caret333
26.1 caret介绍333
26.2 caret选项333
26.2.1 caret训练控制334
26.2.2 caret网格搜索334
26.3 boost树调优335
26.4 小结338
第27章 可重复性报告:knitr339
27.1 安装LaTeX339
27.2 LaTeX基础340
27.3 knitr中使用LaTeX342
27.4 小结346
第28章 R语言文档:RMarkdown347
28.1 文档编译347
28.2 文档头信息347
28.3 Markdown入门348
28.4 Markdown代码块350
28.5 htmlwidgets351
28.5.1 表数据352
28.5.2 leaflet354
28.5.3 dygraphs356
28.5.4 threejs358
28.5.5 d3heatmap360
28.6 RMarkdown幻灯片361
28.7 小结362
第29章 交互式dashboard:Shiny363
29.1 在RMarkdown中使用Shiny363
29.2 Shiny中的响应表达式366
29.3 服务端和UI界面368
29.4 小结376
第30章 构建R包377
30.1 目录结构377
30.2 包文件378
30.2.1 DESCRIPTION文件378
30.2.2 NAMESPACE文件380
30.2.3 其他包文件382
30.3 包文档384
30.4 测试386
30.5 包的检查、构建和安装388
30.6 提交至CRAN389
30.7 C++代码390
30.7.1 sourceCpp390
30.7.2 编译包392
30.8 小结394
附录A 相关资源395
內容試閱
随着日常生活中数据应用变得越来越普遍,我们需要新的和更好的工具来应对这个趋势。在传统情况下,处理数据的方式一般有两种:一是简单轻便的,使用像Excel或SPSS这样的工具做定量分析;二是复杂繁重的,利用C++这样的工具进行高性能分析。随着个人计算机性能的提高,产生了一种既交互又强健有效的折中方法。个人在自己的计算机上以探索性的方式所做的分析,很快就会转变为传递到支撑高级业务流程的服务器的工作。这便是R、Python和其他脚本语言的领域。
R语言是由奥克兰大学的Robert Gentleman教授和Ross Ihaka教授于1993年开发的,它源于贝尔实验室John Chambers所开发的S语言。这是一种高级语言,最初的目的是进行交互式运算,即使用者输入一个命令得到一个结果,然后再输入下一个命令。现在它已经发展成为一种可以嵌入系统和解决复杂问题的语言。
除了转换数据和分析数据之外,R语言还能很方便地产生令人惊喜的图形和报告。它现在已经成为一个完整的体系,可以用于数据分析、提取和转换、模型拟合、描述推断、预测,绘图以及给出报告结果。
自21世纪头10年后期以来,R语言的普及就像飞升的火箭一路飙升,它已经走出学术界,进入了银行业、销售业、制药业、政界、基因组学等其他许多领域。R语言的很多新用户以前都使用一些低级编译语言程序,比如C++和其他的统计包(例如SAS或SPSS),还有一些用户之前使用“800磅重的大猩猩”—Excel。这时期扩展软件包的数量飙升,这些软件包是预先写好的代码库,用于扩展R的功能。
尽管R有时会让初学者感到畏惧,特别是那些没有编程经验的人,但是我发现用编程分析来代替鼠标操作,学习过程很快就变得容易很多,而且更方便、更可靠。这正是我的目标:让学习变得更快、更容易。
本书内容的安排和布局是按照我在研究生院学习R时希望能够被教导的方式来设计的。综合来说,本书的内容是结合我在哥伦比亚大学所教的一门数据科学课程所形成的。这并不意味着覆盖R的每一个细枝末节,而在于用20%的功能去完成80%的工作。
第2版更新了许多第1版出版之后开发的工具。主要新增加的有:Tidyverse中做数据处理的包dplyr、tidyr和purrr,模型拟合中的boosted tree,以及模型参数调优的caret包。knitr章节拆分成两章,分别介绍knitr包和LaTeX、RMarkdown。它们在过去几年得到了显著的改进,包括创建允许JavaScript和文档混用的htmlwidgets。接着用整章介绍Shiny,它被开发用来在R语言中创建交互式Web dashboard。编写R语言包的章节更新了代码测试部分。读取数据的章节更新了部分读取数据的新方法,包括readr、readxl和jsonlite包。这些更新的内容都是R语言社区实践的结果。本书的内容包括如下章节。
第1章涉及从哪里下载R,如何安装不同的操作系统以及32位和64位版本的问题。该章还给出了安装R的路径的一些建议。
第2章涵盖如何整合RStudio和Git,比如RStudio的个人定制和导航。
第3章讲解如何定位、安装和加载R语言包。
第4章介绍R处理数学问题:变量类型(如numeric、character、Date)、向量、调用函数等,也介绍了函数调用和查看函数文档。
第5章涵盖常用数据结构,数据框(data.frame)、矩阵和列表。
第6章涉及读取数据到R中。在分析数据之前,需要先将数据读取到R中,有多种方式可以获取数据,包括从CSV和数据库读取。
第7章介绍直观的统计图形。图形是数据分析和交流结果的关键部分。R语言能用来绘制漂亮的图形。该章将详细介绍基本图形和ggplot2。
第8章涉及通过用户自定义函数使可重复分析变得更容易。该章讨论了结构、参数和返回规则。
第9章介绍流程控制,包括if、ifelse和复杂的控制流程。
第10章介绍R语言的循环迭代,包括for和while循环。通常推荐使用这些结构,所以需要了解清楚。
第11章介绍一种比循环更好的方式:向量化。向量化并没有去循环遍历数据,而是一次性操作所有元素。这种高效的操作方式被用在plyr包和apply函数中。
第12章涉及高效的分组操作:dplyr,介绍下一代分组操作。这些新包已通过data.frames进行了优化,并从用于使高效代码更易读的管道获益。
第13章介绍数据迭代,用purrr包来迭代列表和向量。
第14章介绍数据集组合,通过叠加或者连接(join)的方式合并多个数据集,改变数据的形状。除了像rbind、cbind和merge函数这些基本工具外,plyr和reshape2包提供了很好的函数来完成这些功能。
第15章介绍使用dplyr和tidyr包代替plyr和reshape2包做数据组合、重塑和连接。
第16章介绍字符串操作。大部分人不会把字符数据和统计相联系,但它是一种重要的数据形式。R语言提供各种工具来处理字符串,包括将它们进行组合以提取信息。该章还详细介绍了正则表达式。
第17章涵盖概率分布,包括正态分布、二项分布和泊松分布。
第18章介绍统计学的一些基本知识,比如均值、标准差和t检验。
第19章讲解线性模型。线性模型是统计中最强大和最常用的工具。
第20章涉及广义线性模型,包括线性模型的扩展:逻辑回归和泊松回归。该章还覆盖了生存分析。
第21章讲解评估模型质量和变量选择的方法,比如残差、AIC准则、交叉验证、bootst

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.