登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

2023年02月出版新書

『簡體書』R语言高效能实战 更多数据和更快速度

書城自編碼: 3729949
分類: 簡體書→大陸圖書→計算機/網絡程序設計
作者: 刘艺非
國際書號(ISBN): 9787115584403
出版社: 人民邮电出版社
出版日期: 2022-03-01

頁數/字數: /
書度/開本: 16开 釘裝: 平装

售價:NT$ 463

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
非洲大陆简史(萤火虫书系)
《 非洲大陆简史(萤火虫书系) 》

售價:NT$ 437.0
知宋·宋代之军事
《 知宋·宋代之军事 》

售價:NT$ 442.0
我能帮上什么忙?——一位资深精神科医生的现场医疗记录(万镜·现象)
《 我能帮上什么忙?——一位资深精神科医生的现场医疗记录(万镜·现象) 》

售價:NT$ 381.0
智慧宫丛书026·增长:从细菌到帝国
《 智慧宫丛书026·增长:从细菌到帝国 》

售價:NT$ 840.0
从自察到自救:别让情绪偷走你的人生
《 从自察到自救:别让情绪偷走你的人生 》

售價:NT$ 420.0
晚明的崩溃:人心亡了,一切就都亡了!
《 晚明的崩溃:人心亡了,一切就都亡了! 》

售價:NT$ 335.0
俄国女皇:叶卡捷琳娜二世传(精装插图版)
《 俄国女皇:叶卡捷琳娜二世传(精装插图版) 》

售價:NT$ 381.0
真想让我爱的人读读这本书
《 真想让我爱的人读读这本书 》

售價:NT$ 269.0

建議一齊購買:

+

NT$ 1062
《 PHP经典实例(第三版) 》
+

NT$ 594
《 狼书(卷2):Node.js Web应用开发 》
+

NT$ 1011
《 Go Web编程实战派——从入门到精通 》
+

NT$ 539
《 Visual Basic从入门到精通(微视频精编版) 》
+

NT$ 180
《 Visual Basic程序设计实验指导与测试(第5版) 》
+

NT$ 531
《 PHP+MySQL网站开发入门与提高(配光盘)(软件入门与提高丛书) 》
編輯推薦:
1.用更行之有效的data.table替代繁琐的iris处理繁琐数据,提高数据处理速度;
2.帮助读者用内存不大的个人笔记本处理大型数据集;
3.提供配套代码文件,方便读者学习练习;
內容簡介:
本书将目标设定为“在一台笔记本电脑上使用R语言处理较大的数据集”,从单机大型数据集处理策略、提升计算性能、其他工具和技巧3个方面介绍了使用R语言处理数据时的实用方法。包括数据集占用空间、善用data.table处理数据、数据分块处理、提升硬盘资源使用效率、并行编程技术、提升机器学习性能,以及其他资源管理和提高性能的实用策略。帮助读者处理较大的数据集、挖掘R的开发潜能。
本书适合有一定R语言基础的读者阅读,也适合作为R语言实践工具书。
關於作者:
刘艺非,中山大学社会学硕士,8年数据科学相关工作经历,曾在公益慈善、房地产、电信运营商等行业担任过数据分析师及数据挖掘工程师。在工作过程中对R语言、Python、SAS、STATA、SPSS等主流数据科学工具均有使用经验和心得。
目錄
第 1章 简单直接的策略—
减少数据占用空间1
1.1 保留必要的数据1
1.1.1 保留必要的列2
1.1.2 保留必要的行4
1.2 设置合适的数据类型13
1.3 本章小结15
第 2章 简单直接的策略—
减少数据占用空间1
1.1 保留必要的数据1
1.1.1 保留必要的列2
1.1.2 保留必要的行4
1.2 设置合适的数据类型13
1.3 本章小结15
第3章 基于内存的“快工具”—
data.table16
2.1 数据读入操作17
2.1.1 读入单个数据17
2.1.2 读入多个数据20
2.2 数据基本行列操作23
2.3 数据合并、分组汇总操作32
2.4 dtplyr:data.table和dplyr的结合39
2.5 本章小结46
第4章 逐块击破—数据分块处理47
3.1 使用iotools库实现分块处理47
3.2 使用readr库实现分块处理57
3.3 本章小结60
第4章 突破内存限制—
利用硬盘资源61
4.1 实现R与关系型数据库管理
系统协作61
4.2 使用bigmemory体系处理大型矩阵66
4.3 使用ff体系处理大型数据框73
4.3.1 ff体系基本数据操作73
4.3.2 ff体系与关系型数据库
系统协作81
4.4 新一代工具disk.frame83
4.5 本章小结93
第5章 友好的可视化工具—
trelliscope94
5.1 实现交互式大型分面可视化94
5.2 本章小结100
第6章 让R更快—并行编程101
6.1 R并行编程技术概览101
6.2 并行计算第三方库103
6.2.1 snow库104
6.2.2 multicore库104
6.2.3 parallel库105
6.2.4 future库106
6.2.5 foreach库107
6.3 网络数据爬取案例108
6.3.1 利用foreach并行循环
进行爬取109
6.3.2 利用tidyverse和future相结合
进行爬取119
6.3.3 文本分词及整洁化处理125
6.4 本章小结132
第7章 提升机器学习效能—
R的基础策略134
7.1 使用foreach实现并行循环136
7.2 使用更优化的第三方库140
7.3 使用caret框架结合并行计算145
7.4 本章小结157
第8章 整洁流畅的框架—
tidymodels158
8.1 建立简单工作流159
8.2 工作流比较166
8.3 工作流超参数调优169
8.4 多工作流同时调优176
8.5 本章小结180
第9章 灵活强大的框架—mlr3181
9.1 数据及模型的创建182
9.2 利用future支持mlr3计算任务190
9.3 嵌套重抽样过程201
9.4 以图管理机器学习工作流204
9.5 本章小结213
第 10章 强强联合—利用
reticulate库借力Python214
10.1 配置Python环境215
10.2 在R中用Python代码编程217
10.3 以R编程方式使用Python223
10.4 本章小结227
第 11章 简单高效的自动机器学习
工具—H2O228
11.1 H2O基本使用方法229
11.2 H2O自动机器学习242
11.3 本章小结247
第 12章 善其事,利其器—
其他策略和工具248
12.1 内存及硬盘资源管理类策略248
12.1.1 读取压缩文件248
12.1.2 以rds格式保存中间结果250
12.1.3 垃圾回收机制251
12.1.4 R的内存管理工具251
12.1.5 使用pryr库252
12.2 计算效能提升类策略254
12.2.1 函数编译255
12.2.2 使用benchmarkme库256
12.3 使用R的增强发行版本258
12.3.1 Microsoft R Open258
12.3.2 Microsoft R Client260
12.4 其他数据科学工具261
12.4.1 SAS(Statistical Analysis
System)261
12.4.2 Python262
12.5 本章小结264

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.