登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

2023年02月出版新書

『簡體書』大数据分析的道与术

書城自編碼: 2789059
分類: 簡體書→大陸圖書→計算機/網絡數據庫
作者: 毕然 编著
國際書號(ISBN): 9787121283512
出版社: 电子工业出版社
出版日期: 2016-04-01

頁數/字數: 342页
書度/開本: 32开 釘裝: 平装

售價:NT$ 338

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
正说清朝十二帝(修订珍藏版)
《 正说清朝十二帝(修订珍藏版) 》

售價:NT$ 493.0
黑海史:从历史涟漪到时代巨浪
《 黑海史:从历史涟漪到时代巨浪 》

售價:NT$ 538.0
我,毕加索
《 我,毕加索 》

售價:NT$ 280.0
投资真相
《 投资真相 》

售價:NT$ 381.0
非洲大陆简史(萤火虫书系)
《 非洲大陆简史(萤火虫书系) 》

售價:NT$ 437.0
知宋·宋代之军事
《 知宋·宋代之军事 》

售價:NT$ 442.0
我能帮上什么忙?——一位资深精神科医生的现场医疗记录(万镜·现象)
《 我能帮上什么忙?——一位资深精神科医生的现场医疗记录(万镜·现象) 》

售價:NT$ 381.0
智慧宫丛书026·增长:从细菌到帝国
《 智慧宫丛书026·增长:从细菌到帝国 》

售價:NT$ 840.0

建議一齊購買:

+

NT$ 518
《 数据科学与大数据分析 数据的发现 分析 可视化与表示 》
+

NT$ 593
《 大数据挖掘:系统方法与实例分析 》
+

NT$ 593
《 程序员的数学3 线性代数 》
+

NT$ 488
《 分布式服务框架原理与实践 》
+

NT$ 656
《 程序员的数学2 概率统计 》
編輯推薦:
本书用轻松话语讲述一线数据分析技术,既有统计方法与分析技巧,更有奇闻趣事和哲学感悟,为你的数据分析之路指点迷津。
內容簡介:
我们能相信统计么? 抛了5次硬币,结果都是正面,抛硬币是否肯定是正面?如何从高层的统计指标看透数据后面的本质?如何在大数据时代获取战略制高点,确定自己的职业发展定位?从一个互联网公司数据分析师的成长经历,为您娓娓道来,数据分析中的奇闻趣事、心得总结、方法技巧与哲学感悟。
關於作者:
百度资深数据技术专家,在检索系统、在线广告、商业营销等领域有丰富的大数据分析和建模经验。曾因对百度的杰出贡献,获得首届百度百万美金最高奖,并多次获得技术创新奖。专注于理论与实践的结合,涉猎大数据技术、经济与商业机制、互联网产品战略、营销策略等多个领域,深究其根源并擅长跨界思考。乐于分享,百度技术学院的明星讲师,开设课程《大数据分析的道与术》、《经济学与互联网商业产品设计》和《机器学习的思考故事》等。
目錄
目 录第一篇 道1第1章 大数据分析之道21.1 做好数据分析的关键31.2 业务调研101.3 创新思考141.4 逻辑推理251.5 可行建议481.6 补充阅读:数据分析报告的撰写要点51第二篇 术63第2章 统计是怎么发明的?642.1 重启思维模式652.2 统计的意义及指标712.3 统计图形是如何设计的?102第3章 我们能相信统计吗?1153.1 统计可信吗?1163.2 基于概率的信任1203.3 如何实现基于概率的信任?1263.4 应用理念:细致与置信的权衡之道1403.5 评估:正确的认识世界1443.6 设计统计方案中的方法论156第4章 统计分析方法1594.1 拆指标-1 分布分析1614.2 拆指标-2 趋势分析1654.3 拆指标-3 因素分析1774.4 拆数据-1 个案分析1864.5 拆数据-2 异常分析1884.6 拆数据-3 分组分析1934.7 附加阅读:消费者偏好和企业差异化战略1974.8 不同分析方法的结合与创新2094.9 与领域相关的分析方法213第5章 数据分析的高级工具:OLAP与机器学习2205.1 OLAP技术2215.2 无监督学习模型2255.3 监督学习模型234第三篇 释287第6章 大数据时代2886.1 大数据的价值2896.2 企业如何向数据技术转型?3016.3 数据技术的职业发展315第7章 数据技术团队组建和发展3317.1 自我修炼与领导团队3327.2 数据技术团队的组织结构3347.3 数据技术团队发展中的优劣势336
內容試閱
当心!“数据”一样会说谎!例2:一所艺术学校,男生校服只有裤子款式(100%选裤子),而女生校服有裙子和裤子两种款式,经统计得知75%的女生选裙子款,25%选裤子款。今天进入校园,远远看到一个穿裤子的同学,他是男生的概率高?还是女生的概率高?根据之前讲座交流的经验,对于第一次阅读这份数据的朋友,大都判断该同学更可能是男生。但如果我把所有的数据细节都透露出来,大家的结论会不会有变化呢?例2的完整数据:艺术学校有女生900人,男生100人。看到一个穿裤子男生的概率为10% × 100% = 0.1,而看到一个穿裤子女生的概率为90% × 25% = 0.225,所以远远看到一个穿裤子的同学,他更有可能是女生!例2只公布了似然概率,却隐藏了先验概率信息,使人的判断发生迷惑。什么是似然概率和先验概率呢?这涉及到统计学中的贝叶斯公式,描述一件事物发生的概率与两个概率相关,先验概率和似然概率。数学表示:Ph1 | D ∝ Ph × PD | h假设h代表我们对某个事物的判断,如果有两个判断(如某同学是男或是女),可以写为h1、h2。数据D表示观测到的统计数据。Ph|D表示看到数据D后,判断假设h为真的概率。PD|h表示判断假设h为真的情况下,观测到数据D的概率。那么,贝叶斯定理说明了“观测到数据D,判断假设h为真的概率”,与“假设h天然出现的概率(Ph,称为先验概率)”和“假设h为真的情况下,观测到数据D的概率(PD|h,称为似然概率)”成正比。其实更准确的公式是 Ph | D = Ph ×PD | h PD,因为对于不同的假设h,数据D天然出现的概率PD均相同。其对判断“哪个假设h更可能是真的”不起作用,通常可以忽略。回到艺术学校的例子,观测数据D =看到该同学穿的是裤子,假设 h1=他是男生,假设h2=她是女生。因为艺术学校男生有100人、女生有900人,所以先验概率 Ph1 =10%、Ph2=90%。因为男生 100%会选择裤子,女生 25%会选择裤子,所以似然概率PD | h1 =100%、PD | h2 =25%。那么,校园中随意看到了一位穿裤子的同学,他是男生的概率近似:Ph1 | D = Ph1 × PD | h1 = 10% × 100% = 0.1她是女生的概率近似:Ph2 | D = Ph2 × PD | h2 = 90% × 25% = 0.225可见女生的概率要比是男生的概率高1倍多,这位穿裤子的同学更可能是女生! 注释:上述计算亦可以加上PD的考量,会得到精确的概率结果。女生有225人穿裤子,男生100人穿裤子,校园1000名学生中穿裤子的概率PD为32.5%。将上述近似值除以PD,得到他是男生的概率为30.8%,她是女生的概率为69.2%,之间的差距比例是一致的(0.10.225 = 30.8%69.2%),所以通常可以省去计算PD。从这两个例子可见,隐藏一部分数据,只展示部分维度时,可能会诱导人们得出完全不同的结论。在某些场景下,更细节的相关信息是不能忽略的,隐藏了部分事实就相当于说谎。很多数据分析工作均需要全面细致的数据信息才能做出正确的判断。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.