登入帳戶  | 訂單查詢  | 購物車/收銀台( 0 ) | 在線留言板  | 付款方式  | 聯絡我們  | 運費計算  | 幫助中心 |  加入書簽
會員登入 新註冊 | 新用戶登記
HOME新書上架暢銷書架好書推介特價區會員書架精選月讀2023年度TOP分類閱讀雜誌 香港/國際用戶
最新/最熱/最齊全的簡體書網 品種:超過100萬種書,正品正价,放心網購,悭钱省心 送貨:速遞 / EMS,時效:出貨後2-3日

2024年03月出版新書

2024年02月出版新書

2024年01月出版新書

2023年12月出版新書

2023年11月出版新書

2023年10月出版新書

2023年09月出版新書

2023年08月出版新書

2023年07月出版新書

2023年06月出版新書

2023年05月出版新書

2023年04月出版新書

2023年03月出版新書

2023年02月出版新書

『簡體書』大数据:正在到来的数据革命[3.0升级版](精装)

書城自編碼: 2550309
分類: 簡體書→大陸圖書→管理电子商务
作者: 涂子沛
國際書號(ISBN): 9787549564101
出版社: 广西师范大学出版社
出版日期: 2015-04-01

頁數/字數: 375页
書度/開本: 16开 釘裝: 精装

售價:NT$ 573

我要買

share:

** 我創建的書架 **
未登入.



新書推薦:
饲渊
《 饲渊 》

售價:NT$ 223.0
现金为王:把利润留下来,把成本降下去
《 现金为王:把利润留下来,把成本降下去 》

售價:NT$ 386.0
经纬度丛书·巴勒斯坦人的故事:流亡者的悲情、绝望与抗争
《 经纬度丛书·巴勒斯坦人的故事:流亡者的悲情、绝望与抗争 》

售價:NT$ 493.0
改变世界的哲学家们
《 改变世界的哲学家们 》

售價:NT$ 493.0
将军
《 将军 》

售價:NT$ 269.0
墓志的生成及其在唐代的衍变研究
《 墓志的生成及其在唐代的衍变研究 》

售價:NT$ 549.0
理解中国经济:在大变局中读懂新机遇
《 理解中国经济:在大变局中读懂新机遇 》

售價:NT$ 252.0
饥饿与国家:苏丹的饥荒、奴隶制和权力(1883~1956)
《 饥饿与国家:苏丹的饥荒、奴隶制和权力(1883~1956) 》

售價:NT$ 386.0

建議一齊購買:

+

NT$ 396
《 人工智能:李开复谈AI如何重塑个人、商业与社会的未来图谱 》
+

NT$ 510
《 智能时代 》
+

NT$ 518
《 数据科学与大数据分析 数据的发现 分析 可视化与表示 》
+

NT$ 593
《 大数据挖掘:系统方法与实例分析 》
+

NT$ 427
《 决战大数据(升级版):大数据的关键思考 》
+

NT$ 443
《 大数据分析 数据科学应用场景与实践精髓 》
編輯推薦:
★《亚洲周刊》“年度十大好书”,持续畅销;从0到1,开中国先河,领跑大数据时代最好的书, 经典之作——第一次详尽讲述“大数据浪潮”的来龙去脉;第一次深入解读“大数据时代”如何改变政府、商业和我们每个人的生活;第一次犀利阐明“数据”怎样推动民主进程……

★ 各界要人盛赞推荐——汪洋【中央高层人物】、柳传志【联想集团名誉主席】、任志强【中国房地产风云人物】、达文波特【全球顶尖的管理咨询大师】、许倬云【史学大家】、谢文【著名IT评论人】、薛海培【奥巴马总统大选亚裔事务顾问、美国华人全国委员会会长】、杨叙【英特尔全球副总裁、中国区总裁】、【中美10大高校著名学者】……各界要人盛赞推荐!

★《大数据》,这里有“中国对手”——

大数据浪潮,汹涌来袭。20世纪大萧条以来,美国作为世界强国的开放历史,数据技术浪潮的兴起过程,气势磅礴,波澜壮阔。真正读懂中国趋势,一定要先读懂美国。美国政府为什么能,中国到底缺什么?

★《大数据》,这里有“中国建言”——

哈佛大学商学院访问教授、全球顶尖的管理咨询大师达文波特,把脉经济,数据治国,专门为中国政经两界提示智库建言:“在很多领域,
內容簡介:
《大数据》3.0升级精装版,增加作者自序,以及归国以来的演讲、专题——数据是我们新经济的土壤,是我们未来智能社会的土壤,数据可以治国,还可以强国。

美国第一,中国第几?公布官员财产美国是怎么做的,美国能让少数人腐败起来吗?美国式上访是怎么回事?凭什么美国矿难那么少?全民医改美国做得到吗?美国总统大选有什么利器才能赢?下一轮全球洗牌我们世界工厂会被淘汰吗?……

除了上帝,任何人都必须用数据来说话。

大数据浪潮,汹涌来袭,与互联网的发明一样,这绝不仅仅是信息技术领域的革命,更是在全球范围启动透明政府、加速企业创新、引领社会变革的利器。现代管理学之父德鲁克有言,预测未来最好的方法,就是去创造未来。而“大数据战略”,则是当下领航全球的先机。

大数据,这一世界大潮的来龙去脉如何?数据技术变革,何以能推动政府信息公开、透明和社会公正?何以促发行政管理和商业管理革新,并创造无限商机?又何以既便利又危及我们每个人的生活?Google、百度之类搜索服务,何以会不再有立足之地?引领世界的数据帝国——美国和西欧,正在如何应对大数据时代?我们中国,又当如何作为?

本书通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例——奥巴马建设“前所未有的开放政府”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、隐私危机、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和推特等社交媒体、Web3.0与下一代互联网的未来图景等等,为您一一细解,数据创新给公民、政府、社会带来的种种挑战和变革。

美国是全书主体,但又处处反观中国当下的现实。回望中国,胡适批评“差不多先生”,黄仁宇求索“数目字管理”,作者从太平洋对面看到中美两国的差距,深知中国缺少什么、需要什么,故将十多年观察、思索所得,又新增微学校、微学位等教育领域正在发生的革命,以及建言中国“大数据战略”的重要文章和访谈,淘洗成这本开创性的“大数据之书”——《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》。
關於作者:
涂子沛,著名信息管理专家,江西吉安人,曾在美国学习、工作多年,2014年12月从美国硅谷回国,出任阿里巴巴集团副总裁。

本科毕业于华中科技大学计算机系,研究生就读于卡内基梅隆大学,获公共管理硕士和信息技术科学硕士学位。赴美留学前,曾在武警部队和公共部门磨砺10年,深刻洞悉中美两国的科技动态和文化理念。作者还先后担任上海真爱梦想基金会理事、中国旅美科技协会副主席等职务,并在国内多所大学有客座教职。
《大数据》这本书在中国社会开大数据之先河,引发了对大数据战略、数据治国和开放数据的讨论,被盛赞“为华文世界开创了一个重要话题”。 作者的另一本著作《数据之巅》,提出当前信息技术的发展,已经让中国获得了后发优势,中国要在大数据时代的全球竞争中胜出,需要把大数据从科技符号提升成为文化符号,在全社会倡导数据文化。
目錄
第三版自序 数据可以治国,还可以强国

序言一 大数据:为华文世界提出一个重要话题许倬云

序言二 中国的雄心应该拓展到大数据领域达文波特



【序幕】新总统的第一天

一人一票:把“黑”人送进“白”宫

大国新政:阳光是最好的防腐剂



【上篇】帝国风云:得数据者得天下——美国的成功经验

第一章 历史争战《信息自由法》

1-1.第四股力量:知情权的起点

1-2.国会议员:孤独的战争

1-3.白宫当家人:一个妥协者和机动者

1-4.政府VS. 社会:旧剧情重现新时代



第二章 数据帝国的兴起

2-1.摩尔定律:全世界半个世纪的发展规律

2-2.最小数据集:上升到立法高度的开路先锋

2-3.民意几时有:选票催生的创新

2-4.普适计算:计算机本身将从人们的视线中消失

2-5.
“大数据”战略:争夺全世界的下一个前沿



第三章 数据治国

3-1.循“数”管理:平安大道怎样铺

3-2.数据“验”平权:民权史上的碑石

3-3.数据“打”假:最大的争议就是福利滥用

3-4.CompStat
:街头警察的创新传奇



第四章 商务智能的前世今生

4-1.起源:从数据到知识的挑战和跨越

4-2.结蛹:数据仓库之厚积薄发

4-3.蚕动:联机分析之惊艳

4-4.破茧:数据挖掘之智能生命的产生

4-5.化蝶:数据可视化的华丽上演



【中篇】法则博弈:大数据时代的发展与危机

第五章 帝国的法则

5-1.收集法则:减负,为人民减负

5-2.使用法则:隐私,文明社会的共识

5-3.发布法则:免费,人民已经交税

5-4.管理法则:质量,互联网时代的根本




第六章 《数据质量法》的困局

6-1.产业界“俘虏”政府:数据背后的政经战争

6-2.美式“旋转门”:权、名、利大串场

6-3.
“掺沙子”法案:国会对付总统的独门秘器

6-4.环保“风险门”:公共利益常常无人代表

6-5.集体行动的逻辑:人人都想“搭便车”

6-6.三权之歧:什么是真正的“和谐”



第七章 全国隐私风波

7-1.《一九八四》:零隐私的恐惧

7-2.大数据就是“老大哥”:中央数据银行之争

7-3.百年纠结:统一身份证

7-4.“9·11”大拐点:以反恐的名义向左转

7-5.万维信息触角计划:追踪恐怖分子的“数据脚印”

7-6.6种改变政府的力量:山姆大叔大退让



【下篇】公民故事:公民社会与数据互动之双赢时代

第八章 数据开放运动

8-1.一个新的世界:从软件开源到数据开放

8-2.总统的雄心:公共财政支出透明

8-3.数据民主:印裔首席信息官的崛起

8-4.Data.Gov:从旗舰初航到保“数”运动

8-5.大众创新:航班延误之候机经济学



第九章 试金石:白宫访客记录

9-1.总统在见谁:大医改中的“小”插曲

9-2.全体美国人的房子:白宫

9-3.步步妥协:总统与草根的对决

9-4.从白宫安保到政治监督:执著的公民改变世界



第十章 矿难中的歌声和数据

10-1.集体行动的号角:你站在哪一边

10-2.可以避免的悲剧:数据揭示的全景式真相

10-3.默认公开推定:和矿难赛跑的原则

10-4.唯一的道路:民主时时都要“争”



【外篇】天下趋势:大数据社会未来之世界走向

第十一章 大趋势

11-1.数据权:大不列颠的硕果

11-2.大合流: 国际开放联盟

11-3.云计算:新的航向

11-4.再造互联网:从网页相连到数据相“联”



第十二章 大挑战

12-1.逐鹿政坛:得数据者得天下

12-2.数据竞争:企业赢之道

12-3.下一波浪潮:从大数据到大社会



第十三章 大变革(2.0升级版新增)

13-1.微学位:教育领域正在发生的革命

13-2.大数据:再谈教育领域正在发生的革命

13-3.微学校:三谈教育领域正在发生的革命



尾声 挑战中国:摘下“差不多先生”的文化标签

大事记 20世纪大萧条后美国信息开放、技术创新之路

后记 搭建“大数据”的世界

建言 中国如何应对大数据时代的挑战(升级增补)

访谈 大数据时代的“中国梦”(升级增补)

演讲 大数据、大计算:新经济的土壤(升级增补)

专题 什么是“数据的外部性”?(升级增补)

索引 (升级增补)
內容試閱
【“大数据”战略:争夺全世界的下一个前沿】

联邦政府的每一个机构和部门,都需要制定一个应对“大数据”的战略。

——《规划数字化的未来:美国总统科学技术顾问委员会给总统和国会的报告》2010年



业务工作的管理数据,民意社情的调查数据,以及对大自然、动植物的特点和变化进行监控而产生的环境数据,是联邦政府的三大数据来源。这三种数据,其发展各有先后,收集方式各不相同,数据量也大小不一。它们之间,存在着一些交叉和重叠,有一些民意调查的数据,是业务数据,而一些因环境监控产生的数据,也可以是业务工作的数据。

由于无线传感器的快速普及,环境数据增长得最快,成为联邦政府数据量最大的来源。

虽然环境数据增长得最快,但这三种数据,其实都在爆炸。这种爆炸,并不仅仅是数量一个维度的。2001年,著名的高德纳咨询公司(Gartner)在一份研究报告21中指出,数据的爆炸是“三维的”、是立体的,这三个维度,主要表现在以下三个方面:

一是同一类型的数据量在快速增大;

二是数据增长的速度在加快;

三是数据的多样性,即新的数据来源和新的数据种类在不断增加。

数据的爆炸性增长,也不仅仅限于联邦政府。如前文所述,2011年麦肯锡公司在其研究报告《大数据:下一个创新、竞争和生产率的前沿》中指出,在美国,仅仅制造行业就拥有比美国政府还多一倍的数据,此外,新闻业、银行业、医疗业、投资业、零售业都拥有可以和美国政府相提并论的海量数据。

哈尔·范里安(Hal
Varian)是谷歌的首席经济学家,也是美国研究信息经济学的著名学者。2000年,他对数据和信息产生的速度进行了研究,他认为,人类社会每年产生的信息量,实在太大了,已经没办法用准确的方法来计算现有的数字信息总量,只能估算。他估计2000年新产生的数据量为1000拍到2000拍。但到2010年,仅仅全球企业一年新存储的数据量就超过了7000拍,而全球消费者新存储的数据量约为6000拍。

这种数据量的增长,已经大大超出了人类的预期和想象。时至今日,数据已经像“洪流”一样,在全球的政治、经济生活当中奔腾。而且,随着信息技术的普及和进步,新的支流还在不断产生,各个支流流动、交汇和整合的速度,还在继续加快。

作为美国社会的信息枢纽,联邦政府当然要正面迎对这个挑战。

2010年12月,总统行政办公室下属的科学技术顾问委员会(PCAST)、信息技术顾问委员会(PITAC)向奥巴马和国会提交了《规划数字化未来》的专门报告,该报告把数据收集和使用的工作,提到了战略的高度。

这个报告列举了5个贯穿各个科技领域的共同挑战,报告指出“每一个挑战都至关重要”,而第一个挑战就是“数据”问题。报告说:

“如何收集、保存、维护、管理、分析、共享正在呈指数级增长的数据是我们必须面对的一个重要挑战。从网络摄像头、博客、天文望远镜到超级计算机的仿真,来自于不同渠道的数据以不同的形式如潮水一般向我们涌来。这些数据以不同的格式存储在不同的环境中,有的在计算机的硬盘里,有的在数据仓库之内。

如何保证这些数据现在、将来的完整性和可用性,我们面临着很多的问题和挑战。如何使用这些数据,则是另外一个挑战……应对好这些挑战,将引导我们在科研、医疗、商业和国家安全方面开创新的成功。”

在报告中,两个委员会还例举了美国癌症研究所以及中央情报局如何通过收集海量数据、建立数据仓库、实施以数据挖掘为核心的自动分析技术,获得了出人意料的创新和成功。

委员会一致认为,如何有效地利用数据将贯穿所有科技领域的挑战。最后,两个委员会向奥巴马建议:联邦政府的每一个机构和部门,都需要制定一个“大数据”的战略。

其实,“大数据”这个名词并不新鲜,早在1980年代,美国就有人提出了“大数据”的概念。20多年来,各个领域的数据量都在迅猛增长,美国的企业界、学术界也不断地对这个现象及其意义进行探讨,“大数据”这个名词变得越来越流行、越来越重要,最后成为了国家和政府层面的发展战略。

之所以要称之为战略,是因为“大数据”之“大”,并不仅仅在于其“容量之大”。当然,由于数据容量的爆炸,数据的收集、保存、维护以及共享等等任务,都成为具有研究意义的现象和挑战。但“大数据”之“大”,更多的意义在于:人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。

如前文所述,数据,是记录信息的载体,是知识的来源。数据的激增,意味着人类的记录范围、测量范围和分析范围在不断扩大,知识的边界在不断延伸。

2007年,雅虎的首席科学家沃茨博士在《自然》上发表了一篇文章《21世纪的科学》22,他发现,得益于计算机技术和海量数据库的发展,个人在真实世界的活动得到了前所未有的记录,这种记录的粒度23很高,频度在不断增加,为社会科学的定量分析提供了极为丰富的数据。由于能测得更准、计算得更加精确,他认为,社会科学将脱下“准科学”的外衣,在21世纪全面迈进科学的殿堂。例如,新闻的跟帖、网站的下载记录、社交平台的互动记录等等都为政治行为的研究提供了大量的数据,政治学这门古老的学科,将登堂入室,成为地道的“科学”。

麻省理工学院的教授布伦乔尔森(Erik Brynjolfsson)则比喻说,大数据的影响,就像4个世纪之前人类发明的显微镜一样。显微镜把人类对自然界的观察和测量水平推进到了“细胞”的级别,给人类社会带来了历史性的进步和革命。24 而大数据,将成为我们下一个观察人类自身社会行为的“显微镜”和监测大自然的“仪表盘”。

这个新的显微镜,将再一次扩大人类科学的范围,推动人类知识的增长,引领新的经济繁荣。麦肯锡全球研究所在其2011年的报告中最后概括说:大数据,将成为全世界下一个创新、竞争和生产率提高的前沿。

抢占这个前沿,无异于抢占下一个时代的“石油”和“金矿”。

2012年3月29日,奥巴马政府又进一步推进了其“大数据”战略。奥巴马的高级顾问、总统科学技术顾问委员会(PCAST)的主席霍尔德伦(John Holdren)代表国防部、能源部等6个联邦政府部门宣布,将投入2亿多美元立即启动“大数据发展研究计划”(Big Data Research and Development Initiative),以推动大数据的提取、存储、分析、共享和可视化。霍尔德伦也是哈佛大学肯尼迪政府学院的知名教授,他在讲话中表示:像美国历史上对超级计算和互联网的投资一样,这个大数据发展研究计划将对美国的创新、科研、教育和国防产生深远的影响。

奥巴马则强调联邦政府必须和公司、大学结盟,全民动员(All Hands on Deck),来应对“大数据”时代的挑战。



【大挑战——逐鹿政坛:得数据者得天下】

“政治技术决定政治成败。“——莫顿·布莱克韦尔,美国政治活动家

2011年4月4日,奥巴马以电子邮件和视频的方式,正式宣布自己将参加2012年的总统竞选、争取连任。

4年多以前,2007年2月,他在广场上的人潮中宣布了自己将参选总统的决定。作为代表伊利诺伊州的联邦参议员,他选择了位于该州首府的议会广场作为集会地点,这里曾经是林肯总统发表演讲的地方。奥巴马在凛冽的寒风中,面对沸腾的人群和高声喝彩,发表了近一个小时的演讲,随后开始了他长达一年多的大选征程。

但这一次,没有簇拥的集会、鼓动的口号和大幅的标牌,一切都由网上的点击,在瞬间平静地完成。

另外几位热门人选,如前麻省州长罗姆尼(Mitt Romney)、前众议院议长金里奇(Newt
Gingrich)也先后用推特(Twitter)和脸谱(Facebook)正式宣布了他们的参选意愿。

而通过集会拉开竞选的序幕,原本是美国上百年的政治传统。

有评论说,这表明,脸谱、推特和视频分享网站的发展已经深刻地改变了美国的政治生态,新的传统正在形成。还有评论指出,这次总统大选,是民主、共和两党都充分认识到社交网站重要性之后的第一次大选,技术对政治的作用将前所未有地凸显。

回顾历史,从上个世纪30年代的广播,到60年代的电视,再到本世纪初的互联网,技术一直在美国的政治生活中扮演重要的角色,甚至决定选举的成败。

互联网出现之后,就交流和互动而言,广播和电视无疑相形见绌。和它们相比,网络能提供一种没有强权的、多中心的、双向的甚至多向的信息交流方式,这一改广播、电视单向交流的不足,使候选人和选民之间的互动方式发生了深刻的改变。

如果说2008年的大选,是一场关于网络技术“用多”还是“用少”的较量,那么2012年的竞争,工具本身已经不再是竞争的优势。因为,近4年来,民主、共和两党都鼓励本党的政治家把网络作为必争之地,网络的重要作用已经得到了政治家的一致重视。共和党曾经发起“新媒体挑战”(New Media Challenge)的竞赛活动,以网络上粉丝的增长速度为衡量标准,鼓励党员集聚网络人气。比赛进行了一个半月,最后来自路易斯安那州的众议员佛兰芒(John Fleming)夺得了第一名。民主党当然不甘落后,也举办了类似的“在线政治明星”评比活动。

也就是说,两党的主要竞争者都在大规模地使用网络。竞争的重点已经不是“用不用”的问题,而是“如何用”、“用得好不好、巧不巧”。

互联网在政治竞选中的主要功能有两个,一是交流,候选人通过它和选民展开个性化的实时对话、收集采纳民意,并为自己的政治主张寻找支持;二是动员,通过它发动草根力量,完成召集志愿者、募款、造势等关键的选举活动。

当前,谁能把网络交流和动员这两个功能发挥得更好、运用到极致,其竞争的核心和重点,就是数据。

可以说,这是一场数据竞争。数据收集、分析和整合的能力已经成为技术和网络竞争的关键所在。

2008年,奥巴马通过他的个人竞选网站(Barackobama.com)收集了1300万人的个人信息和邮件地址,这曾经是他在交流规模上无可比拟的优势。但和2008年相比,如今的脸谱等社交网站已经不仅仅是个交流平台,还是一个记录了8亿人资料的开放“信息港”,第三方可以在上面开发新的应用并与其现有的数据直接相联,这为其他候选人提供了超越奥巴马的可能性。

奥巴马在宣布再参选以后,立即重新改版了他的个人网站。支持者一登录,便被要求提交其社交网站的账号,并询问是否能够读取其在社交网站上的档案信息,甚至索要在用户社交网页上发布消息的授权。这些举措,招招式式都是为了获取更多、更翔实完备的选民数据。

其他候选人当然也不甘落后,几乎每个候选人都先后推出了自己的网站,个别候选人甚至不惜重金,用送出纪念品的形式来鼓励选民把自己的账号和社交网站的账号挂钩相连,其目的都是为了扩展自己的数据容量,扩大未来与选民交流的规模。

与交流规模相比,交流的质量更为重要。大规模发送信息并不难,但只有挠到接收方痒处和痛处的信息才可能引起真正的关注。这就要求发送方必须了解信息受众,而不是简单地“群发”。这个方面,奥巴马已经有教训和体会。2011年7月29日,美国国会在为是否提高国家债务的上限进行激辩。奥巴马一天内连接发出十多个推特(微博),要求他的粉丝采取行动、给议员施压,催促他们通过提高债务上限的提案。但当天晚上,奥巴马的推特就流失了33000多名粉丝。奥巴马的技术团队随后对此进行了调查,发现其中的原因,正是很多人对这个话题不感兴趣,认为“总统在给他们发送信息垃圾”。

奥巴马的团队正在全力提高数据细分的能力。例如,堕胎问题一直是两党辩论的热点,奥巴马如果能在辩论之时,锁定35岁以下的女性进行信息交流,就可能形成稳定的观点联盟,造成声势。又比如,一谈到养老金问题,50岁以上的老人将成为第一目标群体。

除了性别、年龄之外,选民还可以按地域、种族、教育程度、宗教信仰等其他维度来划分,这些维度,还可以交叉,交叉分析的维度越多,信息受众就能分得越细、瞄得越准,信息交流的效率也就越高。此外,除了数据的细分,还可以通过数据模型预测不同选民的不同需要和行为模式,最终把个性化的短信和视频通过互联网或手机送达特定的群体。

除了交流,成功的动员也离不开有效的数据支持。研究表明,选举动员的重点是争取“墙头草”或“中间派”,最有效的方式是派出志愿者上门游说,这可能将选票拉升几个百分点,在势均力敌的情况下,成为胜出的关键。如果能掌握这类“中间派”人士的基本信息甚至个人喜好,志愿者的登门游说就能有的放矢、事半功倍。所以如何在网上确定这个群体、获取他们的数据,是决定动员效率的一个关键。

此外,通过不同数据库之间的分析和整合,为毕业于同一个学校、居住在同一个地区甚至拥有同一个爱好或观点的志愿者建立新的网络联系体,让支持者感觉同声同气、彼此相连,也能极大提高动员的效率和士气。

围绕数据细分的这些精细化的应用,可谓多不胜数。这种基于数据的选民细分方法,也被称为“纳米定位”(Nanotargeting) 。

当然,奥巴马能否最终当选,还取决于政治、经济、社会等等诸多方面的因素,但如果仅仅从技术层面来考虑,这一仗争的是数据,比的是数据收集、分析以及整合的能力。从这个意义上来说,得数据者得天下。这种基于数据的竞争,当然不仅仅局限在政治选举的领域。其实,早在2008年奥巴马当选总统之前,商业领域的数据竞争现象就引起了学界的研究和关注。



【大数据就是“老大哥”:中央数据银行之争】

“我们有很多小的、独立的信息记录系统。这些系统,就单个而言,它们可能无关痛痒,甚至是很有用的、完全合理的。但一旦把它们通过自动化的技术整合连接起来,它们就会渐渐蚕食我们的个人自由。这才是真正的危险。”

——美国隐私研究委员会,1977年

1965年,人类的计算模式还仅仅处在第一个阶段——主机时代,这种危险和担心就开始初现端倪。

那个时候,现在白宫的行政管理预算局(OMB)还叫预算局。

预算局提出了一个简单、大胆、在当时堪称革命性的创新计划。

该局建议,联邦政府应该成立一个统一的“数据中心”,把政府部门所有的数据库连接、集中、整合起来,建立一个大型的数据库。预算局相信,这不仅能节约硬件成本,还能提高数据管理、查询和统计的效率;此外,通过部门之间的数据对接和整合,还可以提高数据的准确性和一致性,减少数据的错误。

预算局甚至为这个计划提出了具体的实施方案:人口普查局、劳工统计局、税务局以及社保局等4个数据密集型部门先行一步,首先将数据库连接起来,其他各个部门的数据库逐步纳入,最终的目标是,以公民为单位,为全国每一个人建立一个数据档案,这个档案将包括每一个人教育、医疗、福利、犯罪和纳税等等一切从摇篮到坟墓的数据记录。

预算局将这个大型数据库称为“中央数据银行”。

普林斯顿大学的高等研究院(IAS)是全世界最顶尖的研究机构之一,它的特点,是可以不屈从任何行政的任务和资金的压力,自主开展纯粹的科学研究。时任该研究院主任的是凯森教授(Carl Kaysen),他盛赞这是一个划时代的计划。凯森发表了专门的可行性报告,指出统一管理不仅能节省运营成本、提高数据的准确性和查询的效率,还将更好地保障数据安全。

听起来有百利而无一弊,中央数据银行的计划得到了行政圈、学术界的一致响应。

经过一年的论证,1966年,联邦政府正式向国会提交了“中央数据银行”的方案,请求拨款、开工,开创新的数据管理篇章。

新闻界也开始报道联邦政府的这个创举。

但没想到,新闻界的报道引起了强烈的社会反弹。这种反弹,最后导致了这个计划的流产。

1967年1月,《纽约时报》发表了著名记者、隐私权专家帕卡德(Vance Packard)的文章《不能告诉计算机》,他写道:

“当政府把我们每一个人的信息和日常生活的细节都装进一个中央级的数据银行,我们将受控于坐在电脑机器前面的那个人和他的按钮。这令人不安,这是一种危险。”

美国公民自由联盟(ACLU)是一个成立于1920年、位于纽约的公益组织,它的目标是利用法律的手段维护公民的权利,隐私权正是ACLU关心的重点。对于中央数据银行的计划,ACLU强烈反对,并发表了一系列的声明和调查。

哈佛大学也对这个计划开展了专门的民调,其调查的结果表明,56%的美国人担心自己的隐私会受到侵害,明确反对这个计划。

一时间,曾经赢得了各方赞誉的数据银行计划在国会的讨论中陷入了泥沼。

此后,美国国会对此召开了一系列的听证会。1968年,众议院隐私委员会发布了一份报告,作出结论说,该计划无法保证公民的隐私不会受到侵害,不予批准。

但这只是一个中断,甚至仅仅只是一个开始。此后的几十年,随着数据库越来越多,类似于“中央数据银行”的计划不断改头换面,在国会发起冲刺。美国各界对其的讨论也从来没有间断过,并形成了泾渭分明的两派。

支持的一派以经济学家和技术专家为主,这个阵营认为,现代经济依赖于大规模的数据整合和交换,统一集成的中央数据库,将提高经济效率,方便大众的生活,是现代社会发展的必然,是社会进步的不二选择。

反对方自然是隐私至上的信奉者。他们认为,在信息时代,无论是个人的日常消费等琐碎小事,还是事关健康、教育的重大决策,都会在各种各样的信息系统当中留下“数据脚印”。这些“数据脚印”,保存在不同的系统中,可能无伤大雅。但如果建立起中央数据银行,通过数据整合和信息加总,就可以再现一个人生活的轨迹和全景,各个系统之间的数据可以彼此印证、互相解释,个人隐私就无所遁形。

隐私学学者认为,这种信息加总和数据整合,无异于一种监控,准确地说,是一种“数据监控”(Dataveillance),其对个人隐私权的侵害,无异于《一九八四》中的电幕。进入大数据时代之后,甚至有专家提出:大数据就是老大哥!(Big Data is Big Brother)



【大变革——之“微学位:教育领域正在发生的革命”】

这个月初,哈佛大学与麻省理工大学共同宣布,将投入6000万美元,开发一个在线教育平台。届时,不仅两个学校的授课过程免费向全世界开放,这个平台本身,也以开源的形式,向其他大学和教育机构免费开放。

而几个月以前,斯坦福大学已经把“在线教育”变成了硅谷最热门的话题。其计算机系的Ng教授,把自己的一门课放到了互联网上,结果全球有十几万人注册,这些人,除了在网上听他的实时讲授,还和斯坦福大学的在校生做同样的作业、接受同样的评分和考试。最后,有几千人完成了这门课程。Ng教授看到了其中的商机,在硅谷拉到了1000多万的投资,成立了在线教育公司Coursera。更早一些,谷歌无人驾驶汽车的发明者、大名鼎鼎的斯坦福教授Thrun,也离职创办了一家在线教育网站Udacity。随着类似的公司如雨后春笋般冒出,普林斯顿大学、加州大学伯克利分校、宾夕法尼亚大学等等知名学府都在近期宣布加盟在线教育,逐步向全世界开放自己的课程。

当然,这也不是大学的专利。我所在的宾夕法尼亚州,从小学到高中,都建立了在线学校,选择参加在线学习的学生,可以免费获得州政府配发的一台笔记本电脑、一台打印机和扫描仪,作为学习的工具。这是因为他放弃了公立学校的学位,节省了公共教育的开支。目前,宾州的在线学校Cyber School,已经招收了几千名中小学生。

之所以获得教育界和投资界的一致青睐,是因为现在的在线教育,已经不仅仅是一个镜头、一段远程录相这么简单,而增加了“互动”、“互助”、“行为评价和诱导”等等新的技术和色彩。例如,师生可以随时对话,计算机能够记录你在一张幻灯片上停留的时间,判别你在答错一道题之后有没有回头复习,统计你在网上提问的次数、参与讨论的多少,然后在这个基础上,对你的学习行为进行诱导和评价。此外,学习者还可以结成互助小组,甚至互相批改、评价对方的作业和报告。哈佛大学和麻省理工学院的新网站还宣布,对于完成一门课程的学生,只要缴纳极少的费用,就可以获得一个认证,这个认证并不是真正的学位。在这个新生事物层出不穷的时代,我们不妨称之为“微学位”。

“微学位”等新概念、新技术的出现,我认为,将给教育领域带来一场革命。它的影响,不仅立竿见影,而且相当深远,会波及整个社会。

1946年,人类发明第一台电子计算机。如果以此为起点,那人类社会进入信息时代已经有半个多世纪。信息时代的特点是信息流动的速度加快、传播的广度加大,信息垂手可得、无处不在。但信息不是知识,信息必须经过加工、组织、整理才能成为知识,即将到来的在线教育浪潮,把系统整理的知识以课程为载体推上了互联网,这将帮助我们在信息时代的基础上再迈进一步,进入真正的知识时代。知识时代的最大特点,是知识无所不在、随处可得。

学校,曾经是最重要的教育资源,好的学校,更是稀缺性的资源。由于在线教育的普及,在不远的将来,名校将人人可上,教育资源匮乏的问题将得到缓解。但在线教育对个人的重大意义,还不仅仅是教育机会的增加,更是学习方式的改变。在传统的学校,我们是接受教育,但在网络学校,人人都可以各取所需,随时随地、按照自己的节奏和计划来开展学习。例如,高中生可以尝试体验大学的课程,离开了校园的人,也可以登陆在线空间,再和在校生一起听课。通过在线教育,学习可以成为一个高度个性化的主动建构过程,终身教育也将成为普遍的现实。更多更好的教育资源、主动学习、终身教育,这些都是教育工作者探讨多年、孜孜以求的梦想。

在线教育引发的不仅仅是个人学习的革命,更会改变整个教育行业的生态。其影响大小,一时难下定论,我们不妨通过多问几个问题来催生自己的想象。以大学为例,通过把课程变成一种网络服务,而且公开竞争,越来越产品化,大学作为一个知识传播中心的作用是不是可以发挥得更好?此外,在线教育可以帮助大学突破围墙和座位的限制,名牌大学会不会因此更受追捧、其品牌效应会不会更加突出?还有,一流的大学不惧把自己的课程推上网和全世界的学习者共享,是不是因为它们还有更核心的竞争力?这个竞争力又是什么呢?是不是“创新”?顺着这个思路去想,不难得出结论:真实世界的大学会把更多的时间和精力倾斜到新知识的发现和生产上,而在线教育将承担更多的知识传播功能。

再有,学生和学校的关系是不是也会发生变化?过去,是学生争学校;将来,学校抢学生的现象可能会更加突出。一流的大学将成为一个创新型人才的集聚地,普通的大学可能要通过更好的行政管理和服务来吸引学生。再设想,如果你是用人单位,面对一名持有名牌大学“微学位”的候选人和一名三流大学的毕业生,你最后会雇用谁?“微学位”的产生,会不会引起教育行业一种新的竞争、重新布局、甚至洗牌?

哈佛大学在线教育的负责人认为,目前这场在线教育的浪潮,是印刷术发明之后,教育领域面临的最重大的变革。对中国的教育领域而言,如何合理规划、用好资源,是挑战,但更是福音,这值得我们全社会、特别是教育部的官员、教育一线的工作者以及企业家的思考、研究和关注。



【建言:中国如何应对大数据时代的挑战】

(四) 政府需要做什么?

一是政府机构、行业组织和大型企业要建立专门的数据治理机构来统筹数据治理的工作,例如数据治理委员会、大数据管理局等,数据治理的重点在于数据定义的一致性和数据的质量。在大数据时代,不同系统之间的数据要进行整合,因此要有统一的元数据定义,这不仅是中国而且是全世界当下都在面临的挑战。各个领域和行业的数据标准制定得好,将会起到事半功倍的效果。就单个企业而言,要认识到,未来的竞争是知识生产率而不是劳动生产率的竞争,数据分析产生的价值可能比较碎片化,分布在商业流程的各个环节,数据挖掘的投资回报也有不确定性,但企业领导必须有眼光,把数据治理的工作尽快统筹起来,为增强企业在大数据时代的竞争力做好准备。此外,数据治理机构的首长应该由组织的高层领导担任,否则标准无法推进到全局,也改善不了整个行业或组织的情况。

二是开放数据。数据增值的关键在于整合,但自由整合的前提是数据的开放。开放数据是指将原始的数据及其相关元数据以可以下载的电子格式放在互联网上,让其他方自由使用。开放数据和公开数据是两个不同的概念,公开是信息层面的,是一条一条的;开放是数据库层面的,是一片一片的。开放也不一定代表免费,企业的数据,可以以收费的形式开放。开放也是有层次的,可以对某个群体、某个组织,也可以对整个社会开放。在大数据的时代,开放数据的意义,不仅仅是满足公民的知情权,更在于让大数据时代最重要的生产资料数据自由地流动起来,以催生创新,推动知识经济和网络经济的发展,促进中国的经济增长由粗放型向精细型转型升级。

三是鼓励、扶持基于数据的创新和创业。政策扶持的传统方法,可能是以政府为主导建立大数据产业园,对新兴企业提供办公场所等便利条件或者现金支持,这固然有效,但更有效的方式是调动全社会的力量。例如,拨款支持大数据开源社区、程序员协会等民间组织的建设,通过扶持类似的民间团体,快速推进新技术、新理念在全社会的传播和普及;再例如,以开放的数据为基础,举办应用程序开发大赛,向全社会征询数据使用、创新的意见,主办方可以是政府,也可以是企业,拿出一定的资金,奖励最优秀的应用程序,激发民间蕴藏的创新力量。

四是要在全社会弘扬数据文化。数据文化,是尊重事实、推崇理性、强调精确的文化。要承认,回望历史,中国是个数据文化匮乏的国家,就现状而言,中国数据的公信力弱、质量低,数据定义的一致性差也是不争的事实。这方面,政府应该发挥主导作用,首先在公共领域推行数据治国的理念,要认识到,在大数据时代,公共决策最重要的依据将是系统的数据,而不是个人经验和长官意志,过去深入群众、实地考察的工作方法尽管仍然有效,但对决策而言,系统采集的数据、科学分析的结果更为重要。政府应加大数据治国的舆论宣传,将数据的知识纳入公务员的常规培训体系,力争在全社会形成“用数据来说话、用数据来管理、用数据来决策、用数据来创新”的文化氛围和时代特点。

最后是要围绕个人数据安全,逐步加强隐私立法。任何技术都是双刃剑,大数据也不例外。如何在推动数据开放的同时有效地保护公民隐私,将是大数据时代的一个重大挑战。

新年刚刚拉开序幕,希望中国政府相关部门尽快制定与大数据相关的政策,出台具体的措施,从而抓住历史的机遇、推动中国社会的发展和进步。

2013年,应该成为中国的大数据年。

 

 

書城介紹  | 合作申請 | 索要書目  | 新手入門 | 聯絡方式  | 幫助中心 | 找書說明  | 送貨方式 | 付款方式 香港用户  | 台灣用户 | 海外用户
megBook.com.tw
Copyright (C) 2013 - 2024 (香港)大書城有限公司 All Rights Reserved.