大数据:正在到来的数据革命[3.0升级版](精装 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线

大数据:正在到来的数据革命[3.0升级版](精装电子书下载地址
- 文件名
- [epub 下载] 大数据:正在到来的数据革命[3.0升级版](精装 epub格式电子书
- [azw3 下载] 大数据:正在到来的数据革命[3.0升级版](精装 azw3格式电子书
- [pdf 下载] 大数据:正在到来的数据革命[3.0升级版](精装 pdf格式电子书
- [txt 下载] 大数据:正在到来的数据革命[3.0升级版](精装 txt格式电子书
- [mobi 下载] 大数据:正在到来的数据革命[3.0升级版](精装 mobi格式电子书
- [word 下载] 大数据:正在到来的数据革命[3.0升级版](精装 word格式电子书
- [kindle 下载] 大数据:正在到来的数据革命[3.0升级版](精装 kindle格式电子书
内容简介:
基本信息
书名:
Z大数据3.0
作者:
开本:
*:
69
页数:
现价:
见顶部
出版时间
2015-05
书号:
9787549564101
印刷时间:
出版社:
广西师范大学出版社
版次:
商品类型:
正版图书
印次:
内容提要
作者简介
涂子沛,著名信息管理专家,江西吉安人,曾在美国学习、工作多年,2014年12月从美国硅谷回国,出任*集团副总裁。
本科毕业于华中科技大学计算机系,研究生就读于卡内基梅隆大学,获公共管理硕士和信息技术科学硕士学位。赴美留学前,曾在武警部队和公共部门磨砺10年,深刻洞悉中美两国的科技动态和文化理念。作者还先后担任上海真爱梦想基金会理事、中国旅美科技协会副主席等职务,并在国内多所大学有客座教职。
《大数据》这本书在中国社会开大数据之先河,引发了对大数据战略、数据治国和开放数据的讨论,被盛赞“为华文世界开创了一个重要话题”。 作者的另一本著作《数据之巅》,提出当前信息技术的发展,已经让中国获得了后发优势,中国要在大数据时代的全球竞争中胜出,需要把大数据从科技符号提升成为文化符号,在全社会倡导数据文化。
精彩导读
【“大数据”战略:争夺全世界的下一个前沿】
联邦政府的每一个机构和部门,都需要制定一个应对“大数据”的战略。
——《规划数字化的未来:美国总统科学技术顾问委员会给总统和国会的报告》2010年
业务工作的管理数据,民意社情的调查数据,以及对大自然、动植物的特点和变化进行监控而产生的环境数据,是联邦政府的三大数据来源。这三种数据,其发展各有先后,收集方式各不相同,数据量也大小不一。它们之间,存在着一些交叉和重叠,有一些民意调查的数据,是业务数据,而一些因环境监控产生的数据,也可以是业务工作的数据。
由于无线传感器的快速普及,环境数据增长得最快,成为联邦政府数据量*的来源。
虽然环境数据增长得最快,但这三种数据,其实都在爆炸。这种爆炸,并不仅仅是数量一个维度的。2001年,著名的高德纳咨询公司(Gartner)在一份研究报告21中指出,数据的爆炸是“三维的”、是立体的,这三个维度,主要表现在以下三个方面:
一是同一类型的数据量在快速增大;
二是数据增长的速度在加快;
三是数据的多样性,即新的数据来源和新的数据种类在不断增加。
数据的爆炸性增长,也不仅仅限于联邦政府。如前文所述,2011年麦肯锡公司在其研究报告《大数据:下一个创新、竞争和生产率的前沿》中指出,在美国,仅仅制造行业就拥有比美国政府还多一倍的数据,此外,新闻业、银行业、医疗业、投资业、零售业都拥有可以和美国政府相提并论的海量数据。
哈尔·范里安(Hal Varian)是谷歌的首席经济学家,也是美国研究信息经济学的著名学者。2000年,他对数据和信息产生的速度进行了研究,他认为,人类社会每年产生的信息量,实在太大了,已经没办法用准确的方法来计算现有的数字信息总量,只能估算。他估计2000年新产生的数据量为1000拍到2000拍。但到2010年,仅仅全球企业一年新存储的数据量就超过了7000拍,而全球消费者新存储的数据量约为6000拍。
这种数据量的增长,已经大大超出了人类的预期和想象。时至今日,数据已经像“洪流”一样,在全球的政治、经济生活当中奔腾。而且,随着信息技术的普及和进步,新的支流还在不断产生,各个支流流动、交汇和整合的速度,还在继续加快。
作为美国社会的信息枢纽,联邦政府当然要正面迎对这个挑战。
2010年12月,总统行政办公室下属的科学技术顾问委员会(PCAST)、信息技术顾问委员会(PITAC)向奥巴马和国会提交了《规划数字化未来》的专门报告,该报告把数据收集和使用的工作,提到了战略的高度。
这个报告列举了5个贯穿各个科技领域的共同挑战,报告指出“每一个挑战都至关重要”,而第一个挑战就是“数据”问题。报告说:
“如何收集、保存、维护、管理、分析、共享正在呈指数级增长的数据是我们必须面对的一个重要挑战。从网络摄像头、博客、天文望远镜到超级计算机的仿真,来自于不同渠道的数据以不同的形式如潮水一般向我们涌来。这些数据以不同的格式存储在不同的环境中,有的在计算机的硬盘里,有的在数据仓库之内。
如何保证这些数据现在、将来的完整性和可用性,我们面临着很多的问题和挑战。如何使用这些数据,则是另外一个挑战……应对好这些挑战,将引导我们在科研、医疗、商业和国家安全方面开创新的成功。”
在报告中,两个委员会还例举了美国癌症研究所以及中央情报局如何通过收集海量数据、建立数据仓库、实施以数据挖掘为核心的自动分析技术,获得了出人意料的创新和成功。
委员会一致认为,如何有效地利用数据将贯穿所有科技领域的挑战。最后,两个委员会向奥巴马建议:联邦政府的每一个机构和部门,都需要制定一个“大数据”的战略。
其实,“大数据”这个名词并不新鲜,早在1980年代,美国就有人提出了“大数据”的概念。20多年来,各个领域的数据量都在迅猛增长,美国的企业界、学术界也不断地对这个现象及其意义进行探讨,“大数据”这个名词变得越来越流行、越来越重要,最后成为了国家和政府层面的发展战略。
之所以要称之为战略,是因为“大数据”之“大”,并不仅仅在于其“容量之大”。当然,由于数据容量的爆炸,数据的收集、保存、维护以及共享等等任务,都成为具有研究意义的现象和挑战。但“大数据”之“大”,更多的意义在于:人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。
如前文所述,数据,是记录信息的载体,是知识的来源。数据的激增,意味着人类的记录范围、测量范围和分析范围在不断扩大,知识的边界在不断延伸。
2007年,雅虎的首席科学家沃茨博士在《自然》上发表了一篇文章《21世纪的科学》22,他发现,得益于计算机技术和海量数据库的发展,个人在真实世界的活动得到了前所未有的记录,这种记录的粒度23很高,频度在不断增加,为社会科学的定量分析提供了极为丰富的数据。由于能测得更准、计算得更加精确,他认为,社会科学将脱下“准科学”的外衣,在21世纪全面迈进科学的殿堂。例如,新闻的跟帖、网站的下载记录、社交平台的互动记录等等都为政治行为的研究提供了大量的数据,政治学这门古老的学科,将登堂入室,成为地道的“科学”。
麻省理工学院的教授布伦乔尔森(Erik Brynjolfsson)则比喻说,大数据的影响,就像4个世纪之前人类发明的显微镜一样。显微镜把人类对自然界的观察和测量水平推进到了“细胞”的级别,给人类社会带来了历史性的进步和革命。24 而大数据,将成为我们下一个观察人类自身社会行为的“显微镜”和监测大自然的“仪表盘”。
这个新的显微镜,将再一次扩大人类科学的范围,推动人类知识的增长,引领新的经济繁荣。麦肯锡全球研究所在其2011年的报告中最后概括说:大数据,将成为全世界下一个创新、竞争和生产率提高的前沿。
抢占这个前沿,无异于抢占下一个时代的“石油”和“金矿”。
2012年3月29日,奥巴马政府又进一步推进了其“大数据”战略。奥巴马的高级顾问、总统科学技术顾问委员会(PCAST)的主席霍尔德伦(John Holdren)代表国防部、能源部等6个联邦政府部门宣布,将投入2亿多美元立即启动“大数据发展研究计划”(Big Data Research and Development Initiative),以推动大数据的提取、存储、分析、共享和可视化。霍尔德伦也是哈佛大学肯尼迪政府学院的知名教授,他在讲话中表示:像美国历史上对超级计算和互联网的投资一样,这个大数据发展研究计划将对美国的创新、科研、教育和国防产生深远的影响。
奥巴马则强调联邦政府必须和公司、大学结盟,全民动员(All Hands on Deck),来应对“大数据”时代的挑战。
【大挑战——逐鹿政坛:得数据者得天下】
“政治技术决定政治成败。“——莫顿·布莱克韦尔,美国政治活动家
2011年4月4日,奥巴马以电子邮件和视频的方式,正式宣布自己将参加2012年的总统竞选、争取连任。
4年多以前,2007年2月,他在广场上的人潮中宣布了自己将参选总统的决定。作为代表伊利诺伊州的联邦参议员,他选择了位于该州首府的议会广场作为集会地点,这里曾经是林肯总统发表演讲的地方。奥巴马在凛冽的寒风中,面对沸腾的人群和高声喝彩,发表了近一个小时的演讲,随后开始了他长达一年多的大选征程。
但这一次,没有簇拥的集会、鼓动的口号和大幅的标牌,一切都由网上的点击,在瞬间平静地完成。
另外几位热门人选,如前麻省州长罗姆尼(Mitt Romney)、前众议院议长金里奇(Newt Gingrich)也先后用推特(Twitter)和脸谱(Facebook)正式宣布了他们的参选意愿。
而通过集会拉开竞选的序幕,原本是美国上百年的政治传统。
有评论说,这表明,脸谱、推特和视频分享网站的发展已经深刻地改变了美国的政治生态,新的传统正在形成。还有评论指出,这次总统大选,是民主、共和两党都充分认识到社交网站重要性之后的第一次大选,技术对政治的作用将前所未有地凸显。
回顾历史,从上个世纪30年代的广播,到60年代的电视,再到本世纪初的互联网,技术一直在美国的政治生活中扮演重要的角色,甚至决定选举的成败。
互联网出现之后,就交流和互动而言,广播和电视无疑相形见绌。和它们相比,网络能提供一种没有强权的、多中心的、双向的甚至多向的信息交流方式,这一改广播、电视单向交流的不足,使候选人和选民之间的互动方式发生了深刻的改变。
如果说2008年的大选,是一场关于网络技术“用多”还是“用少”的较量,那么2012年的竞争,工具本身已经不再是竞争的优势。因为,近4年来,民主、共和两党都鼓励本党的政治家把网络作为必争之地,网络的重要作用已经得到了政治家的一致重视。共和党曾经发起“新媒体挑战”(New Media Challenge)的竞赛活动,以网络上粉丝的增长速度为衡量标准,鼓励党员集聚网络人气。比赛进行了一个半月,最后来自路易斯安那州的众议员佛兰芒(John Fleming)夺得了第一名。民主党当然不甘落后,也举办了类似的“在线政治明星”评比活动。
也就是说,两党的主要竞争者都在大规模地使用网络。竞争的重点已经不是“用不用”的问题,而是“如何用”、“用得好不好、巧不巧”。
互联网在政治竞选中的主要功能有两个,一是交流,候选人通过它和选民展开个性化的实时对话、收集采纳民意,并为自己的政治主张寻找支持;二是动员,通过它发动草根力量,完成召集志愿者、募款、造势等关键的选举活动。
当前,谁能把网络交流和动员这两个功能发挥得更好、运用到极致,其竞争的核心和重点,就是数据。
可以说,这是一场数据竞争。数据收集、分析和整合的能力已经成为技术和网络竞争的关键所在。
2008年,奥巴马通过他的个人竞选网站(Barackobama.com)收集了1300万人的个人信息和邮件地址,这曾经是他在交流规模上无可比拟的优势。但和2008年相比,如今的脸谱等社交网站已经不仅仅是个交流平台,还是一个记录了8亿人资料的开放“信息港”,第三方可以在上面开发新的应用并与其现有的数据直接相联,这为其他候选人提供了超越奥巴马的可能性。
奥巴马在宣布再参选以后,立即重新改版了他的个人网站。支持者一登录,便被要求提交其社交网站的账号,并询问是否能够读取其在社交网站上的档案信息,甚至索要在用户社交网页上发布消息的授权。这些举措,招招式式都是为了获取更多、更翔实完备的选民数据。
其他候选人当然也不甘落后,几乎每个候选人都先后推出了自己的网站,个别候选人甚至不惜重金,用送出纪念品的形式来鼓励选民把自己的账号和社交网站的账号挂钩相连,其目的都是为了扩展自己的数据容量,扩大未来与选民交流的规模。
与交流规模相比,交流的质量更为重要。大规模发送信息并不难,但只有挠到接收方痒处和痛处的信息才可能引起真正的关注。这就要求发送方必须了解信息受众,而不是简单地“群发”。这个方面,奥巴马已经有教训和体会。2011年7月29日,美国国会在为是否提高国家债务的上限进行激辩。奥巴马一天内连接发出十多个推特(微博),要求他的粉丝采取行动、给议员施压,催促他们通过提高债务上限的提案。但当天晚上,奥巴马的推特就流失了33000多名粉丝。奥巴马的技术团队随后对此进行了调查,发现其中的原因,正是很多人对这个话题不感兴趣,认为“总统在给他们发送信息垃圾”。
奥巴马的团队正在全力提高数据细分的能力。例如,堕胎问题一直是两党辩论的热点,奥巴马如果能在辩论之时,锁定35岁以下的女性进行信息交流,就可能形成稳定的观点联盟,造成声势。又比如,一谈到养老金问题,50岁以上的老人将成为第一目标群体。
除了性别、年龄之外,选民还可以按地域、种族、教育程度、宗教信仰等其他维度来划分,这些维度,还可以交叉,交叉分析的维度越多,信息受众就能分得越细、瞄得越准,信息交流的效率也就越高。此外,除了数据的细分,还可以通过数据模型预测不同选民的不同需要和行为模式,最终把个性化的短信和视频通过互联网或手机送达特定的群体。
除了交流,成功的动员也离不开有效的数据支持。研究表明,选举动员的重点是争取“墙头草”或“中间派”,最有效的方式是派出志愿者上门游说,这可能将选票拉升几个百分点,在势均力敌的情况下,成为胜出的关键。如果能掌握这类“中间派”人士的基本信息甚至个人喜好,志愿者的登门游说就能有的放矢、事半功倍。所以如何在网上确定这个群体、获取他们的数据,是决定动员效率的一个关键。
此外,通过不同数据库之间的分析和整合,为毕业于同一个学校、居住在同一个地区甚至拥有同一个爱好或观点的志愿者建立新的网络联系体,让支持者感觉同声同气、彼此相连,也能极大提高动员的效率和士气。
围绕数据细分的这些精细化的应用,可谓多不胜数。这种基于数据的选民细分方法,也被称为“纳米定位”(Nanotargeting) 。
当然,奥巴马能否最终当选,还取决于政治、经济、社会等等诸多方面的因素,但如果仅仅从技术层面来考虑,这一仗争的是数据,比的是数据收集、分析以及整合的能力。从这个意义上来说,得数据者得天下。这种基于数据的竞争,当然不仅仅局限在政治选举的领域。其实,早在2008年奥巴马当选总统之前,商业领域的数据竞争现象就引起了学界的研究和关注。
【大数据就是“老大哥”:中央数据银行之争】
“我们有很多小的、独立的信息记录系统。这些系统,就单个而言,它们可能无关痛痒,甚至是很有用的、完全合理的。但一旦把它们通过自动化的技术整合连接起来,它们就会渐渐蚕食我们的个人自由。这才是真正的危险。”
——美国隐私研究委员会,1977年
1965年,人类的计算模式还仅仅处在第一个阶段——主机时代,这种危险和担心就开始初现端倪。
那个时候,现在白宫的行政管理预算局(OMB)还叫预算局。
预算局提出了一个简单、大胆、在当时堪称革命性的创新计划。
该局建议,联邦政府应该成立一个统一的“数据中心”,把政府部门所有的数据库连接、集中、整合起来,建立一个大型的数据库。预算局相信,这不仅能节约硬件成本,还能提高数据管理、查询和统计的效率;此外,通过部门之间的数据对接和整合,还可以提高数据的准确性和一致性,减少数据的错误。
预算局甚至为这个计划提出了具体的实施方案:人口普查局、劳工统计局、税务局以及社保局等4个数据密集型部门先行一步,首先将数据库连接起来,其他各个部门的数据库逐步纳入,最终的目标是,以公民为单位,为全国每一个人建立一个数据档案,这个档案将包括每一个人教育、医疗、福利、犯罪和纳税等等一切从摇篮到坟墓的数据记录。
预算局将这个大型数据库称为“中央数据银行”。
普林斯顿大学的高等研究院(IAS)是全世界最*的研究机构之一,它的特点,是可以不屈从任何行政的任务和资金的压力,自主开展纯粹的科学研究。时任该研究院主任的是凯森教授(Carl Kaysen),他盛赞这是一个划时代的计划。凯森发表了专门的可行性报告,指出统一管理不仅能节省运营成本、提高数据的准确性和查询的效率,还将更好地保障数据安全。
听起来有百利而无一弊,中央数据银行的计划得到了行政圈、学术界的一致响应。
经过一年的论证,1966年,联邦政府正式向国会提交了“中央数据银行”的方案,请求拨款、开工,开创新的数据管理篇章。
新闻界也开始报道联邦政府的这个创举。
但没想到,新闻界的报道引起了强烈的社会反弹。这种反弹,最后导致了这个计划的流产。
1967年1月,《纽约时报》发表了著名记者、隐私权专家帕卡德(Vance Packard)的文章《不能告诉计算机》,他写道:
“当政府把我们每一个人的信息和日常生活的细节都装进一个中央级的数据银行,我们将受控于坐在电脑机器前面的那个人和他的按钮。这令人不安,这是一种危险。”
美国公民自由联盟(ACLU)是一个成立于1920年、位于纽约的公益组织,它的目标是利用法律的手段维护公民的权利,隐私权正是ACLU关心的重点。对于中央数据银行的计划,ACLU强烈反对,并发表了一系列的声明和调查。
哈佛大学也对这个计划开展了专门的民调,其调查的结果表明,56%的美国人担心自己的隐私会受到侵害,明确反对这个计划。
一时间,曾经赢得了各方赞誉的数据银行计划在国会的讨论中陷入了泥沼。
此后,美国国会对此召开了一系列的听证会。1968年,众议院隐私委员会发布了一份报告,作出结论说,该计划无法保证公民的隐私不会受到侵害,不予批准。
但这只是一个中断,甚至仅仅只是一个开始。此后的几十年,随着数据库越来越多,类似于“中央数据银行”的计划不断改头换面,在国会发起冲刺。美国各界对其的讨论也从来没有间断过,并形成了泾渭分明的两派。
支持的一派以经济学家和技术专家为主,这个阵营认为,现代经济依赖于大规模的数据整合和交换,统一集成的中央数据库,将提高经济效率,方便大众的生活,是现代社会发展的必然,是社会进步的不二选择。
反对方自然是隐私至上的信奉者。他们认为,在信息时代,无论是个人的日常消费等琐碎小事,还是事关健康、教育的重大决策,都会在各种各样的信息系统当中留下“数据脚印”。这些“数据脚印”,保存在不同的系统中,可能无伤大雅。但如果建立起中央数据银行,通过数据整合和信息加总,就可以再现一个人生活的轨迹和全景,各个系统之间的数据可以彼此印证、互相解释,个人隐私就无所遁形。
隐私学学者认为,这种信息加总和数据整合,无异于一种监控,准确地说,是一种“数据监控”(Dataveillance),其对个人隐私权的侵害,无异于《一九八四》中的电幕。进入大数据时代之后,甚至有专家提出:大数据就是老大哥!(Big Data is Big Brother)
【大变革——之“微学位:教育领域正在发生的革命”】
这个月初,哈佛大学与麻省理工大学共同宣布,将投入6000万美元,开发一个在线教育平台。届时,不仅两个学校的授课过程免费向全世界开放,这个平台本身,也以开源的形式,向其他大学和教育机构免费开放。
而几个月以前,斯坦福大学已经把“在线教育”变成了硅谷最热门的话题。其计算机系的Ng教授,把自己的一门课放到了互联网上,结果全球有十几万人注册,这些人,除了在网上听他的实时讲授,还和斯坦福大学的在校生做同样的作业、接受同样的评分和考试。最后,有几千人完成了这门课程。Ng教授看到了其中的商机,在硅谷拉到了1000多万的投资,成立了在线教育公司Coursera。更早一些,谷歌无人驾驶汽车的发明者、大名鼎鼎的斯坦福教授Thrun,也离职创办了一家在线教育网站Udacity。随着类似的公司如雨后春笋般冒出,普林斯顿大学、加州大学伯克利分校、宾夕法尼亚大学等等知名学府都在近期宣布加盟在线教育,逐步向全世界开放自己的课程。
当然,这也不是大学的专利。我所在的宾夕法尼亚州,从小学到高中,都建立了在线学校,选择参加在线学习的学生,可以免费获得州政府配发的一台笔记本电脑、一台打印机和扫描仪,作为学习的工具。这是因为他放弃了公立学校的学位,节省了公共教育的开支。目前,宾州的在线学校Cyber School,已经招收了几千名中小学生。
之所以获得教育界和投资界的一致青睐,是因为现在的在线教育,已经不仅仅是一个镜头、一段远程录相这么简单,而增加了“互动”、“互助”、“行为评价和诱导”等等新的技术和色彩。例如,师生可以随时对话,计算机能够记录你在一张幻灯片上停留的时间,判别你在答错一道题之后有没有回头复习,统计你在网上提问的次数、参与讨论的多少,然后在这个基础上,对你的学习行为进行诱导和评价。此外,学习者还可以结成互助小组,甚至互相批改、评价对方的作业和报告。哈佛大学和麻省理工学院的新网站还宣布,对于完成一门课程的学生,只要缴纳极少的费用,就可以获得一个认证,这个认证并不是真正的学位。在这个新生事物层出不穷的时代,我们不妨称之为“微学位”。
“微学位”等新概念、新技术的出现,我认为,将给教育领域带来一场革命。它的影响,不仅立竿见影,而且相当深远,会波及整个社会。
1946年,人类发明第一台电子计算机。如果以此为起点,那人类社会进入信息时代已经有半个多世纪。信息时代的特点是信息流动的速度加快、传播的广度加大,信息垂手可得、无处不在。但信息不是知识,信息必须经过加工、组织、整理才能成为知识,即将到来的在线教育浪潮,把系统整理的知识以课程为载体推上了互联网,这将帮助我们在信息时代的基础上再迈进一步,进入真正的知识时代。知识时代的*特点,是知识无所不在、随处可得。
学校,曾经是最重要的教育资源,好的学校,更是稀缺性的资源。由于在线教育的普及,在不远的将来,名校将人人可上,教育资源匮乏的问题将得到缓解。但在线教育对个人的重大意义,还不仅仅是教育机会的增加,更是学习方式的改变。在传统的学校,我们是接受教育,但在网络学校,人人都可以各取所需,随时随地、按照自己的节奏和计划来开展学习。例如,高中生可以尝试体验大学的课程,离开了校园的人,也可以登陆在线空间,再和在校生一起听课。通过在线教育,学习可以成为一个高度个性化的主动建构过程,终身教育也将成为普遍的现实。更多更好的教育资源、主动学习、终身教育,这些都是教育工作者探讨多年、孜孜以求的梦想。
在线教育引发的不仅仅是个人学习的革命,更会改变整个教育行业的生态。其影响大小,一时难下定论,我们不妨通过多问几个问题来催生自己的想象。以大学为例,通过把课程变成一种网络服务,而且公开竞争,越来越产品化,大学作为一个知识传播中心的作用是不是可以发挥得更好?此外,在线教育可以帮助大学突破围墙和座位的限制,名牌大学会不会因此更受追捧、其品牌效应会不会更加突出?还有,一流的大学不惧把自己的课程推上网和全世界的学习者共享,是不是因为它们还有更核心的竞争力?这个竞争力又是什么呢?是不是“创新”?顺着这个思路去想,不难得出结论:真实世界的大学会把更多的时间和精力倾斜到新知识的发现和生产上,而在线教育将承担更多的知识传播功能。
再有,学生和学校的关系是不是也会发生变化?过去,是学生争学校;将来,学校抢学生的现象可能会更加突出。一流的大学将成为一个创新型人才的集聚地,普通的大学可能要通过更好的行政管理和服务来吸引学生。再设想,如果你是用人单位,面对一名持有名牌大学“微学位”的候选人和一名三流大学的毕业生,你最后会雇用谁?“微学位”的产生,会不会引起教育行业一种新的竞争、重新布局、甚至洗牌?
哈佛大学在线教育的负责人认为,目前这场在线教育的浪潮,是印刷术发明之后,教育领域面临的最重大的变革。对中国的教育领域而言,如何合理规划、用好资源,是挑战,但更是福音,这值得我们全社会、特别是*的官员、教育一线的工作者以及企业家的思考、研究和关注。
【建言:中国如何应对大数据时代的挑战】
(四) 政府需要做什么?
一是政府机构、行业组织和大型企业要建立专门的数据治理机构来统筹数据治理的工作,例如数据治理委员会、大数据管理局等,数据治理的重点在于数据定义的一致性和数据的质量。在大数据时代,不同系统之间的数据要进行整合,因此要有统一的元数据定义,这不仅是中国而且是全世界当下都在面临的挑战。各个领域和行业的数据标准制定得好,将会起到事半功倍的效果。就单个企业而言,要认识到,未来的竞争是知识生产率而不是劳动生产率的竞争,数据分析产生的价值可能比较碎片化,分布在商业流程的各个环节,数据挖掘的投资回报也有不确定性,但企业领导必须有眼光,把数据治理的工作尽快统筹起来,为增强企业在大数据时代的竞争力做好准备。此外,数据治理机构的首长应该由组织的高层领导担任,否则标准无法推进到全局,也改善不了整个行业或组织的情况。
二是开放数据。数据增值的关键在于整合,但自由整合的前提是数据的开放。开放数据是指将原始的数据及其相关元数据以可以下载的电子格式放在互联网上,让其他方自由使用。开放数据和公开数据是两个不同的概念,公开是信息层面的,是一条一条的;开放是数据库层面的,是一片一片的。开放也不一定代表免费,企业的数据,可以以收费的形式开放。开放也是有层次的,可以对某个群体、某个组织,也可以对整个社会开放。在大数据的时代,开放数据的意义,不仅仅是满足公民的知情权,更在于让大数据时代最重要的生产资料数据自由地流动起来,以催生创新,推动知识经济和网络经济的发展,促进中国的经济增长由粗放型向精细型转型升级。
三是鼓励、扶持基于数据的创新和创业。政策扶持的传统方法,可能是以政府为主导建立大数据产业园,对新兴企业提供办公场所等便利条件或者现金支持,这固然有效,但更有效的方式是调动全社会的力量。例如,拨款支持大数据开源社区、程序员协会等民间组织的建设,通过扶持类似的民间团体,快速推进新技术、新理念在全社会的传播和普及;再例如,以开放的数据为基础,举办应用程序开发大赛,向全社会征询数据使用、创新的意见,主办方可以是政府,也可以是企业,拿出一定的资金,奖励*秀的应用程序,激发民间蕴藏的创新力量。
四是要在全社会弘扬数据文化。数据文化,是尊重事实、推崇理性、强调精确的文化。要承认,回望历史,中国是个数据文化匮乏的国家,就现状而言,中国数据的公信力弱、质量低,数据定义的一致性差也是不争的事实。这方面,政府应该发挥主导作用,首先在公共领域推行数据治国的理念,要认识到,在大数据时代,公共决策最重要的依据将是系统的数据,而不是个人经验和长官意志,过去深入群众、实地考察的工作方法尽管仍然有效,但对决策而言,系统采集的数据、科学分析的结果更为重要。政府应加大数据治国的舆论宣传,将数据的知识纳入公务员的常规培训体系,力争在全社会形成“用数据来说话、用数据来管理、用数据来决策、用数据来创新”的文化氛围和时代特点。
最后是要围绕个人数据安全,逐步加强隐私立法。任何技术都是双刃剑,大数据也不例外。如何在推动数据开放的同时有效地保护公民隐私,将是大数据时代的一个重大挑战。
新年刚刚拉开序幕,希望中国政府相关部门尽快制定与大数据相关的政策,出台具体的措施,从而抓住历史的机遇、推动中国社会的发展和进步。
2013年,应该成为中国的大数据年。
目录
第三版自序 数据可以治国,还可以强国
序言一 大数据:为华文世界提出一个重要话题/许倬云
序言二 中国的雄心应该拓展到大数据领域/达文波特
【序幕】新总统的第一天
一人一票:把“黑”人送进“白”宫
大国新政:阳光是最好的防腐剂
【上篇】帝国风云:得数据者得天下——美国的成功经验
第一章 历史争战《信息自由法》
1-1.第四股力量:知情权的起点
1-2.国会议员:孤独的战争
1-3.白宫当家人:一个妥协者和机动者
1-4.政府VS. 社会:旧剧情重现新时代
第二章 数据帝国的兴起
2-1.摩尔定律:全世界半个世纪的发展规律
2-2.最小数据集:上升到立法高度的开路先锋
2-3.民意几时有:选票催生的创新
2-4.普适计算:计算机本身将从人们的视线中消失
2-5. “大数据”战略:争夺全世界的下一个前沿
第三章 数据治国
3-1.循“数”管理:平安大道怎样铺
3-2.数据“验”平权:民权史上的碑石
3-3.数据“打”假:*的争议就是福利滥用
3-4.CompStat :街头警察的创新传奇
第四章 商务智能的前世今生
4-1.起源:从数据到知识的挑战和跨越
4-2.结蛹:数据仓库之厚积薄发
4-3.蚕动:联机分析之惊艳
4-4.破茧:数据挖掘之智能生命的产生
4-5.化蝶:数据可视化的华丽上演
【中篇】法则博弈:大数据时代的发展与危机
第五章 帝国的法则
5-1.收集法则:减负,为人民减负
5-2.使用法则:隐私,文明社会的共识
5-3.发布法则:免费,人民已经交税
5-4.管理法则:质量,互联网时代的根本
第六章 《数据质量法》的困局
6-1.产业界“俘虏”政府:数据背后的政经战争
6-2.美式“旋转门”:权、名、利大串场
6-3. “掺沙子”法案:国会对付总统的独门秘器
6-4.环保“风险门”:公共利益常常无人代表
6-5.集体行动的逻辑:人人都想“搭便车”
6-6.三权之歧:什么是真正的“和谐”
第七章 全国隐私风波
7-1.《一九八四》:零隐私的恐惧
7-2.大数据就是“老大哥”:中央数据银行之争
7-3.百年纠结:统一*
7-4.“9·11”大拐点:以反恐的名义向左转
7-5.万维信息触角计划:追踪恐怖分子的“数据脚印”
7-6.6种改变政府的力量:山姆大叔大退让
【下篇】公民故事:公民社会与数据互动之双赢时代
第八章 数据开放运动
8-1.一个新的世界:从软件开源到数据开放
8-2.总统的雄心:公共财政支出透明
8-3.数据民主:印裔首席信息官的崛起
8-4.Data.Gov:从旗舰初航到保“数”运动
8-5.大众创新:航班延误之候机经济学
第九章 试金石:白宫访客记录
9-1.总统在见谁:大医改中的“小”插曲
9-2.全体美国人的房子:白宫
9-3.步步妥协:总统与草根的对决
9-4.从白宫安保到政治监督:执著的公民改变世界
第十章 矿难中的歌声和数据
10-1.集体行动的号角:你站在哪一边
10-2.可以避免的悲剧:数据揭示的全景式真相
10-3.默认公开推定:和矿难赛跑的原则
10-4.唯一的道路:民主时时都要“争”
【外篇】天下趋势:大数据社会未来之世界走向
第十一章 大趋势
11-1.数据权:大不列颠的硕果
11-2.大合流: 国际开放联盟
11-3.云计算:新的航向
11-4.再造互联网:从网页相连到数据相“联”
第十二章 大挑战
12-1.逐鹿政坛:得数据者得天下
12-2.数据竞争:企业赢之道
12-3.下一波浪潮:从大数据到大社会
第十三章 大变革(2.0升级版新增)
13-1.微学位:教育领域正在发生的革命
13-2.大数据:再谈教育领域正在发生的革命
13-3.微学校:三谈教育领域正在发生的革命
尾声 挑战中国:摘下“差不多先生”的文化标签
大事记 20世纪大萧条后美国信息开放、技术创新之路
后记 搭建“大数据”的世界
建言 中国如何应对大数据时代的挑战(升级增补)
访谈 大数据时代的“中国梦”(升级增补)
演讲
大数据、大计算:新经济的土壤(升级增补)
专题
什么是“数据的外部性”?(升级增补)
索引 (升级增补)
七天无理由退货服务
书籍目录:
本店全部为正版图书
作者介绍:
涂子沛,著名信息管理专家,江西吉安人,曾在美国学习、工作多年,2014年12月从美国硅谷回国,出任阿里巴巴集团副总裁。
本科毕业于华中科技大学计算机系,研究生就读于卡内基梅隆大学,获公共管理硕士和信息技术科学硕士学位。赴美留学前,曾在武警部队和公共部门磨砺10年,深刻洞悉中美两国的科技动态和文化理念。作者还先后担任上海真爱梦想基金会理事、中国旅美科技协会副主席等职务,并在国内多所大学有客座教职。
《大数据》这本书在中国社会开大数据之先河,引发了对大数据战略、数据治国和开放数据的讨论,被盛赞“为华文世界开创了一个重要话题”。 作者的另一本著作《数据之巅》,提出当前信息技术的发展,已经让中国获得了后发优势,中国要在大数据时代的全球竞争中胜出,需要把大数据从科技符号提升成为文化符号,在全社会倡导数据文化。
出版社信息:
暂无出版社相关信息,正在全力查找中!
书籍摘录:
暂无相关书籍摘录,正在全力查找中!
在线阅读/听书/购买/PDF下载地址:
在线阅读地址:大数据:正在到来的数据革命[3.0升级版](精装在线阅读
在线听书地址:大数据:正在到来的数据革命[3.0升级版](精装在线收听
在线购买地址:大数据:正在到来的数据革命[3.0升级版](精装在线购买
原文赏析:
之所以要称之为战略,是因为“大数据”之大,并不仅仅在于其“容量之大”。当然,由于数据容量的爆炸,数据的收集、保存、维护以及共享等等任务,都成为具有研究意义的现象和挑战。但“大数据”之“大”,更多的意义在于:人类可以“分析和使用”的数据在大量增加,通过这些数据的交换、整合和分析,人类可以发现新的知识,创造新的价值,带来“大知识“、”大科技“、”大利润“和”大发展“。
数据的激增,意味着人类的记录范围、测量范围和分析范围在不断扩大,知识的边界在不断延伸。
得益于计算机技术和海量数据库的发展,个人在真实世界的活动得到了前所未有的记录,这种记录的粒度很高,频度在不断增加,为社会科学的定量分析提供了极为丰富的数据。
封面
除了上帝,任何人都必须用数据来说话。
数据竞争:数据性则企业兴,数据强则企业强。数据治国:足够多的眼睛,将使所有的错误无所遁形。数据开放:隐瞒政府实情的力量,就是摧毁这个政府的力量。
一个真正的信息社会,首先是一个公民社会。——作者题记
序言一 大数据:为华文世界提出一个重要话题
胡适说中国人习惯于“差不多先生”,凡事马马虎虎、不求精确。黄仁宇先生认为,中国不懂得用数字来管理国家。
在历史上看,不论中国和西方,任何国家发展到可以有一个复杂文官系统管理以后,没有不依照数据来治国。
“老大哥”的影子,可以无处不在。资讯时代,对于极权的掌权者,他们拥有无可比拟的强大工具,甚至于比坦克车和催泪弹更为有效。资讯管理、资讯控制,是无影无踪,又是无所不在。说到这里,我们不能不更警惕。
序言二 中国的雄心应该拓展到大数据领域
大数据之所以产生,是因为今天无处不在的传感器和微处理器。我们正在迈进普适计算时代。
“数据科学家”集黑客和定量分析员的优势和特长于一身,非常短缺。
序幕 新总统的第一天
你对你自己负有使命和责任。 我们个人的命运依赖于群体的命运。 只有你把你自己的战车和其他一些更为伟大的东西绑定到一起的时候,你才能发现你真正的能量。
共和党候选人杰克•瑞安(Jack Ryan) 前妻洁丽•瑞安(Jeri Ryan) 作为参选的政治人物,他不能享有和常人一样的隐私权,文件必须公开。
p007 根本任务,是要改变华盛顿的运行方式,营造一种新的行政文化,重建公众对于美国政府机关的信任。 要建立一个透明的、开放的政府。本届政府的基石是法治和透明。
13489号总统令
第一章 历史争战《信息自由法》
p017 美国社会的第四股力量(fourth Estate)是除了立法、执法和司法三权之外的“新闻和报纸”。
p019 哈罗德•克劳斯(Harold Cross) 《人民的知情权》只...
18世纪,英国著名的政治学家埃德蒙•伯克曾经一针见血地指出:“所有的政府,都是建立在妥协和交换的基础之上。” 他认为,政治的行为,在本质上,是一种妥协和交换。人类政府的历史, 其实是一部各种利益不断妥协与交换的历史,也只有在不断的妥协与交换中, 各种利益才可能获得相对的平衡。他继而指出,其实“人类所有的收益和快乐、 所有的美德、所有明智的行为”,无一不是妥协和交换。
对于这种妥协,美国的总统们并不忌讳。艾森豪威尔就曾经坦言说: “一提到中间路线,人们就认为这是不可以接受的。事实上,人类所有的大数问题,除了道德,都处在中间的灰色地带。事情并不是非黑即白。我们总是要妥协的。马路的中间才是全部可以使用的区域,最左边和最右边,都是沟渠等危险地带。”
“一个好的数据结构和一个糟糕的代码比一个糟糕的数据结构和好的代码要强的多。”
——埃里克,雷蒙 美画软件开源运动的领导者,1999年
中间选民理论
该理论实在1940年代提出的。在选举中,所有的选民都有自己的个人偏好,这个偏好对应于平面坐标上的一点,全部选民的偏好将呈正太分布,也就是一个钟型曲线,这个曲线就是民意分布图。
每个选民最终都会把自己的选票投给与自己意见最接近的候选人。在多个候选人竞争的情况下,候选人想要胜出,就要争取最多的选票,他就必须找准民意最集中的地方,为最多的民众说话,这一点,就是民意的“中值”。
从政治学的意义上来说,组织起来的少数就是政治上的多数。-----杰斯 杰克逊 美国非裔民权活动家
“政府俘虏理论”,即斯蒂格勒所指出的政府监管部门最终会被产业界俘虏,其监管标准也会被商家所左右。
............公共利益的代表缺位,是人类社会发展中的困局,每一个社会都难以避免。
.........当集体越小,利益冲突越激烈的时候,越容易联合;当集体越大,利益冲突并不明显的时候,越难联合。
早在2000多年前,亚里士多德就观察到:
“凡是属于最多数人的公共事务,却常常受到最少人的照顾。人们关怀着自己的所有,而忽视公共事务;对于公共的一切,他至多只留心到其中和他个人有些相关的事物。”
奥尔森的理论其实也很好地解释了专制制度为什么能在一些国家长期存在。
专制者将一个国家大部分人的一部分权力和自由都剥夺了、抹杀了,大家都憎恶专制,但在一定时间、一定程度内,却很少有人反抗。为什么?这是因为,通过反抗,即使能推翻专制制度,其结果是所有人都受益,但出头冒尖的人却可能要付出极大的代价。人的自利天性,使大部分人都选择了沉默,并把希冀的目光投向他人。
专制者当然也懂得这个道理,他在维护专制的同时,会不遗余力的打击出头冒尖的反抗者,杀鸡儆猴,全力瓦解一切可能发生的集体行动。
但是,奥尔森还是看到了文明的力量。他认为,公共利益的代表缺位、专制社会的困境,最终是可以打破的。
答案是:一个集体、一个社会,要建立合适的激励机制,奖励那些为共同利益做贡献的个人,惩罚那些没有承担集体行动成本的“搭便车者”,从而营造关心公共利益的社会文化和运行机制。
更重要的是,一个社会必须有完善的利益代表机制。.......有两个关键。
一是授权制度。........当一个代表接受了一个群体的权利让渡之后,他就可能上升到职业化的高度、提出专业化的意见,他所代表的人群也就成了一个利益相关的集...
其它内容:
书籍介绍
《大数据》3.0升级精装版,增加作者自序,以及归国以来的演讲、专题——数据是我们新经济的土壤,是我们未来智能社会的土壤,数据可以治国,还可以强国。
美国第一,中国第几?公布官员财产美国是怎么做的,美国能让少数人腐败起来吗?美国式上访是怎么回事?凭什么美国矿难那么少?全民医改美国做得到吗?美国总统大选有什么利器才能赢?下一轮全球洗牌我们世界工厂会被淘汰吗?……
除了上帝,任何人都必须用数据来说话。
大数据浪潮,汹涌来袭,与互联网的发明一样,这绝不仅仅是信息技术领域的革命,更是在全球范围启动透明政府、加速企业创新、引领社会变革的利器。现代管理学之父德鲁克有言,预测未来最好的方法,就是去创造未来。而“大数据战略”,则是当下领航全球的先机。
大数据,这一世界大潮的来龙去脉如何?数据技术变革,何以能推动政府信息公开、透明和社会公正?何以促发行政管理和商业管理革新,并创造无限商机?又何以既便利又危及我们每个人的生活?Google、百度之类搜索服务,何以会不再有立足之地?引领世界的数据帝国——美国和西欧,正在如何应对大数据时代?我们中国,又当如何作为?
本书通过讲述美国半个多世纪信息开放、技术创新的历史,以别开生面的经典案例——奥巴马建设“前所未有的开放政府”的雄心、公共财政透明的曲折、《数据质量法》背后的隐情、全民医改法案的波澜、统一身份证的百年纠结、隐私危机、街头警察的创新传奇、美国矿难的悲情历史、商务智能的前世今生、数据开放运动的全球兴起,以及云计算、Facebook和推特等社交媒体、Web3.0与下一代互联网的未来图景等等,为您一一细解,数据创新给公民、政府、社会带来的种种挑战和变革。
美国是全书主体,但又处处反观中国当下的现实。回望中国,胡适批评“差不多先生”,黄仁宇求索“数目字管理”,作者从太平洋对面看到中美两国的差距,深知中国缺少什么、需要什么,故将十多年观察、思索所得,又新增微学校、微学位等教育领域正在发生的革命,以及建言中国“大数据战略”的重要文章和访谈,淘洗成这本开创性的“大数据之书”——《大数据:正在到来的数据革命,以及它如何改变政府、商业与我们的生活》。
网站评分
书籍多样性:9分
书籍信息完全性:9分
网站更新速度:8分
使用便利性:8分
书籍清晰度:5分
书籍格式兼容性:4分
是否包含广告:7分
加载速度:6分
安全性:9分
稳定性:5分
搜索功能:6分
下载便捷性:5分
下载点评
- epub(595+)
- 引人入胜(503+)
- 值得购买(436+)
- txt(664+)
- 一般般(430+)
- 不亏(135+)
- 实惠(620+)
- 全格式(252+)
- 超值(675+)
- 博大精深(373+)
下载评价
- 网友 车***波:
很好,下载出来的内容没有乱码。
- 网友 郗***兰:
网站体验不错
- 网友 扈***洁:
还不错啊,挺好
- 网友 曾***玉:
直接选择epub/azw3/mobi就可以了,然后导入微信读书,体验百分百!!!
- 网友 邱***洋:
不错,支持的格式很多
- 网友 养***秋:
我是新来的考古学家
- 网友 温***欣:
可以可以可以
- 网友 寿***芳:
可以在线转化哦
- 网友 曹***雯:
为什么许多书都找不到?
- 网友 相***儿:
你要的这里都能找到哦!!!
- 网友 戈***玉:
特别棒
喜欢"大数据:正在到来的数据革命[3.0升级版](精装"的人也看了
药学综合知识与技能(2023国家执业药师职业资格考试全真模拟试卷)【新华集团自营】 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
即将逝去的生活:汤溪百工口述实录 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
2020全国硕士研究生入学考试临床医学综合能力(西医)(西医综合)历年考卷精解正版 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
拳击 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
WTO与中国经济的案例研究(第1辑) 上海人民出版社 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
象棋残局攻杀技巧 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
有限理性与行为经济学 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
网管员必读 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
世纪商务英语(外贸函电英语新世纪高职高专商务英语类课程规划教材) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
邮票上的国际象棋 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 人间事都付与流风—我的祖父周立波 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 海外直订Hawks Nest Lake Safety Book: The Essential Lake Safety Guide For Children 鹰巢湖安全手册:儿童基本湖安全指南 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 英语专业八级听力 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 结构稳定理论 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 古筝考级曲目大全(中、高级 7~10级) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 货币立法论(英文原版) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 校园爆笑王:阿U(6 升级版) 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 汽车维修工考证技能培训教程(中级)/“十三五”职业教育规划教材 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 黑鹤动物小说系列——驯鹿六季 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
- 机器猫 哆啦A梦20 下载 pdf 百度网盘 epub 免费 2025 电子版 mobi 在线
书籍真实打分
故事情节:6分
人物塑造:7分
主题深度:6分
文字风格:6分
语言运用:7分
文笔流畅:7分
思想传递:3分
知识深度:8分
知识广度:9分
实用性:7分
章节划分:8分
结构布局:8分
新颖与独特:4分
情感共鸣:3分
引人入胜:3分
现实相关:8分
沉浸感:9分
事实准确性:6分
文化贡献:6分