近两年年来,大数据成为计算、信息、投资领域最热门的话题,而正在迅速发展的云计算则为大数据提供了一个大规模,更方便的计算平台。
那么何为大数据?简单地说,我们对大规模各种各样海量数据进行“冶炼”从数据中发现相关知识,成为我们对未来预测、判断、决策的依据,它的数据基础在于企业、社会大量累积,它的技术基础在于我们这些年来已经运用的和实践的各种算法,尤其是互联网企业的算法与软件模型。这样说还是让人摸不着头脑,很难说清大数据的对我们到底发生哪些影响。让我们通过几个例子来说明大数据所产生的重大意义。
苹果公司的前总裁乔布斯人们都知道,他是苹果公司的创始人,也是世界上第一台个人计算机即我们现在俗称的“电脑”发明人之一,但人们不知道的是乔布斯是世界上第一个把自身所有的DNA和癌症DNA进行排序的人,乔布斯曾经开玩笑说说“我要么是第一个通过这种方式战胜癌症的人,要么我是最后一个因这种方式而死于癌症的人”。虽然乔布斯最后仍然还是死于胰腺癌,但是他却因运用了这种获得所有DNA数据进行排序来预判癌症病情发展变化进行治疗后又多活了五年。这种方法现在我们已经知道了,这是一种大数据收集分析预测的方法。不像以前只是随机地提取几十份或者几百份DNA样本来进行分析,而是要尽可能地收集到所有的DNA数据,包括有用的或者无用的一切数据甚至包括错误的数据。
另一个例子,2009年世界上开始流行一种新型的流感病毒,这种流感病本身是甲型H1N1病毒,然而却因结合了禽流感和猪流感病毒产生变异了。当时还没有预防这种病毒的疫苗,在短短几周内迅速地传播开来。联合国疾病卫生组织担心一场大规模的流行疾病即将袭卷全球。
然而就在这种变异的流感暴发的前几周,美国的《自然》杂志上曾经有人发表过一篇祥细讨论这种流感病毒的论文,而在当时这种流感病毒各国流行病防疫机构还没接到过一个病例报告。更令人感到诧异的是,发表这篇论文不是医生也不是流行病防疫专家,而是美国的互联网巨头谷歌公司的工程师们,他们在文中解释了为什么谷歌公司能预测2009年冬季会发生H1N1变异流感病毒的传播,这是因为谷歌公司是通过观察人们在网上的搜索相关寻医问药和有关感冒发热和咳嗽的搜索记录来完成这个预测的。这种搜索记录以前一直是被忽略的,而谷歌却保存了多年来所有的人们在网上的搜索记录。而且每天还会收集到网上全球超过30亿条搜索指令,如此庞大数据资源足以支撑和帮助谷歌完成这项分析和预测。
谷歌把所有数据进行了筛选之后一共处理4.5亿条数据,再与2007年、2008年美国疾控中心实际流感病例数据进行对比,最后准确地推断出这种流感最早从哪地区开始传播开来的,为当时搞得措手不及的联合国疾病卫生组织和各国的流行病防御机构,提供了有巨大参考价值的防疫信息。
实际上在中国也同样有运用大数据收集分析预测的成功例子。2008年阿里巴巴公司总裁马云用他的公司自己研发的软件“淘宝魔方”对数亿条各类交易信息进行分析最后准确地预测出2008年-2010年中国经济将发生巨大变化,国家经济将呈下行趋势而银行的银根将会大幅度收紧。于是马云迅速对公司做出了战略性调,首先把在香港上市的公司以保本的股价回购进行私有化操作,最后退出香港股市。然后用较高价格把雅虎手中持有的支付宝公司的股收购回笼,在此期间为回购支付股份还曾与雅虎发生许多争吵。但最后还是如期回购成功并把支付宝归并杭州的阿里巴巴公司旗下。由于马云较早对公司运营策略作了调整,使后来的阿里巴巴公司在国内经济真的很大发生变化时,避免了阿里巴巴公司将可能发生困难。
当然,在国内还不只是马云一个运用大数据进行分析预测,还有一个人也是成功运用大数据分析测的,这个人曾经国内家喻户晓的演员,后来步入了导演行列当了导演,成为演、导两栖明星。这个人就是赵薇。她曾用小成本亲自导演了一部电影《致我们终将逝去的青春》公演后票房收入竟高达2.2亿元人民币,是目前小成本高票房的少数几部电影最成功的典范。这电影是采用网络小说改编的。
其实赵薇在最初准备筹拍电影时,对拍什么题材,改编成什么样的剧本心里并没有底。有人建议她还是先研究电影市场,于是她请了数据分析方面的行家,利用网络信息和云信息处理,收集了大约上亿条网络信息,进行分析预测,得到当前多数观众对电影审美情趣和口味。然后根据这个预测,来选择准备拍撮的电影题材。此时赵薇对准备拍什么题材的电影,心里已经有底了,赵薇决定从网络上来选择最受中青年热捧的小说来改编成电影剧本。经过筛选最后选中同名网络小说。结果一举大获成功,当然赵薇绝对没有想到票房收入会高达2.2亿这个记录,毕竟她是一个小成本电影,所请的演员没有一个是名演员,而她当初心里打算只要不亏本就算成功了。2.2亿的票房当然是意料之外的惊人收获。
2013年3月美国白宫奥巴马政府把“大数据战略”上升为最高国策。认为大数是未来的“新石油”,将对数据控制和占有作为陆权、海权、空权之外的另一种国家核心能力,美国出于对世界政治、经济占主导地位需要和反恐的需要,更希望大数据对美国能做出更大贡献。基于美国对互联网资源优势和网络技术优势。美国目前具备了对全球的大数据收集能力、监控能力和分析预测能力。
就在美国政府提出大数据战略不久,2012年8月中国在北京香山召开了科学技术会议这是中国第一个以大数据为主题的重大科技会议,随即计算机学会、通信学会分别成立了大数据专家委员会在这场呼欲来的产业革命中,中国没有落在世界的后面,事实上世界绝大多数国家都没有准备好迎接这场突然到来的产业革命。而中国以自己独特的政治制度,允许我们在世界上以不可想象尺度“办大事”,“办好事”。
大数据在中国的研究与实践不仅对中国的政治和经济,同样也对军事和科技以及整个综合国力发展有着重大意义。中国在这个领域理论与实践均刚刚起步,如果我们下大力气,从实践到理论,再从理论到实践来抓起,有可能参与推动甚至领导世界此行业的发展。对正在建设一个创新型国家的中国来说,无疑是历史的机遇。
(来源:互联网生活)
【欢迎转载 请注明来源】