六九小说网

六九小说网>大数据时代官网 > 第九章 大数据带来大应用(第3页)

第九章 大数据带来大应用(第3页)

大数据时代的互联网面临的问题

2013年8月13日召开的中国互联网大会上,中国互联网协会理事长、中国工程院院士邬贺铨从大数据、云计算、移动互联网三个角度分享了大数据时代的互联网面临三个问题:

第一个问题:互联网生产大数据

现如今每个城市都装有摄像头,这些摄像头在一个小时里会产生很多的数据,数据达到数百个TB,所以这个数据非常大。我们所熟知的波音飞机,每个飞行来回都会产生大量的数据。每几毫秒都就会产生一个数据,中国联通整理了一个月的用户上网记录,一个月就产生了一万多条,这一万条对应的数据量是几百个TB。医疗也是一个大数据,人们看医院的病例可以看到,医疗数据一个大脑的CT扫描图要让它分辨率很高,微米的数据量产生是4。5TB的数据。现在像北京大学301医院门诊量一万人,同时按照医疗规定一个患者的数据要保存50年。这将是一个十分庞大的数据。

淘宝网在”双十一“的时候每分钟都会产生几十个TB的数据,腾讯每天也会产生大量的数据。美国的计算机中心的72小时视频监控,网速达到720TB每秒,这相当于全世界有6亿人同时看不同的高清电影所产生的数据。2016年全世界互联网三分钟传播了300万小时的视频,这需要我们34年不吃饭不睡觉才可以看完这些视频。

现在全世界新产生的数据量每年增加14%左右,也就是说互联网每两年翻一番。2012年和2013年互联网所产生的流量相当于人类有意识以来,一直到2011年所产生的数据量总和,两年等于一万年。2011年全世界互联网总量1。8个GB。到了2020年全世界的数据将达到40个GB。这个重量相当于多少,相当于424艘美国的尼美兹号航母。

第二问题:大数据变革互联网

首先,大数据出现对互联网有很大的影响。有一种方式是演进型的,如果不考虑和互联网兼容那么还有一种方式是革命性。这两种方式各有各得好处。现在很难说哪一种更能解决当下的问题,总得来说我们希望互联网更加安全、可信。我们现在所提到的方式是物理和逻辑分离,物理上有71个,和逻辑上分割办法对应不同服务,有视频的服务,数据服务,不同服务要求的服务质量是不一样的,所以物理上是一个网络,逻辑上可以组成不同网络,我们需要把网络虚拟化,物理和逻辑分离。

其次,传统路由器,有传送功能,也有控制功能,有业务功能,大数据出现我们发现网络上时空不对应,很难判断哪个地方流量最高,目前来说只能把路由器网络控制功能抽出来,形成一个网络控制系统,把业务功能抽出来形成业务系统。灵活实现控制平面的建构,对于大数据流量是一种改型。随着流量增大,大部分流量过路多,落地少,凡是在光强上做的,就别在电厂做,凡是在IP上可以做的就不再IPO上做。IPO总召唤转变为承载,这只是一个包装,不是做一个召唤的功能了。召唤我们应该将来向召唤中心,要从承载分开。另外就是传统互联网IP地址表示主机的身份这个很正常,移动互联网的出现这个计算机从这到这里,位置变了,用户的身份没有变。身份和位置分离,身份在应用层面表示,这样分离好处支持移动性改变安全性。

现如今世界所有的数据中心一半多以上都是云计算中心,都是大容量的。云中心一般放在什么地方最安全?考虑到气候、能源工业等因素,所以云计算中心会向高纬度地区集中,比如说中国的云计算中心往内蒙一些凉快的地方迁徙,谷歌把他云计算中心放在摩洛哥,因为那比较凉快。数据中心大部分在北京、上海、广州,而未来数据中心会放在内蒙偏远的地方,将来云计算的出现会把用户以信息源为中心,向以能源为中心改变,中心节点发生变化。过去是以上海、北京、广州为中心,现在随着大数据出现发现了不能这样做,我们需要增加这个数据和中心。

1。全世界看来峰值

国际流量增加3%,这个绝对值国际流量增加,相对值就是说拉丁美洲的用户到美国访问量占整个国家的流量比较,亚洲、欧洲、和非洲的。尽管国际流量增加,但是国际流量占整个流量比例是下降的,直接互联导致全国互联网去中心化。现在谷歌纷纷在中国香港等等地方上节点,这时候对外的访问没必要跨洋过海到美国去访问,你可以在本地,这个意义上国际互连网流量比例在下降,所以说全球互联网去中心化。另外大数据区域网络扁平化,比如中国电信,现在随着大数据出现所有省之间都直连,不这样安排根本没有办法支持这么大的流量。还有城域网的体系化,大计算机大的主机,很时髦客户服务器,所有客户访问网络都到服务器上,一个热门的结果这个服务器要传送无数遍给终端,每个终端需要在热门的地方下载一小部分,另外一个终端小在另外一小部分互相交换。这样就形成了P2P。这个终端访问服务器数据量很大,不是一个服务器装得下的,你可能只访问一次,但是服务器的交换很多,基本以上服务器之间在增长,进一步发展服务器增长变成云了。

2。内容分配网络化

为了让用户更好更快接受,要做内容分配网。电信运营商在靠近用户的地方建了很多,这样适应大家更快访问视频,的部署对互联网流量流向产生了影响,我国国际互连网占的比例的比较低的,互联网之间的流量比例也是很低的,绝对值增加,但是本地化的访问更多了,远端的访问降下来了。

移动网络一样,过去电话走电流交换,原来有基站,激战控制器网关。还有移动通讯天线分布化,据资料显示,2009年我国移动通讯所有呼叫中,发生在室内是63%,家里占29%,办公室占14%,越是大数据时代这个比例越来越高,室内转到WIFI,WIFI多了互相干扰,使用小蜂窝的技术,可以范围很小,损耗很小,因此调试率可以增加。一个蜂窝分成多个分布式的天线,这样有些蜂窝加上基站,但是蜂窝之间是统筹的,干扰统筹来解决数据量的传输问题。

从互联网到移动互联网将带来很大变化。互联网原来面向有线,由此用TC和IP没有问题。可是移动互联网的无线电路不可靠,如果继续用TCPR老同选,因此需要加入纠错编码,互联网面向PC端的,移动互联网自动检测网络的带宽和分辨。在传统电话话音传一百米到六百米,需要传一笔先令。

IBM从互联网新闻上PMI,一般PMI是代表政府的。美国印地安纳大学的学者,与谷歌提供情报,从用户尽千万留言算道琼斯指数准确率到87%,淘宝的CPI和国家统计的CPI不一样,但是淘宝的CPI更能反映物价的变动。国家统计局的CPI主要参数是食品,经济好与不好除非太差人们才会把食品开支省下来,否则谁会省吃饭的钱,淘宝的交易主要是服装和首饰,如果经济不好就会反映出来,所以首长到淘宝看了一下说你们每天把这个数据送到中南海。大数据提供咨询服务,我们到超市买东西,到超市买东西都打出条来,超市可以根据这个调配货物。哪些客户是最好买东西的客户,女性顾客最能舍得出买东西,女性里面孕妇,找出一些孕妇最常买的产品,没有刺激性的化妆品,关注一些婴儿东西等等,他判断这个是婴儿会把信息推送给他。有一家家里有一个上初中的女孩子,超市把孕妇东西送到他们家,招来一顿臭骂,结果过了几天,那家人又道歉了说他误会这家公司了,因为他女儿意外怀孕了。

人人网通过客户关系的分析,游戏业务取得100%的增长。我们在淘宝上买东西阿里公司把你的IP地址记下来,买首饰的用户IP地址,买化妆品的用户IP地址,买服装的IP地址,拿出来让卖化妆品和服装人竞价来购买这个IP地址。也就是阿里和商家网店都可以赚钱。百度搜索排名优先推荐,央视广告效果谁知道怎么样?央视2012年的广告收入269亿人民币,百度广告收入229亿人民币,百度广告连增加百分之五十多,央视才增加百分之十几,央视这才发现百度才是央视的竞争对手。

第三个问题:推动视频与互联网的融合

乐视网买到甄环传的网络播出独家权,搜狐视频拿下了中国好声音的版权,这就是大数据带来的好处。大数据提供集资服务,如果企业经济有压力,压力根据中小企业在平台上的表现,选出放心的中小企业,放贷一千多个亿,坏账率只有1。3%。2013年7月份统计阿里靠贷款每天利息一百万,京东收购了网民在线,从信用卡分期贷款,你在京东买东西留地址什么,他提供贷款。国美建立小贷公司解决贷款问题,他为了他的营销创造很好的条件。

上面说的是互联网企业进入金融,那么金融企业也不能坐以待毙,平安保险跟百度合作,涵盖保险银行投资,利用大数据分析消费者在网络的消费情况。中信银行使营销模式陪送从2周缩短到两天,客户开发率提高30%。互联网企业进入金融迫使金融企业加快互联网化。

银行业进入电商,过去银行业不做电子商务,现在平安银行做电子商务,把握客户偏好本身习惯包括风险,搞了平安好车网,到这个网上告诉你什么车型什么比较,4S店服务怎么样。同时它做金融不能只提供这个,涉及贷款、租赁二手车抵押这一块,建行、招行、民生银行等等统统往电子商务发展。又如北京的一卡通,如果把数据收集起来就可以知道北京有多少人从哪里换车,每天怎么流向,现今在中国很多地方有数据的不挖掘,能挖掘的地方没有数据。所以要把生活和网络结合起来。

每年赶到国庆的时候,很多人在之前就会在网上搜索游览的地方,还有酒店,私家车的路线,根据你搜索我们就可以知道哪个旅游点最热,那条路会堵,到了国庆的时候就可以提前知道,我们可以用微信短信研究发生的热点。百度成立了定位事业部,以地图为载体,覆盖到餐饮、KTV、上商场等。阿里有保护中心,在移动端加强与高德地图合作。腾讯推出会员卡,加上财富通和搜搜地图,线上线下本地化营销你可以看到现在所有网络都会和地图相结合。和位置结合,和本地生活结合。大数据提供医疗这个同时谷歌判断每个一个城市产生流感,一旦这个地方有流感,网民会搜索自己这个症状是不是流感,到哪个医院治好,谷歌跟这些判断哪个地方有流感,这个可以体现预测到。

我们利用短信、微博、微信知道收集热点和舆情,又如腾讯对每个用户都建档案。一个老头注册的时候说是18岁少女,无论用什么假名在网上时间长了一定露出本性,就可以知道他是是男的,女的,老的,少的,还是神经病。如果公安局要查神经病腾讯可以提供一堆神经病的IP地址。美国大西洋周刊报道纽约一对夫妇,男的搜索高压锅夫人搜索包,结果搜出六个人要造炸弹。

洛杉矶可以告诉你今天哪个街区会犯罪,今天是哪个地方多就巡逻那个地方,其他不怎么巡逻,发现大大节警力而且犯罪率下降。

计算机进一步发展就是微软比尔·盖茨,他要对全世界员工讲话,现在只要找到一张比尔·盖茨照片把比尔·盖茨声音传过来,动嘴巴,口形和表情对应。再如让这计算机看一个猫,我看完以后让计算机看两万张没有看过的照片,找到猫的概率达到15。8%。

有一个大学教授搞人脸识别系统,你不要随便应答我就知道你是张三还是李四。人们在街上看到某个人带着不像是这个人的小孩,拍张照片送到百度网站对比,如果对比率达到100%,百度就会通知家长来认。手机都有摄像头,你只要一点手机就可以打开了。你现在相亲,长多高多富都很难弄,他说我希望这个女的长的多漂亮,选一个你认为漂亮的女生一对脸,在网站找一个差不多的提供给你就可以了。

现在互联网企业当轻运营商,我们可以看到互联网现在企业除了管道需要运营商,现在其他东西都不需要依靠运营商都需要独立判断。公安局有微信公众号,招商银行也有,这些都可以很好的各种各样的增值服务都可以出现。电信运营商开展互联网活动,银行做电商互联网企业做金融,阿里控制电商的入口,腾讯主刀线交入口,他们希望向对方业务拓展,固定想做移动,移动想做固定,广播做电信,电信想做广播,运营的卖手机,手机的想做运营,现在很难区分大家的业务。我们看到自留地要种,别的也要搞,现在整个是浑浊了。电商和搜索会产生新的业态。

互联网产生大数据,移动互联网和物联网进一步推动数据的暴涨,网络中心体现去中心化,大数据促进了信息融合和产业跨界结合,大数据引发更多新业态出现,大数据对互联网发展是机遇也是挑战,是对我们国家互联网创新能力的一次大考。

完结热门小说推荐

最新标签