在2012年,大数据才逐渐被中国产业界所接受和关注,但业界普遍认为2013年是中国“大数据元年”,未来三年大数据市场都将呈爆发式增长态势。赛迪顾问统计数据显示,2012年我国大数据市场规模为4。5亿元,同比增长40。6%;而预计到2016年,大数据行业规模将突破百亿元。
成立于2006年的AdMaster致力于通过技术驱动的平台为广告主提供数据应用服务。目前,AdMaster服务于快消、IT、汽车等多个行业80%的世界100强品牌及众多国内知名品牌,占超过50%的市场份额。同时,也在推动行业发展和变革中不断努力。例如,AdMaster作为主要技术支持协助MMA(中国无线营销联盟)发布了国内第一个开源的MobileSDK解决方案,统一了国内移动营销的监测机制。
“在三四年前,手机刚刚出来的时候,我们就在做跨多屏数据应用模型,如何完成跨电视和PC、手机和PC、手机和电视等跨多屏营销的分析和优化?比如看电视的时候同时玩手机,会不会降低对电视节目的认知?消费者多屏的使用习惯如何?哪些屏幕在哪些时间的品牌传播效果最好?与之相关的,我们已经做了很多的研究,我们也是国内第一个实现跨多屏评估和优化的数据应用公司。跨屏数据的应用是AdMaster数据应用的一部分,AdMaster的数据应用主要还包括广告数据、社交媒体数据、品牌电商数据,以及把前端广告数据、社交媒体数据及后端品牌电商数据整体打通分析和应用的全流程数据应用服务。目前,这在国内也是只有AdMaster的技术才可以实现的。”洪倍说。
四、行行都爱大数据
传统的广告,不能优化,不能控频,也就是比较盲目的粗放的投放,而不是精准的投放。在洪倍看来,传统媒体也在面临转型。首先,传统媒体要开始数字化,比如电视;其次,很多的传统媒体,主要都是以内容为核心出发的,读者可能喜欢什么样的话题,喜欢什么类型新闻专题,他们就做什么。然而,数字营销的精准性体现在它开始以人为本,营销方式从内容购买转化为目标人群购买,这些都无法离开大数据的支持。
同样,传统媒体的转型,它们的广告营销也需要大数据的支持。“传统媒体转型比较突出的就是上海澎湃。它通过监测微博上的舆情,发现某个事情最近会成为一个热点,于是做一个专题,深究一下这个事情背后的故事。通过这种方式,能够把人们吸引回来。”洪倍举例说。
洪倍告诉我们,小到“以最合适价格和时机购买衣服”,大到“重要的经济决策中如何提高经济效益”,大数据都会告诉你最佳答案。“它提供了一种更便捷的生活方式,比如物流中的一些大数据优化,能够让消费者更快速地收到货。例如一号店、京东,它们的物流其实就是大数据分析出来的最优的配送的方案。”
大数据的渗透力极强。从本质上讲,各行各业都已经在数据化了,比如电信业正在变成电信数据业,金融业变成金融数据业,医疗业也变成医疗数据业……这也就意味着,大数据挖掘将成为各行各业的必修课。
确实,如果我们把大数据的价值仅仅理解为可以更精准地向用户推送广告就太为狭隘了。
“与人脑总是喜欢问‘为什么’相比,大数据会直接告诉你‘是什么’。”洪倍举例说,冬天,人们总是被告知要记得戴帽子和手套,否则就会着凉,这是人脑的思维。但大数据分析会告诉你,着凉可能是病毒的问题,跟戴不戴手套和帽子没有很直接的关系。再如,到餐馆吃饭,第二天生病了,人脑的思维马上会用可能吃坏了东西这样的理由来解释,但从数据统计学角度,生病还有可能与有细菌的手握手导致的。“如果有了大数据,就可以让脑子慢下来,不用去推测原因,直接回答结果。”
“大数据”时代刚刚开始,留给人们的想象空间还很大。
大数据记录了一切
提起大数据,很多人都感觉略知一二;但大数据到底是什么,又很少有人能解释清楚。2014年两会期间,包括小米科技创始人雷军、联想集团董事长杨元庆、科大讯飞董事长刘庆峰在内的多位代表、委员都提出了与大数据相关的建议和提案,他们一方面希望从国家层面推动大数据的发展,另一方面也对它在信息安全方面可能存在的隐患提出了警示。
一、大数据记录了所有一切
一份调查显示,2013年我国产生的数据总量超过0。8ZB,相当于2009年全球的数据总量;而到2020年,一个普通中国家庭每年产生的数据量,将相当于半个国家图书馆的信息储量。
中国电子学会秘书长徐晓兰委员指出,海量的信息储存和挖掘,既是大数据的价值所在,也是它有别于传统互联网、可能对信息安全带来的新隐患。
“大数据时代,记录了很多以往根本不可能或者不需要记录的数据,比如微博、朋友圈的内容,上网产生的cookie,家庭水电气使用的情况,汽车和大型设备上安装的传感器拿到的数据等。”社交数据分析公司独到科技的CEO张文浩说,“如果这些信息都是‘孤岛’,影响可能不大。但一旦相互关联,影响力会大得惊人”。
中科院信息工程所所长田静委员也表示,以往碎片化的数据只是盲人摸象,但现在这些碎片全都被存贮起来,通过相关性分析拼凑,“就知道象到底长什么样了”。
技术上的差距,也造成了大数据暂时的“不安全”。
“没有自己的分析能力,我们怎么能搞清楚哪些数据是需要保护的?”
对于田静的这个“问题”,国家信息化专家咨询委员会副主任、中国工程院院士邬贺铨提供的一组数据给出了答案。数据中,大约有一半是应该保护的,但我们现在真正保护的“只有一半的一半”,很多数据在有意或无意当中被获取,“如果这些数据整合起来,被某些别有用心的人利用,会对安全造成很大的影响”。
徐晓兰介绍,目前我国很多机构和企业使用的大数据分析软件都是国外厂商生产的,特别是近几年视频等多媒体数据爆炸性增长,“这些数据都是异构化的,这部分软件是我们的短板”。
著名军事专家尹卓委员则指出,现在互联网所使用的服务器大都放在美国,“自己没有服务器怎么可能安全?”
另一方面,在田静看来,缺乏大数据环境下的安全理念也是重要原因之一。“过去认为无害的信息,在数据爆炸的今天,已经完全不一样了。观念不改,是没有秘密可保的。”
张文浩也认为,国人缺乏这方面的意识。“在美国,很多人都会要求不公开自己的隐私,或者主动把自己的数据提供给某些特定的机构使用;但在国内几乎没有听到过,大家也不知道什么类型的数据可能会有多大的风险。”
二、大数据或许也很“危险”
张文浩认为,很多人对于大数据的理解都只注意到数据的体量和统计,“其实,通过深度分析,从纷繁的数据中抽象出规则和原理,并实现对未来的前瞻性预测,才是大数据真正的价值和魅力所在”。
因为大数据,奥巴马在2012年成为过去70年来,第一位在失业率高达7。4%的情况下成功连任的美国总统;因为大数据,Target超市“预测”了18岁少女的怀孕……
任何一项新技术的背后,都可能悬挂着一把达摩克利斯之剑。大数据也是如此,在人们惊叹于它的“神力”之时,“威胁”也正悄悄逼近。
“前两年,国外一家情报搜集机构利用国内某机构人员公开发表的数据和资讯,进行深度挖掘分析,生成了有价值的情报。”徐晓兰告诉记者,后来经过详细调查,确认情报确实不是该人员提供,而生成情报的那些数据本身也是可公开的。“这在以往几乎是不可能的,也给我们敲响了警钟。”
尹卓以战时的交通流量信息举例说,如果不注重数据的安全使用,将可能对国家安全带来隐患。“科索沃战争中,南联盟的油料库虽然隐蔽得很好,但美国军方通过对卫星图中的交通流量进行分析,划定了大量油罐车经常出没的区域,再进行精确搜寻,从而一举炸毁。”
如果您认为这些“危险因素”离自己很远,那就大错特错了。
“现在很多智能手机的应用都要求访问通讯录,”邬贺铨说,很多人觉得自己没有什么秘密,就同意了。“但实际上,这不仅会透露自己的大量信息,也会把很多人置于隐私暴露的危险之下。”
张文浩也指出,现在很多年轻人都有用手机发微博或者“签到”的习惯,“这样其实会泄漏自己的很多信息。比如你白天经常签到的位置就很有可能是你的单位,傍晚以后签的多半是自己家”。
三、大数据正经历成长的烦恼
“要想征服数据,只有更好地利用它们。”张文浩说,数据是一种资源和财富,积累越多,产生的效力也会越大。