BOB半岛体育什么是大数据 举例说明一下可以吗
BOB半岛体育大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据(big data)目前已然成为IT行业中最时髦的词汇,然而真正了解大数据的人却不多。大数据的含义可不是仅仅数据量大,很多人对大数据的概念有所误解,想要从概念上把大数据讲清楚就得从理论上讲大数据的特征,比如4V(数据体量巨大Volume、数据类型繁多Variety、价值密度低Value、处理速度快Velocity),那就要用到很多理论性和学术性的语言和词汇BOB半岛体育,相信会把大家越说越煳涂,我在写大数据应用开发工程师专业课程的时候,就想写一篇文章来告诉大家大数据是什么,却总是组织不起那种能让外行人秒懂的语言BOB半岛体育,就先把技术上的学习内容给发了,没有学过编程的同学直接看Hadoop学些什么Spark学些什么应该难以理解。我是技术出身并不善写作,我决定就写一些我知道的大数据在方方面面的应用实例来向大家说明大数据的含义,在这里还请大家谅解我的写作水平。
在我们日常生活当中,我们所做的一切事,不论在线上还是线下,都会留下数字脚印。每一次刷卡购物,每一次网络搜索BOB半岛体育,手机上的每一次点击,乃至社交网络上的每一个点赞,都会被记录下来。形成的这些数据被称作非结构化数据,这些数据的存储分析计算提取处理的一系列行为就是我们说的大数据,就像听歌软件会分析我们的播放记录向我们推荐我们爱听的歌曲一样,我们打开吃饭穿衣的APP也会看到我们喜爱的菜单和衣着搭配。
在出行方面大数据已经体现得更是淋漓尽致,网约车已经成为了新的产业,传统的出租车行业已然被颠覆,打车软件通过对出行和车辆数据的收集和分析,在司机的APP上显示哪里有潜在乘客,在乘客的APP上显示哪里可以打到车。滴滴优步这些公司彻底的改革了一个行业。就在前段时间,一元单车APP风靡各大城市,大街小巷的人们都骑着黄色、绿色一模一样的自行车,类似这样的公司做这样的事情实际上就是用钱来砸数据,实现原始的数据积累,由此可见大数据的非凡魅力和巨大价值。
在零售方面,全球最大零售连锁超市沃尔玛引入大数据技术之后,在大数据分析了大量的零售数据之后发现,啤酒与尿不湿经常出现在同一张销售小票上,啤酒和尿不湿在人类正常思维当中是没有关联的两件商品,为什么会有一定的关联度呢,经过调查发现给宝宝购买尿不湿的通常是爸爸,买完尿不湿之后通常要买啤酒。所以沃尔玛现在的尿不湿货架旁边就是各种啤酒。当然这只是其中的一个小小的例子,很多大数据给出的商品摆放位置在最有经验的沃尔玛店员看来都是驴头不对马嘴的,沃尔玛就是按照大数据分析的结果以人类思维看来是匪夷所思的方式安排各种商品的摆放,靠这种利用大数据技术分析商品关联度的方式大幅提高了零售营业额。
说完篮球再讲一个足球界的实例,在2014年世界杯的时候,谷歌通过自己的大数据平台成功预测了16强比赛的每场比赛的胜利者,预测准确率100%,秒杀章鱼保罗和贝利,我都后悔没跟着谷歌的预测买足彩……谷歌是靠网络上搜集的数据,包括搜索引擎、微博和新闻报道综合分析这些数据得出的结论,据说着名的物理学家霍金也参与到这个预测算法的设计。
在农业方面,比如以色列人的滴灌技术,采用计算机进行自动化控制,灌溉系统中的传感器能够检测植物变化和湿度,来决定对植物的灌溉量,节省人力和水资源,由于有大量的传感器在采集数据,这种自动滴灌系统会分析这些水量和产量的大数据,从而改进灌溉方法,大数据+农业让这个严重缺水国土面积还很小的国度成为农业大国。再说一个事,大家都知道美国的家庭通常都有院落和草地的,在美剧当中我们经常看到人们拿着水管在浇水,这两年美国出现了自动喷水机器人,不但可以通过草地湿度调整水量还可以与天气预报相连,如果明天会下雨就会停止浇灌。据说这种自动喷水机器人可以节省95%的用水量。
在商业金融方面,算法交易越来越流行,金融机构纷纷利用大数据和算法来实现交易自动化,以人类无法匹敌的速度和频率创造利润。高频交易就是建立在庞大数据集的基础之上,通过分析多个市场,根据当前的市场环境来执行交易指令。虽然这创造了巨大的利润空间BOB半岛体育,但也让许多证券经纪人丢了饭碗。
在教育方面,百度2014年推出一个百度高考的应用,预测押中了当年全国18套作文考题中的12套,今年参加高考的同学们可以留意一下百度高考,没准可以提前知道今年的高考考题。
在媒体方面,《洛杉矶时报》已经开发了机器人写作技术,那里的记者正在同一堆机器人进行竞争。在这背后,就是大数据技术的进一步发展。记者的许多工作现在已经可以利用机器学习工具自动完成,就连许多公司的财务报表都是大数据直接写出,只需一个会打字的人,输入关键信息,大数据自动匹配出相应风格的稿件。而大数据的写法,一定更受欢迎,因为它基于的是我们大量的阅读数据。
在法律方面,在诉讼案的发现阶段,律师及其助手们需要筛选成千上万份与案件有关的文件。而现在,复杂的数据库可以利用大数据技术,比如同步分析、关键词识别等,以更少的时间完成同样的工作。而在传统上,这些工作都是律师事务所充当律师助手的人类完成。但是不要认为只有律师助手的工作处于危险中,就连拿着高薪、可预测案件结果的大律师也无法幸免。据说IBM研发的诉讼案件算法已经能够准确预测70%以上的法官判决结果。
在医疗方面,目前美国大部分癌症已被攻破,其做法就是利用了大数据。我们都知道“举一反三”很了不起,但是美国攻破癌症用的就是“举上百万反一”的推算法,用好多病历算法来推进病情发展。目前国内的趋势是尽早实现病历大数据共享,这将是一比巨大的财富,中国人多,如果所有患者的病历上传云端实现大数据共享,那么中国的医疗诊断准确率将是世界第一的。到时候我们看病只需要输入自己的症状,大数据会马上给出最好的治疗方案。
最重要的是在国家政策方面,“十二五”以来,国务院和相关部门先后印发了《促进大数据发展行动纲要》、《大数据产业发展规划(2016-2020年)》等指导性文件。特别提出加快推进大数据产业应用能力,相信各位看官也已经不止一次在央视的新闻联播BOB半岛体育、在习大大和主席那里听到“大数据”这个词了吧,所以请你们相信:大数据的发展前途无量!