加入收藏 | 设为首页 | 会员中心 | 我要投稿 武汉站长网 (https://www.027zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

现在人人都讲大数据,究竟什么是大数据?恐怕不是每个人都能说清楚

发布时间:2022-12-10 13:32:02 所属栏目:大数据 来源:互联网
导读: 对于大数据,我想不管你是否行业内人士,在这高度信息化的社会里面,都会有意无意的听说过大数据这么一个概念。小到一个店家,大到一个国家,都在讲大数据。不过,真正搞清楚什么是大数据的

对于大数据,我想不管你是否行业内人士,在这高度信息化的社会里面,都会有意无意的听说过大数据这么一个概念。小到一个店家,大到一个国家,都在讲大数据。不过,真正搞清楚什么是大数据的人可能真不那么多。其实,故名思议,大数据肯定体现在“大”上,可数据是一个比较抽象的东西,我们该怎么去描述数的“大”呢?这里面就涉及到一些专业领域的东西了。

麦肯锡对“大数据”给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。

我们应该怎么去理解这句话呢,首先,我们知道,在大数据出现之前,我们对数据的日常处理分析常常使用的是诸如sqlsever/oracle/mysql等传统关系数据库,处理T级别的数据量已经是这些数据库的极限,面对PB/EB/ZB级的数据量那就更无能为力了。那是不是以前就没有这么大的数据量呢,也不是,早在20世纪80年代,未来学家 阿尔文托夫勒 就将大数据称作“第三次浪潮的华彩乐章”,只不过当时由于数据处理能力有限,所以大数据一直没有被提起来,直到2005年,Hadoop项目诞生,从技术层面上搭建了一个使对结构化和复杂数据快速、可靠分析变为现实的平台。从这个时候开始,“大数据”才逐步成为互联网信息技术行业的高频词汇,为人们所熟知。从这个上,我们可以看出,技术的发展不仅在改变人们的生活,其本身也在推进着更高级的技术的诞生。话说回来,“大数据”是不是只是一种规模大的数据集合就够了呢,显然不是的,还必须具备4V的特征。先说说海量的数据规模,前面说到处理PB/EB/ZB级的数据量,正是大数据优势所在,处理数据量的PB化,以前是不可能的事情,但在大数据时代,将会是一个常态,这是一个什么概念呢,一部高清电影约4g,一个PB=1024*1024g,大数据瞬时处理1PB的数据量,就相当于瞬时处理26万部的高清电影的量。其次,说到“快速的数据流传”,怎么说呢,所有数据都有时效的,商业业务决策也是有时效的,如果不快速处理,得到结果来,那么就很可能会失去商机,所以,我们也在一直强调利用大数据做实时分析。再次,“多样的数据类型”又是什么呢,在大数据走进大众之前,传统的数据处理工具,往往处理的是标准的结构化的数据,也就是存在我们的数据库表格中的数据。针对非结构化的数据,比如文本、语音、视频、图像等等优酷大数据,这是大数据要经常面对的事情。最后,“价值密度低”,这个概念有点抽象,怎么去理解呢,大数据是一个海量的数据,在大海中捞针,这针就是我们的宝藏。但我们把这个针经过一系列的分析处理确定是在某一平方米的水域,那么这个密度就会高很多了,在这一块区域去捞针就容易获得成功多了。

以上,就是我对什么是大数据的通俗理解。

(编辑:武汉站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!