大数据是什么意思

2021-02-13 16:35:33    来源:新经网    作者:艾静

大数据是指不能在一定时间范围内使用常规软件工具捕捉、管理和处理的数据集合,它是大量、高增长率和多样化的信息资产,需要新的处理模式来增强决策力、洞察力和流程优化能力。

大数据是什么意思

大数据”这个词现在出现得很频繁,每个人都说现在是大数据时代,那么你知道大数据到底是什么意思吗?以下小编就来给大家讲讲。

详细内容

01

IT行业术语,指的是一组数据,这些数据不能用常规的软件工具在一定时间范围内捕获、管理和处理,它们都是大量、高增长率和多样化的信息资产,需要新的处理模式,以获得更强的决策力、洞察力和流程优化能力。《大数据时代》是由维克多·迈尔-舍恩伯格和肯尼斯·库克耶编写,使用了所有数据进行分析处理,但使用的是不用随机分析方法(抽样)。5个大数据特征(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样化)、Value(低价值密度)、Veracity(真实)。

02

McKinseyGlobalInstitute给出了这样一个定义:一个数据集,其规模之大,在获取、存储、管理和分析方面远远超过了传统数据库软件工具的能力,它有四个特点:海量数据规模,快速的数据流动,多样化的数据类型,低价值密度。

03

大数据的战略意义并不在于获取大量的数据信息,而是要对这些有意义的数据进行专门的处理。换句话说,如果把大数据比作一个行业,那么这个行业赢利的关键,就在于提高它对数据的“处理能力”,通过“处理”来实现数据的“增值”。从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。海量数据不可能在单一的计算机上处理,因此必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

04

伴随着云计算时代的到来,大数据(Bigdata)也越来越受到人们的关注。分析小组认为,大数据(Bigdata)通常被用来描述一家公司生成的大量非结构化和半结构化数据,这些数据在下载到关系数据库进行分析时会花费大量的时间和金钱。大数据分析通常与云计算相关联,因为实时的大数据集分析需要类似于MapReduce的框架来将工作分配给几十、几百甚至几千台计算机。大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适合大数据的技术,包括大规模并行处理数据库,数据挖掘,分布式文件系统,分布式数据库,云计算平台,因特网和可扩展存储系统等。最低的基本单位是bit,并按顺序列出:bit,Byte,KB,MB,GB,TB,PB,EB,ZB,YB,BB,NB,DB。

05

大数据包括结构性、半结构性和非结构性数据,非结构性数据日益成为数据的重要组成部分。据IDC的调查报告显示:企业中80%的数据都是非结构化数据,这些数据每年都按指数增长60%。大数据只是因特网发展到今天这个阶段的一个表现和特点,没有必要对它进行神话,也没有必要对它保持敬畏,在以云计算为代表的技术创新的大幕的映衬下,这些原本看起来难以收集和使用的数据开始被轻易地使用,并且,通过各行各业的不断创新,大数据将逐渐为人类创造更多的价值。

06

当今社会是一个高速发展的社会,科技发达,信息流通,人与人之间的交流更加紧密,生活更加便利,大数据是这个高科技时代的产物。阿里巴巴创办人马云来台演讲中就提到,未来的时代将不是IT时代,而是DT的时代,DT就是DataTechnology数据科技,显示大数据对于阿里巴巴集团来说举足轻重。有些人将数据比作蕴藏着能量的煤矿。煤炭按照性质有焦煤、无烟煤、肥煤、贫煤等分类,而露天煤矿、深山煤矿的挖掘成本又不一样。与此类似,大数据并不在“大”,而在于“有用”。价值含量、挖掘成本比数量更为重要。对许多行业来说,如何使用这些海量数据是企业赢得竞争的关键。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。