为何叫大数据? 数据体量大(VOLUMES) 代指大型数据集,一般在10TB规模左右。但在实际应用于中,很多企业用户把多个数据集放到一起,早已构成了PB级的数据量。未来智能家居领域也有许多这种企业,目前国内智能家居领域的数据量级总和早已超过100TB以上,非结构化数据规模正在以更慢的速度快速增长。 数据类别大(variety) 数据来自多种数据源,数据种类和格式日益非常丰富,已冲破了以前所限定版的结构化数据范畴,涵盖了半结构化和非结构化数据。
也就是说,大数据最重要的变化是处置对象由结构化数据扩展到了半结构化和非结构化数据,每年非结构化数据存储总量较结构化数据增长率高达10到50倍。 非结构化数据可以看作所有无法非常简单转化成到结构化关系型数据库中的所有数据,非结构化数据如企业的邮件和其它形式的电子通讯记录;网站上的资料,还包括点击量和社交媒体涉及的内容;还有设备产生的数据,如RFID、GPS\传感器产生的数据、日志文件等。
数据处理速度快(Velocity) 在数据量十分可观的情况下,也需要做数据的实时处理。 数据真实性低(Veracity) 随着社交数据、企业内容、交易与应用于数据等新的数据源的蓬勃发展,传统数据源的局限被超越,企业越发必须有效地的信息之力以保证其真实性及安全性。 小贴士 TB是一个计算机存储容量的单位,它相等2的40次方,或者相似一万亿个字节,即一千千兆字节。
PB是数据存储容量的单位,它相等2的50次方个字节,或者在数值上约相等1000个TB。 数据单位从小到大为:B.KB.MB.GB.TB.PB。1PB=1024TB,依序以此类推。
TB、PB仍然很难解读,我们荐些例子。 美国国会图书馆在2011年4月之前总共搜集了235TB的数据。
假设手机播出MP3的编码速度为平均值每分钟1MB,而1首歌曲的平均值时长为4分钟,那么1PB歌曲可以倒数播出2000年。 如果智能手机照相机摄制相片的平均值大小为3MB,打印机照片的平均值大小为8.5英寸,那么总共1PB的照片的两边排序长度就超过48000英里,约可以环绕着地球2周。
人类功能记忆的容量预计在1.25个TB。这意味著,800个人类记忆才相等于1个PB。1PB充足存储整个美国人口的DNA,而且还能再行克隆2倍。
如果以每秒1个位的速度数一下1PB所包括的位数,那么一个人必须2.85亿年才能数完,如果每秒数1个字节,那么一个人必须数357万年。 谷歌为用户获取了多达20PB(215亿MB)的地图影像还包括卫星图片、航拍照片和360度街景图片。
即使在2008年,谷歌每天处置的数据早已超过20PB,一年就是7300PB。
本文关键词:IM电竞官网,im电竞网站入口,im·电竞官网入口app,IM电竞平台官网入口
本文来源:IM电竞官网-www.lets-netbank.com