小编第一次听说大数据还是在大学,在本专业的众多方向里,有个方向就叫做大数据,近几年大数据简直红遍天,只要是互联网公司,就特别喜欢跟大数据沾上边,感觉很厉害的样子。小白同志们也是一头雾水,一脸懵B! 小编认为最简单通俗的解释是大数据就是大量的数据,对,就是这么直接! 最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据的挖掘和运用,预示着新一波生产率增长和消费者盈余浪潮的到来。 大量的数据是从哪来的?小明早晨起床,想起昨天答应女友要送她一个新的包包,可是小明对包包一窍不通,鬼知道女友喜欢什么款式啊!只能上网去搜今年的流行包包: 以淘宝为例,小明今天的行为数据就长这样: - 用户小明,登录
- 搜索机车包
- 点击下一页
- 关闭页面 半小时后 - 用户小明,登录
- 搜索 MK 机车包
- 按价格排序
- 点开排名第一的商品
- 加入购物车
- 回到搜索页
- 搜索 巴黎世家 机车包
- 按价格排序 …… - 点击购买
- 填写寄送信息(寄送信息地点为 帝通科技)
- 购买成功 每一个用户的每时每秒的数据,都会被如实的记录下来,以淘宝的注册用户数量和用户粘性来判断,估计每天的用户行为数据就能上PB。注意,是每天。大量的数据就这样产生了。 多大的量才能被叫做大量的数据呢?数据大和小?看你的处理方式啦! 其实这事因时而异。大数据名词刚被提出的时候,如果没记错,大约是06年吧,那时候,总数据量上到百级GB,就可以说自己数据量很大了,现在呢,谁还没有个TB级的硬盘呢。 大数据和普通数据的分水岭在于它们不同的处理方式。普通数据通常使用结构化存储,比如大家所熟知的 MySQL ,商用的 ORACLE 等,而大数据通常使用 Hadoop 家族产品及 Hadoop 周边产品,比如 HDFS、Hbase 和 MongoDB 等等。通常,数据量小的时候适合使用 MySQL, 而数据量大了之后,适合使用 NoSQL 存储(比如刚刚提到的Hbase 和 MongoDB),而不同的NoSQL存储又有它们各自的擅长之处,以后会有详细展开。 大量的数据有什么用呢?大数据在互联网的使用场景十分广泛,比如用户推荐。 以上文提到的小明的行为数据为例,如果有一天淘宝、百度和腾讯合并了,三家的数据放到了一块,通过登录设备和 IP 地址匹配到了小明在三家网站使用的不同账号,发现了小明这一天的完整的心路历程。 第二天,小明的女友搜索了 lamer 眼霜。 第二天的晚些时候,小明打开淘宝,突然弹出对话框“您的女友搜索了 lamer 眼霜,就等着您买给她啦!” 你说小明是买还是不买呢…… 在不远的未来,你的电脑就会比你更懂你自己了! 小编认为数据能够成为未来最大的交易商品,每年双十一大量的数据也考验着马爸爸的服务器及行业能力。目前大数据重点在传统行业里,大数据的价值是通过数据共享、交叉复用后获取最大的数据价值! 转载请注明出处www.ddv.cn 有什么问题可以扣小编800128301
|