请选择 进入手机版 | 继续访问电脑版
设为首页收藏本站

全球主机交流论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

搜索
热搜: discuz
查看: 24|回复: 1

大数据究竟何方神圣?

[复制链接]

该用户从未签到

发表于 2017-8-8 15:32:06 | 显示全部楼层 |阅读模式

小编第一次听说大数据还是在大学,在本专业的众多方向里,有个方向就叫做大数据,近几年大数据简直红遍天,只要是互联网公司,就特别喜欢跟大数据沾上边,感觉很厉害的样子。小白同志们也是一头雾水,一脸懵B
小编认为最简单通俗的解释是大数据就是大量的数据,对,就是这么直接!
最早提出大数据”时代到来的是全球知名咨询公司麦肯锡,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。人们对于海量数据挖掘运用,预示着新一波生产率增长和消费者盈余浪潮的到来。
大量的数据是从哪来的?
小明早晨起床,想起昨天答应女友要送她一个新的包包,可是小明对包包一窍不通,鬼知道女友喜欢什么款式啊!只能上网去搜今年的流行包包
以淘宝为例,小明今天的行为数据就长这样:
用户小明,登录
搜索机车包
点击下一页
关闭页面
半小时后
用户小明,登录
搜索 MK 机车包
按价格排序
点开排名第一的商品
加入购物车
回到搜索页
搜索 巴黎世家 机车包
按价格排序
……
点击购买
填写寄送信息(寄送信息地点为 帝通科技
购买成功
每一个用户的每时每秒的数据,都会被如实的记录下来,以淘宝的注册用户数量和用户粘性来判断,估计每天的用户行为数据就能上PB。注意,是每天。大量的数据就这样产生了。
多大的量才能被叫做大量的数据呢?
数据大和小?看你的处理方式啦!
其实这事因时而异。大数据名词刚被提出的时候,如果没记错,大约是06年吧,那时候,总数据量上到百级GB,就可以说自己数据量很大了,现在呢,谁还没有个TB级的硬盘呢。
大数据和普通数据的分水岭在于它们不同的处理方式。普通数据通常使用结构化存储,比如大家所熟知的 MySQL ,商用的 ORACLE 等,而大数据通常使用 Hadoop 家族产品及 Hadoop 周边产品,比如 HDFSHbase MongoDB 等等。通常,数据量小的时候适合使用 MySQL, 而数据量大了之后,适合使用 NoSQL 存储(比如刚刚提到的Hbase MongoDB),而不同的NoSQL存储又有它们各自的擅长之处,以后会有详细展开。
大量的数据有什么用呢?
大数据在互联网的使用场景十分广泛,比如用户推荐。
以上文提到的小明的行为数据为例,如果有一天淘宝、百度和腾讯合并了,三家的数据放到了一块,通过登录设备和 IP 地址匹配到了小明在三家网站使用的不同账号,发现了小明这一天的完整的心路历程。
第二天,小明的女友搜索了 lamer 眼霜。
第二天的晚些时候,小明打开淘宝,突然弹出对话框您的女友搜索了 lamer 眼霜,就等着您买给她啦!
你说小明是买还是不买呢……
在不远的未来,你的电脑就会比你更懂你自己了!
小编认为数据能够成为未来最大的交易商品,每年双十一大量的数据也考验着马爸爸的服务器及行业能力。目前大数据重点在传统行业里,大数据的价值是通过数据共享、交叉复用后获取最大的数据价值
转载请注明出处www.ddv.cn
有什么问题可以扣小编800128301

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

  • TA的每日心情
    郁闷
    2017-8-3 09:57
  • 签到天数: 1 天

    [LV.1]初来乍到

    发表于 6 天前 | 显示全部楼层
    走心,不如走价。
    韩美服务器,周年大发送。
    http://www.geoidc.com/(Q1870898632)
    回复 支持 反对

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|小黑屋|Archiver|手机版|中国U网    

    GMT+8, 2017-8-17 23:36 , Processed in 0.068214 second(s), 24 queries .

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表