设为首页收藏本站

全球主机交流论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

搜索
热搜: discuz
查看: 822|回复: 0
打印 上一主题 下一主题

构建成功大数据基础设施的几大关键点

[复制链接]
  • TA的每日心情
    奋斗
    2016-8-12 11:35
  • 签到天数: 6 天

    [LV.2]偶尔看看I

    跳转到指定楼层
    楼主
    发表于 2016-11-4 13:58:04 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

      ​‌‌香港服务器租用特价优惠:CPU:E5-2650 16核 内存:16G 硬盘:1T  原价2500元/月,现季付只需3000元/季,E5高配机型绝对超值!数量有限,速速抢购,欢迎咨询葵芳Lily 1651623769
      大数据是当今许多企业IT运营的一个重要组成部分。据知名调研公司IDC预测,到2019年,大数据市场产值将达到1870亿美元。这里说的是面向大数据世界中结构化数据的数据库。如果你想让Hadoop数据平台井然有序,那么Hive可能正是你需要的。这种基础设施工具让你可以针对非常不像SQL的Hadoop处理类似SQL的操作。
      Spark用于处理大数据
      到目前为止,我们一直在谈论存储和组织数据。但是,如果你想实际处理数据又怎么样?这时候,你就需要一种像Spark这样的分析和处理引擎。Spark是另一个Apache项目,它包括一批开源和商业产品,拿来你添加到数据湖、仓库和数据库的数据后,对数据做一些有用的操作。
      由于它可以访问你能想象的任何数据的库,Spark可用于处理存储在各种地方的各种数据。它同样是开源的,所以你可以随意修改它。
      你可以对大数据执行SQL操作
      许多人知道如何构建SQL数据库和编写SQL查询。面对大数据时,这种专长没有必要浪费。Presto是一种开源SQL查询引擎,它让数据科学家可以使用SQL查询,查询驻留在从Hive到专有商业数据库管理系统的任何环境的数据库。它被Facebook之类的大公司用于交互式查询,而交互式查询这个短语是关键。Presto就好比是一种对庞大数据集执行即席交互式查询的工具。
      在线存储有一席之地
      一些大数据任务需要用到不断变化的数据。有时候,这是定期添加的数据,有时是通过分析而更改的数据。不管在什么情况下,如果你的数据写入与读取一样频繁,那么你就需要该数据存储在本地、联机。如果你支付得起成本,还希望数据存储在固态存储介质上,因为这会大大加快速度――如果你在零售或交易场地的人员焦急地等待结果返回,这是个重要的考虑因素。
      云存储也有一席之地
      如果在更庞大的聚合数据库上进行分析,那么云是完美的平台。聚合数据并传输到云,运行分析,然后拆掉实例。这正是云最擅长的那种弹性需求响应。操作不会受到互联网可能带来的任何延迟问题的显著影响。如果你把在专用本地系统上进行的实时分析与云端运行的深度分析结合起来,那么离充分发挥大数据基础设施的潜力近在咫尺。
      以上就是你在企业处理大数据时应知道并牢记的几个关键。
      葵芳IDC--Lily
      QQ: 1651623769
      TEL: 13632616956
      葵芳:http://www.chinahkidc.net/
      香港葵芳机房致力于为企业提供一站式IDC服务,让您尽享我们的优质产品、优秀服务。
      香港自建机房,诚招代理!!!

      葵芳IDC 分享

    分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友 微信微信
    收藏收藏
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    QQ|小黑屋|Archiver|手机版|中国U网    

    GMT+8, 2024-5-4 16:28 , Processed in 0.073446 second(s), 21 queries .

    Powered by Discuz! X3.2

    © 2001-2013 Comsenz Inc.

    快速回复 返回顶部 返回列表