视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
16家顶尖大数据分析平台
2025-09-30 01:35:14 责编:小OO
文档
16家顶尖大数据分析平台-系列文章之九

来源:缔元信 发布时间:2014-03-07 17:58标签:数据结构化 大数据

DougHenschen,InformationWeek,1/30/2014

  对今天的企业来说,数据分析已经成为生死攸关的选择。我们分析一些著名的供应商,从Hadoop创业者到传统的数据库市场参与者。

 

  SAP将Hana置于分析的核心

  分析数据库管理系统:SAPHana、SAPIQ

  内存数据库管理系统:SAPHana

  流分析选项:SAP事件流处理(EventStreamProcessing)

  Hadoop分布式系统:代售并支持Hortonworks、Intel,由Cloudera和MapR认证的Hadoop集群

  硬件/软件系统:多个硬件配置合作伙伴,包括Dell、Cisco、Fujitsu(富士通)、Hitachi(日立)、HP和IBM

  无论数据来源是结构化的还是非结构化的,成批的还是流式的,规模大还是小,SAP总是推出Hana内存平台来满足所有(不管是分析性的还是交互性的)需求。当数据确实规模很大或处于非结构化状态时,SAP支持各种Hadoop分布式系统,附带通过Hive实现的Hana数据处理功能。当数据需要为长期历史分析进行归集时,SAPIQ(之前名称SybaseIQ)提供一个压缩版的分列式数据库管理系统,作为一项基于SQL的Hadoop替代选择,来适配支持MapReduce处理。

  Hana拥有一个嵌入式的预测分析资料库,支持R语言、空间处理、自然语言处理和文本分析资料库。如果需要,文本和非结构化数据分析可以用SAP数据服务推送到Hadoop里面进行。结果集可以返回到Hana,以完成快速的内存分析。

  有很多时候SAP也会失灵,这时就要不停地推销"实时"概念,无论是否有对这个水平的性能的明确需求。投资SAP的好处是它在低延迟Hana分析,以及快速数据加载和流处理功能(后者通过对Sybase的收购获得)上走在了业界前列。当你发现一个突破低延迟性能的清晰机会时,SAP有各种工具来帮你实现。

 

  Teradata实现了统一的大数据架构

  分析数据库管理系统:Teradata、TeradataAster

  内存数据库管理系统:虽然并不是一个内存数据库管理系统,但Teradata智能存储监视器仍实现了对最热数据的查询,并且自动将这些数据送至可用的最快速存储层,附带一些选项,包括RAM(随机存取存储器)、flash、SSD,以及不同速度的传统旋转磁盘。

  流分析选项:无

  Hadoop分布式系统:代售并支持Hortonworks数据平台

  硬件/软件系统:Teradata和TeradataAster是集成的软硬件系统。Hadoop由两个Teradata组件和标准的Dell配置来支持。

  Teradata进入大数据时代,总是要吹嘘其最长的PB级企业数据仓库(EDW)供应商客户名单。公司花了两三年时间才接受SQL无法满足所有需求这个事实,2011年它获得了AsterData,2012年与Hortonworks结成合作伙伴,这样它就能建构一个称之为统一数据架构(UDA)的平台。

  Teradata数据库管理系统处于统一数据架构(UDA)的核心位置,支持为满足生产商业智能和分析需求而设计的企业数据仓库(EDWs)和数据集市。选项则包括了SQL和不同的内部数据库分析选项,以及对SAS的广泛支持。公司把这个数据库管理系统置于混合行列压缩性能和一个智能存储功能的中心,以实现RAM、SSDs、flash和不同速度旋转磁盘的快速查询。

  Aster是UDA的数据发现平台,一个专为每日搜寻结构化和多结构化(点击流量、社交或机器)数据而设计的小型、临时数据库。分析选项包括SQL、SQL-MapReduce和SQL图表分析。Hadoop是大规模、低成本存储的选择,来自这个库的数据子集可以被拷贝进TeradataAster,或者用SQL-H(公司的Hadoop上SQL查询功能选项)抽取到Teradata里。

  像Cloudera这样的Hadoop支持者会认为成本和规模优势将引导客户做更多的分析,包括Hadoop上的SQL功能、图表分析,当然,还有MapReduce。Teradata一直很关注建立SQL友好的方式-以及Hadoop工具的非相关特质和开发者们的语言,以保持Teradata的结构化数据分析和TeradataAster的变量数据分析。Hadoop越流行、越得力、越好用,的数据发现平台就将越少受人关注。无论如何,毫无疑问,对很多大型的、业绩驱动的公司来说,核心的Teradata数据库管理系统将持续成为数据管理的基石。下载本文

显示全文
专题