视频1 视频21 视频41 视频61 视频文章1 视频文章21 视频文章41 视频文章61 推荐1 推荐3 推荐5 推荐7 推荐9 推荐11 推荐13 推荐15 推荐17 推荐19 推荐21 推荐23 推荐25 推荐27 推荐29 推荐31 推荐33 推荐35 推荐37 推荐39 推荐41 推荐43 推荐45 推荐47 推荐49 关键词1 关键词101 关键词201 关键词301 关键词401 关键词501 关键词601 关键词701 关键词801 关键词901 关键词1001 关键词1101 关键词1201 关键词1301 关键词1401 关键词1501 关键词1601 关键词1701 关键词1801 关键词1901 视频扩展1 视频扩展6 视频扩展11 视频扩展16 文章1 文章201 文章401 文章601 文章801 文章1001 资讯1 资讯501 资讯1001 资讯1501 标签1 标签501 标签1001 关键词1 关键词501 关键词1001 关键词1501 专题2001
Hadoop2.2.0的新特性
2020-11-09 07:55:57 责编:小采
文档

ApacheHadoop-2.2.0 与之前的 hadoop-1.x 相比出现了一些新的特性,具体如下: 一.资源统一管理系统 YARN YARN 是 ”YetAnotherResourceNegotiator”的简称。由于 MRv1 存在扩展性,资源利用率,可靠性和只能单一框架作业的问题, apache 对 MRv1 进行改造

Apache Hadoop-2.2.0与之前的hadoop-1.x相比出现了一些新的特性,具体如下:

一.资源统一管理系统YARN

YARN 是”Yet Another Resource Negotiator”的简称。由于MRv1存在扩展性,资源利用率,可靠性和只能单一框架作业的问题,apache对MRv1进行改造,把JobTracker中的资源管理功能抽象成了一个的系统,由原来HDFS,MapReduce两个框架的Hadoop变为了HDFS,YARN,MR,Others等多个框架集合的Hadoop,如下图1 Hadoop框架的演变


图1 Hadoop框架的演变

集结了YARN的集群的不单局限运行MR,还能够同时运行其他的框架比如Spark,Storm,Giraph等,对于运行在YARN之上的各种框架,YARN进行资源(比如CPU,内存)统一管理和分配,使它们共享一个集群,从而提高资源的利用率,降低成本。

二.HDFS Federation

在Hadoop 0.23之前一个集群只有一个命名空间,并且是单独的NameNode,这个NameNode负责对这个单独的命名空间进行管理。针对单个NameNode的HDFS架构具有一定的局限性,比如随着数据的飞涨命名空间的,性能的瓶颈,大量不同类型的程序在集群中运行导致相互之间的影响,同时由于单节点失效的隐患,一个NameNode的集群一旦宕机将导致了整个集群的不可用。HDFS Federation使HDFS的命名空间能够横向的扩展。在HDFS Federation中的NameNode是联盟关系,它们之间相互且不需要相互协调,各自分工,管理自己的区域。从而能够快速的解决大部分单NameNode的问题。图2HDFS框架图:


图2 HDFS框架图

三.HDFS Snaphots

保存某一个时刻的只读文件系统,用于数据的备份防止用户错误和灾难恢复。与数据库快照类似!

四.HDFS HA

用于解决HDFS的NameNode单节点问题。实现主NameNode节点在出现故障时与备NameNode节点之间的快速切换。主备NameNode之间通过一个共享存储同步元数据信息,其中Hadoop提供了QJM和NFS两种可选的共享存储系统。

下载本文
显示全文
专题