青云QingCloud12月22日,基于Hadoop的大数据集群服务现已正式推出。
该服务包括三大核心组件,即HDFS分布式文件系统、YARN任务调度和集群资源管理系统,以及MapReduce并行计算系统。通过QingCloud Hadoop集群服务,用户能够在2-3分钟内创建一个Hadoop集群,并且可以进行横向和纵向的在线伸缩,极大地降低了Hadoop平台的技术门槛。
众所周知,Hadoop是一个针对海量大数据进行存储和处理的分布式开源平台,它使用简洁的MapReduce编程模型分布式处理跨集群的大型数据集,集群规模可以扩展到几千甚至上万。QingCloud Hadoop集群服务采用Master/Slave架构,由三种节点类型构成,即主节点(YARN Resource Manager和HDFS Name Node)、从节点(YARN Node Manager和HDFS Data Node),以及客户端节点(Hadoop Client Node)。用户在客户端节点发起MapReduce任务,通过与HDFS和YARN集群中各节点的交互存取文件、执行MapReduce任务,最终获取结果。
青云QingCloud Hadoop集群架构图
2015年8月,青云QingCloud就已推出基于Spark的大数据集群服务,此次Hadoop集群服务的上线是对QingCloud大数据基础平台的有力补充。Hadoop和Spark各有千秋,Hadoop适用于更大规模的离线数据处理,且对系统故障具备天然的抵抗力;Spark更适合做快速的实时数据分析。因此,用户可以根据应用场景的不同,选择灵活的大数据解决方案。
具体而言,青云QingCloud Hadoop集群服务具有以下特性:
一键部署:用户只需要简单的几步操作就能够在2-3分钟内创建出一个Hadoop集群,帮助用户降低Hadoop的技术门槛和开发成本,快速地利用Hadoop展开数据分析工作。
简化运维:大数据平台尤其是Hadoop的运维非常繁琐,QingCloud为用户提供了便捷的运维工具和图形化操作,极大地简化了Hadoop集群的运维和管理工作。
在线伸缩:Hadoop集群服务支持横向和纵向在线伸缩,以满足用户对计算能力和容量的需求。用户可以选择新增或者删除节点进行横向伸缩,也可以根据节点的监测数据随时调整各个节点的配置。
监控告警:QingCloud针对HDFS、YARN和MapReduce提供了丰富的监控信息,还为每个节点资源提供了监控告警服务,包括CPU使用率、内存使用率、硬盘使用率等,以帮助用户更好地管理和维护Hadoop集群。
安全性:Hadoop集群运行于100%二层隔离的私有网络内,结合QingCloud提供的高性能硬盘,在保障高性能的同时兼顾用户的数据安全。