数据存储产业服务平台
共 96 篇文章

标签:Hadoop 第4页

英特尔支持大数据开源 发行Hadoop免费版

11月30日,在北京举办的2012年Hadoop与大数据技术大会上,英特尔亚太研发有限公司总经理、英特尔软件与服务事业部中国区总经理何京翔博士代表英特尔公司宣布推出英特尔Hadoop发行版的免费版本。这也是自今年7月推出Hadoop发行版以...

大数据对数据中心架构的新挑战

由中国计算机学会主办、CCF大数据专家委员会承办HBTC2012Hadoop与大数据技术大会于11月30日在北京举行。 Gartner公司的数据中心研究部的首席分析师张瑾先生就大数据对数据中心架构的新挑战做了主题演讲。 Gartner研究表...

HBTC2012:大数据的挑战问题和发展趋势

由中国计算机学会主办、CCF大数据专家委员会承办HBTC2012Hadoop与大数据技术大会于11月30日在北京举行。本届大会以大数据共享与开放技术为主题,设置了Hadoop生态系统、大数据行业应用、大数据共享平台与应用以及大数据的技术挑战...

YARN: 让Hadoop更完善?

Apache Hadoop的肯定不是开源分布式文件系统唯一的解决方案,近年来出现了一些hadoop的竞争对手,如HPCC等等,但在蓬勃发展的大数据存储领域它肯定是最有名的和最流行的平台。 虽然hadoop精于数据处理和分析和原始存储,但Ha...

博客精选:Hadoop各商业发行版之比较

Hadoop的发行版除了社区的Apache hadoop外,cloudera,hortonworks,mapR,EMC,IBM,INTEL,华为等等都提供了自己的商业版本。商业版主要是提供了专业的技术支持,这对一些大型企业尤其重要。每个发行...

Hadoop之父勾勒大数据平台未来

“大数据不是炒作,也不是泡沫。Hadoop在未来将继续追随谷歌的脚步。”Hadoop的创造者兼Apache Hadoop项目创始人Doug Cutting近日表示。 作为一个批处理计算引擎,Apache Hadoop...

浅析Hadoop两大核心组件的体系结构

HDFS和MapReduce是Hadoop的两大核心。而整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持的,并且它会通过MapReduce来实现对分布式并行任务处理的程序支持。 HDFS的体系结构 我们首先介绍HDF...

如何为Hadoop集群选择合适的硬件?

我们的客户开始使用Hadoop时的第一个问题是如何为他们的Hadoop集群选择合适的硬件。这个博客介绍Hadoop管理员需要考虑的各种因素。我们也鼓励其他人根据他们的经验决定Hadoop集群配置。虽然Hadoop设计在工业标准硬件上运行,建...

Hadoop白皮书(3):分布式计算框架MapReduce简介

MapReduce 是一个高性能的批处理分布式计算框架,用于对海量数据进行并行分析和处理。与传统数据仓库和分析技术相比,MapReduce 适合处理各种类型的数据,包括结构化、半结构化和非结构化数据。数据量在 TB 和 PB 级别,在这个量...