hadoop
Hadoop简介
hadoop发展史
hadoop三大发行版本
本文档使用 MrDoc 发布
-
+
home page
hadoop发展史
## Hadoop的发展历史可以追溯到2003年,当时Google发表了一篇名为《MapReduce: Simplified Data Processing on Large Clusters》的论文,介绍了一种用于处理大规模数据的分布式计算模型。这篇论文对后来的Hadoop框架产生了重要影响。 ## 以下是Hadoop的发展历史的主要里程碑: - 2004年:Doug Cutting和Mike Cafarella开始开发一个开源的分布式文件系统,命名为Nutch。Nutch最初是为了实现网络搜索引擎而设计的,但Doug Cutting决定从中分离出一个通用的分布式计算框架。 - 2006年:Doug Cutting加入Yahoo,并将Nutch的分布式计算框架独立出来,命名为Hadoop。Hadoop的名字来源于Doug Cutting的儿子玩具大象的名字。Hadoop的核心组件包括Hadoop分布式文件系统(HDFS)和Hadoop MapReduce。 - 2008年:Apache软件基金会成立了Hadoop项目,并将其作为一个Apache顶级项目进行管理和发展。这标志着Hadoop开始成为一个开源的分布式计算框架。 - 2009年:Hadoop的第一个稳定版本1.0.0发布。这个版本包括了许多改进和功能增强,吸引了更多的用户和开发者。 - 2011年:Hadoop 2.0发布,引入了Hadoop YARN(Yet Another Resource Negotiator)作为新的资源管理器。YARN的引入使得Hadoop不仅可以运行MapReduce作业,还可以支持其他计算模型,如Spark、Storm等。 - 2012年:Hadoop生态系统开始快速发展,出现了许多与Hadoop配套的工具和项目,如Hive、Pig、HBase、Sqoop等。这些工具和项目扩展了Hadoop的功能,使得用户可以更方便地进行数据处理和分析。 - 2013年:Hadoop 2.2发布,引入了High Availability(HA)功能,提供了更好的容错性和可用性。 - 2017年:Hadoop 3.0发布,引入了一系列新功能和改进,包括容器化支持、GPU加速、Erasure Coding等。这些改进进一步提升了Hadoop的性能和可扩展性。 ## 随着时间的推移,Hadoop不断发展壮大,成为大数据处理领域的重要工具之一。它被广泛应用于各个行业,帮助组织和企业处理和分析海量的数据。同时,Hadoop的生态系统也在不断扩展,涵盖了更多的工具和项目,为用户提供更多选择和灵活性。
done
Dec. 4, 2023, 9:46 p.m.
转发文档
Collection documents
Last
Next
手机扫码
Copy link
手机扫一扫转发分享
Copy link
Markdown文件
share
link
type
password
Update password