hadoop三大組件:Client、Master、Slave。Hadoop集群可以定義為一種特殊類型的計算集群,旨在用于分布式計算環境中存儲和分析大量非結構化數據。這樣的集群可以在低成本計算機上的Hadoop開源分布式處理軟件上運行Hadoop集群架構。
Client:
它既不是主設備也不是從設備,客戶端的工作是提交MapReduce作業,以描述應如何處理數據的方式,然后在完成作業后檢索數據以了解響應。
Masters:
Master由3個組件組成,即NameNode,Secondary Node Name和Job Tracker。
Slaves:
從節點是Hadoop群集中的大多數計算機,并負責存儲數據和處理計算。
Hadoop集群以提高數據分析應用程序的速度及其可伸縮性而被應用,Hadoop集群具有很高的抗故障能力,因為每個數據塊都復制到其他節點上,以確保在單個節點發生故障時不會丟失數據。