hadoop到底是什么
發(fā)布時(shí)間:2025-08-17 | 來(lái)源:互聯(lián)網(wǎng)轉(zhuǎn)載和整理
Hadoop細(xì)分的話(huà)包含兩部分,一部分是HDFS,這個(gè)是分布式文件系統(tǒng),包含NameNode和DataNode,用于存儲(chǔ)pb級(jí)數(shù)據(jù),特點(diǎn)就是大,可以部署到上前臺(tái)上萬(wàn)臺(tái)機(jī)器上,用于存儲(chǔ)。 還有一個(gè)部分是MapReduce,這個(gè)是一個(gè)計(jì)算框架,用于離線(xiàn)分析數(shù)據(jù),還有一個(gè)Yarn,這個(gè)是Rarn可以說(shuō)是一個(gè)資源管理類(lèi)和任務(wù)調(diào)度器,用于管理和調(diào)度程序,包括MapReduce但又不限于MapReduce,也可以運(yùn)行Spark等。
下面就是生態(tài)圈了,hadoop生態(tài)圈還包含spark,flume,hbase,kakfa等等