教培參考
教育培訓(xùn)行業(yè)知識(shí)型媒體
發(fā)布時(shí)間: 2025年03月21日 15:06
HDFS是hadoop兼容最好的標(biāo)準(zhǔn)級(jí)文件系統(tǒng)。Hadoop是分布式服務(wù)器集群上存儲(chǔ)海量數(shù)據(jù)并運(yùn)行分布式分析應(yīng)用的開(kāi)源框架,而HDFS是一個(gè)分布式文件系統(tǒng),是Hadoop中的一個(gè)核心部件,主要是對(duì)數(shù)據(jù)進(jìn)行分布式儲(chǔ)存和讀取。
HDFS(Hadoop Distributed File System)是hadoop項(xiàng)目的核心子項(xiàng)目,是基于流數(shù)據(jù)模式訪問(wèn)和處理超大文件的需求而開(kāi)發(fā)的。
HDFS的優(yōu)點(diǎn):
1) 處理百M(fèi)B、設(shè)置數(shù)百TB大小的文件
2) 流式的訪問(wèn)數(shù)據(jù),響應(yīng)"一次寫入、 多次讀寫"
3) 運(yùn)行于廉價(jià)的商用集群上
HDFS的缺點(diǎn):
1) 不適合低延遲數(shù)據(jù)訪問(wèn)
2) 無(wú)法高效存儲(chǔ)大量小文件
3)不支持多用戶寫入及任意修改文件
HDFS是開(kāi)源的,存儲(chǔ)著Hadoop應(yīng)用將要處理的數(shù)據(jù),類似于普通的Unix和linux文件系統(tǒng)
微信掃碼關(guān)注公眾號(hào)
獲取更多考試熱門資料