在CGFT大數(shù)據(jù)中,冗余數(shù)據(jù)的保存是很重要的知識點。對于熟練的掌握程度,對于考試起著至關(guān)重要的作用。
作為一個分布式文件系統(tǒng),為了保 證系統(tǒng)的容錯性和可用性,HDFS采用了多副本方式對數(shù)據(jù)進行冗余存儲。
通常一個數(shù)據(jù)塊的多個副本會被分不到不同的數(shù)據(jù)接單上,如下圖所示,數(shù)據(jù)塊1被分別存放到數(shù)據(jù)節(jié)點A和C上,數(shù)據(jù)塊2被存放在數(shù)據(jù)節(jié)點A和B上。

這種多副本方式具有以下幾個優(yōu)點:
1、加快數(shù)據(jù)傳輸速度
當(dāng)多個客戶端需要同時訪問同一個文件時,可以讓多個客戶端分別從不同的數(shù)據(jù)塊副本中讀取數(shù)據(jù),這就大大加快了數(shù)據(jù)傳輸速度。

2、容易檢查數(shù)據(jù)錯誤
HDFS的數(shù)據(jù)節(jié)點之間通過網(wǎng)絡(luò)傳輸數(shù)據(jù),采用多個副本可以很容易餓判斷數(shù)據(jù)傳輸是否出錯。
3、保 證數(shù)據(jù)的可靠性
即使某個數(shù)據(jù)節(jié)點出現(xiàn)故障失效,也不會造成數(shù)據(jù)丟失。
聲明:本文章為學(xué)習(xí)相關(guān)信息展示文章,非課程及服務(wù)內(nèi)容文章,產(chǎn)品及服務(wù)詳情可咨詢網(wǎng)站客服微信。
文章轉(zhuǎn)載須注明來源,文章素材來源于網(wǎng)絡(luò),若侵權(quán)請與我們聯(lián)系,我們將及時處理。

