CGFT大數據原理中數據錯誤與恢復怎么去學習?HDFS具有較高的容錯性,可以兼容廉價的硬件,它把硬件出錯看成一種常態,而不是異常,并設計了相應的機制檢測數據錯誤和進行自動恢復,主要包括以下幾種情形。
1.名稱節點出錯
名稱節點保存了所有的元數據信息,其中,*核心的兩大數據結構是Fslmage和Editlog,如果這兩個文件發生損壞,那么整個HDFS實例將失效。
當名稱節點出錯時,就可以根據備份服務器SecondaryNameNode中的Fslmage和Editlog數據進行恢復。
2.數據節點出錯
每個數據節點會定期向名稱節點發送“心跳”信息,向名稱節點報告自己的狀態。
當數據節點發生故障,或者網絡發生斷網時,名稱節點就無法收到來自一些數據節點的心跳信息,這時,這些數據節點就會被標記為“巖機”,節點上面的所有數據都會被標記為“不可讀”,名稱節點不會再給它們發送任何I/O請求。
3.數據出錯
網絡傳輸和磁盤錯誤等因素,都會造成數據錯誤。客戶端在讀取到數據后,會采用md5和shal對數據塊進行校驗,以確定讀取到正確的數據。
在文件被創建時,客戶端就會對每一個文件塊進行信息摘錄,并把這些信息寫入同一個路徑的隱藏文件里面。
					
					    聲明:本文章為學習相關信息展示文章,非課程及服務內容文章,產品及服務詳情可咨詢網站客服微信。
					    文章轉載須注明來源,文章素材來源于網絡,若侵權請與我們聯系,我們將及時處理。
					
                    
                    
                
          