CGFT大數據中,HDFS體系結構主要包含什么,是需要考生重點掌握的!

1、HDFS命名空間管理

HDFS的命名空間包含目錄、文件和塊,命名空間管理是指命名空間支持對HDFS中的目錄、文件和塊做類似文件系統的創建、修改、刪除等基本操作。

在當前的HDFS體系結構中,在整個HDFS集群中只有一個命名空間,并且只有一個名稱節點,該節點負責對這個命名空間進行管理。

2、通信協議

HDFS是一個部署在集群上的分布式文件系統,因此,很多數據需要通過網絡進行傳輸。所有的HDFS通信協議都是建構在TCP/IP協議基礎之上的。

特許全球金融科技師CGFT一級

3、客戶端

客戶端是用戶操作HDFS常見的方式,HDFS在部署時都提供了客戶端,不過需要說明的是,嚴格來說,客戶端并不算是HDFS的一部分,客戶端可以支持打開,讀取、寫入等常見的操作,并且提供了類似shell的命令行方式來訪問HDFS中的數據。

此外,HDFS也提供了Java API,作為應用程序訪問文件系統的客戶端編程接口。