在CGFT中,大數據處理框架Hadoop是重要知識點。具體什么是Hadoop,下文作詳細介紹!
Hadoop是Apache軟件基金會旗下一個開源分布式計算平臺,為用戶提供了系統底層細節透明的分布式基礎機構。
Hadoop是基于Java語言開發的,具有很好的跨平臺特性,并且可以部署在廉價的計算機集群中。Hadoop的核心是分布式文件系統和MapReduce。
HAFS是對谷歌文件系統的開源實現,是面向普通硬件環境的分布式文件系統,具有較高的讀寫速度、很好的容錯性和可伸縮性,支持大規模數據的分布式存儲,其冗余數據存儲的方式很好地保zheng了數據的安全性。MapReduce是針對古河MapReduce來整合分布式文件系統上的數據,可以保zheng分析和處理數據的高效性。借助于Hadoop,程序員可以輕松地編寫分布式并行程序,將其運行于廉價計算機集群上,完成海量數據的存儲與計算。
Hadoop被公認為行業大數據標準開源軟件,在分布式環境下提供了海量數據的處理能力。幾乎所有主流廠商圍繞Hadoop提供開發工具、開源軟件、商業化工具和技術服務,如谷歌、雅虎、微軟、思科、淘寶等,都支持Hadoop。
聲明:本文章為學習相關信息展示文章,非課程及服務內容文章,產品及服務詳情可咨詢網站客服微信。
文章轉載須注明來源,文章素材來源于網絡,若侵權請與我們聯系,我們將及時處理。


