CGFT大數據中,HBase數據模型是需要重點掌握的。下文是對它的詳細介紹,一起隨融躍小編卡看吧!
HBase是一個稀疏、多維度、排序的映射表,這張表的索引是行鍵、列族、列限定符和時間戳。每個值是一個未經結束的字符串,沒有數據類型。
用戶在表中存儲數據,每一行都有一個可排序行鍵和任意多的列。表在水平方向由一個或多個列族組成,一個列族中可以包含任意多個列,同一個列族里面的數據存儲在一起。
列族支持動態擴展,可以很輕松地添加一個列族或列,無需預先定義列的數量以及類型,所有列均以字符串形式存儲,用戶需要自行進行數據類型轉換。
由于同一張表里面的每一行數據都可以有截然不同的列,因此,對于整個映射表的每行數據而言,有些列的值就是空的,所以好HBase是稀疏的。
HBase中執行更新操作時,并不會刪除數據舊的版本,而是生成一個新的版本,舊有的版本仍然保留,HBase可以對允許保留的版本的數量進行設置。客戶端可以選擇獲取距離某個時間zui近的版本,或者一次獲取所有版本。
如果在查詢的時候不提供時間戳,那么會返回距離現在zui近的那一個版本的數據,因為在存儲的時候,數據會按照時間戳排序。
HBase提供了兩種數據版本回收方式,一是保存數據的zui后n個版本,而是保存zui近一段時間內的版本。
聲明:本文章為學習相關信息展示文章,非課程及服務內容文章,產品及服務詳情可咨詢網站客服微信。
文章轉載須注明來源,文章素材來源于網絡,若侵權請與我們聯系,我們將及時處理。


