CGFT大數據中,HBase與傳統關系數據庫是緊密相連的。下文是對兩者的對比分析介紹,一起看看吧!

關系數據庫發展到今天,已經是一種成熟穩定的數據庫管理系統,通常具備的功能包括面向磁盤的存儲和索引結構、多線程訪問、基于鎖的同步訪問機制、基于日志記錄的恢復機制和事務機制等。

HBase與傳統的關系數據庫的區別主要體現在以下幾個方面:

1. 數據類型

關系數據庫采用關系模型,具有豐富的數據類型和存儲方式,HBase則采用了更加簡單的數據模型。

2. 數據操作

關系數據庫中包含了豐富的操作,如插入、刪除、更新、查詢等,其中會涉及復雜的多表連接,通常是借助于多個表之間的主外鍵關聯來實現的。

3. 存儲模式

關系數據庫是基于行模式存儲的,元祖或行會被連續地存儲在磁盤頁中。在去讀數據時,需要順序掃描每個元祖,然后,曹總篩選出查詢所需要的屬性。

特許全球金融科技師CGFT一級

4. 數據索引

關系數據庫通常可以針對不同列構建復雜的多個索引,以提高數據訪問性能。與關系數據庫不同的是,HBase只有一個索引---行鍵,通過巧妙的設計,HBase中的所有方位方法,或者通過行鍵訪問,或者通過行鍵掃描,從而使得整個系統不會慢下來。

5. 數據維護

在關系數據庫中,更新操作會用zui新的當前值去替換記錄中原來的舊值,舊值被覆蓋后就不會存在。而在HBase中執行更新操作時,并不會刪除數據舊的版本,而是生成一個新的版本,舊有的版本仍然保留。

6. 可伸縮性

關系數據庫很難實現橫向擴展,縱向擴展的空間也比較有限,相反,HBase和bigtable這些分布式數據庫就是為了實現靈活的水平擴展而開發的,能夠輕易地通過在冀全中增加或者減少硬件數量來實現性能的伸縮。

但是,相對于關系數據庫來說,HBase也有自身的局限性,如HBase不支持事務,因此,無法實現跨行的原子性。