工業(yè)互聯(lián)網(wǎng)時代,我們?yōu)槭裁葱枰獣r序數(shù)據(jù)庫之二:適合的就是最好的

時間:2019-01-30

來源:網(wǎng)絡(luò)轉(zhuǎn)載

導(dǎo)語:為什么強大的Oracle、PostgreSQL等傳統(tǒng)關(guān)系型數(shù)據(jù)庫搞不定時序數(shù)據(jù)?為什么不用HBase、MongoDB、Cassandra等先進(jìn)的分布式數(shù)據(jù)庫來解決工業(yè)數(shù)據(jù)問題?

導(dǎo)讀:為什么強大的Oracle、PostgreSQL等傳統(tǒng)關(guān)系型數(shù)據(jù)庫搞不定時序數(shù)據(jù)?為什么不用HBase、MongoDB、Cassandra等先進(jìn)的分布式數(shù)據(jù)庫來解決工業(yè)數(shù)據(jù)問題?

在上周的格物匯文章中,我們給大家介紹過,目前國內(nèi)外主流工業(yè)互聯(lián)網(wǎng)平臺幾乎都是采用時序數(shù)據(jù)庫來承接海量涌入的工業(yè)數(shù)據(jù)。那為什么強大的Oracle、PostgreSQL等傳統(tǒng)關(guān)系型數(shù)據(jù)庫搞不定時序數(shù)據(jù)?為什么不用HBase、MongoDB、Cassandra等先進(jìn)的分布式數(shù)據(jù)庫來解決工業(yè)數(shù)據(jù)問題?

作為資深“杠精”,當(dāng)然需要先知道要“杠”的到底是什么?就時序數(shù)據(jù)庫而言,就是要“杠”兩個東西:1、“杠”數(shù)據(jù);2、“杠”數(shù)據(jù)庫。

先從數(shù)據(jù)“杠”起,數(shù)據(jù)可是一個高深莫測的東西。

想當(dāng)年圖靈用他深邃的眼睛,看穿了世間萬物的計算本質(zhì):凡是可以計算的,通過迭代,最終都可以表示為0、1的邏輯判斷。圖靈機需要一個無限長的紙帶來表征和記錄計算,這無限長的紙帶上記錄的0、1的組合,就是數(shù)據(jù)最原始的抽象。圖靈機指出了數(shù)據(jù)的3個核心需求:1、數(shù)據(jù)存儲;2、數(shù)據(jù)寫入;3、數(shù)據(jù)讀取。

可以說,目前所有數(shù)據(jù)庫、文件系統(tǒng)等等,都是為了以最佳性價比來滿足數(shù)據(jù)的這三個核心需求。對時序數(shù)據(jù)而言,其三個核心需求特征十分明顯:

數(shù)據(jù)寫入

時間是一個主坐標(biāo)軸,數(shù)據(jù)通常按照時間順序抵達(dá)

大多數(shù)測量是在觀察后的幾秒或幾分鐘內(nèi)寫入的,抵達(dá)的數(shù)據(jù)幾乎總是作為新條目被記錄

95%到99%的操作是寫入,有時更高

更新幾乎沒有

數(shù)據(jù)讀取

隨機位置的單個測量讀取、刪除操作幾乎沒有

讀取和刪除是批量的,從某時間點開始的一段時間內(nèi)

時間段內(nèi)讀取的數(shù)據(jù)有可能非常巨大

數(shù)據(jù)存儲

數(shù)據(jù)結(jié)構(gòu)簡單,價值隨時間推移迅速降低

通過壓縮、移動、刪除等手段降低存儲成本

而關(guān)系數(shù)據(jù)庫主要應(yīng)對的數(shù)據(jù)特點:

(1)數(shù)據(jù)寫入:大多數(shù)操作都是DML操作,插入、更新、刪除等;

(2)數(shù)據(jù)讀?。鹤x取邏輯一般都比較復(fù)雜;

(3)數(shù)據(jù)存儲:很少壓縮,一般也不設(shè)置數(shù)據(jù)生命周期管理。

因此,從數(shù)據(jù)本質(zhì)的角度而言,時序數(shù)據(jù)庫(不變性,唯一性以及可排序性)和關(guān)系型數(shù)據(jù)庫的服務(wù)需求完全不同。

再說說數(shù)據(jù)庫。數(shù)據(jù)庫系統(tǒng)的發(fā)展從20世紀(jì)60年代中期開始到現(xiàn)在,經(jīng)歷若干代演變,造就了C.W.Bachman(巴克曼)、E.F.Codd(考特)和J.Gray(格雷)三位圖靈獎得主,發(fā)展了以數(shù)據(jù)科學(xué)、數(shù)據(jù)建模和數(shù)據(jù)庫管理系統(tǒng)(DBMS)等為核心理論、技術(shù)和產(chǎn)品的一個巨大的軟件產(chǎn)業(yè)(詳見下圖,資料來源:https://db-engines.com/en/ranking_categories)。

工業(yè)互聯(lián)網(wǎng)

從上圖可以得出一個結(jié)論,針對不同的數(shù)據(jù)需求,應(yīng)該有不同的數(shù)據(jù)庫系統(tǒng)應(yīng)對之。否則,也沒有必要出現(xiàn)這么多種的數(shù)據(jù)庫系統(tǒng)了。

時間序列數(shù)據(jù)跟關(guān)系型數(shù)據(jù)庫有太多不同,但是很多公司并不想放棄關(guān)系型數(shù)據(jù)庫。于是就產(chǎn)生了一些特殊的用法,比如:用MySQL的VividCortex,用Postgres的TimescaleDB;當(dāng)然,還有人依賴K-V、NoSQL數(shù)據(jù)庫或者列式數(shù)據(jù)庫的,比如:OpenTSDB的HBase,而Druid則是一個不折不扣的列式存儲系統(tǒng);更多人覺得特殊的問題需要特殊的解決方法,于是很多時間序列數(shù)據(jù)庫從頭寫起,不依賴任何現(xiàn)有的數(shù)據(jù)庫,比如:Graphite,InfluxDB。

工業(yè)互聯(lián)網(wǎng)

對選擇數(shù)據(jù)庫的開發(fā)者和使用者而言,針對時序數(shù)據(jù)庫和關(guān)系型數(shù)據(jù)庫之間選擇,也主要考慮以下幾個因素:

性能

研究過Oracle的存儲結(jié)構(gòu)和索引結(jié)構(gòu)的都知道Oracle的ACID強一致性和B-Tree,保證強一致性導(dǎo)致數(shù)據(jù)持久化、可靠性、可用性實現(xiàn)的邏輯復(fù)雜,而加速數(shù)據(jù)訪問,則需要Oracle數(shù)據(jù)庫使用B-Tree存儲索引。

B-Tree結(jié)構(gòu)的有很多優(yōu)勢:在索引中從任何地方檢索任何記錄都大約花費相同的時間;B-Tree對大范圍查詢提供優(yōu)秀的檢索性能,包括精確匹配和訪問查詢;插入、更新和刪除操作有效,維護(hù)鍵的順序,以便快速檢索;B-Tree性能對小表和大表都很好,不會隨著表的增長而降低。從Tree這個名字就可以看出,這種B-Tree就是為了解決隨機讀寫問題的。

而時序數(shù)據(jù)庫,核心問題去解決批量讀寫,對于95%以上場景都是寫入的時序數(shù)據(jù)庫,B-Tree很明顯是不合適的,業(yè)界主流都是采用LSMTree(LogStructuredMergeTree)或者LSM的“升級版”TSM(TimeSortMergeTree)替換B-Tree,比如Hbase、Cassandra、InfluxDB等。LSMTree核心思想就是通過內(nèi)存寫和后續(xù)磁盤的順序?qū)懭氆@得更高的寫入性能,避免了隨機寫入。

LSMTree簡單操作流程如下:

數(shù)據(jù)寫入和更新時首先寫入位于內(nèi)存里的數(shù)據(jù)結(jié)構(gòu)。同時,為了避免數(shù)據(jù)丟失也會先寫到磁盤文件中。

內(nèi)存里的數(shù)據(jù)結(jié)構(gòu)會定時或者達(dá)到固定大小會刷到磁盤。

隨著磁盤上積累的文件越來越多,會定時的進(jìn)行合并操作,減少文件數(shù)量。

在內(nèi)存or文件中,對數(shù)據(jù)進(jìn)行壓縮、去重等操作。

還有一個提升性能的關(guān)鍵點,即:分布式處理。這里以InfluxDB為例來說明。(順便吐槽一下:InfluxDB單機版開源,集群版收費……,扔個魚餌,“吃相”難看呀。)

工業(yè)互聯(lián)網(wǎng)

上圖是InfluxDB的邏輯存儲架構(gòu)圖,通過RP、ShardGroup、Shard的逐層分解,寫入數(shù)據(jù)被盡可能的分布攤平。最后,每個Shard的TSM引擎負(fù)責(zé)對數(shù)據(jù)進(jìn)行處理。ShardGroup實現(xiàn)了數(shù)據(jù)分區(qū),但是Shard才是InfluxDB中真正存儲數(shù)據(jù)以及提供讀寫服務(wù)的服務(wù)。Shard是InfluxDB的TSMEngine,負(fù)責(zé)數(shù)據(jù)的編碼存儲、讀寫服務(wù)等。

工業(yè)互聯(lián)網(wǎng)

通常分布式數(shù)據(jù)庫一般有兩種Sharding策略:RangeSharding和HashSharding,前者對于基于主鍵的范圍掃描比較高效;后者對于離散大規(guī)模寫入以及隨即讀取相對比較友好。

InfluxDB的Sharding策略是典型的兩層Sharding,上層使用RangeSharding,下層使用HashSharding。對于時序數(shù)據(jù)庫來說,基于時間的RangeSharding是最合理的考慮,但如果僅僅使用TimeRangeSharding,會存在一個很嚴(yán)重的問題,即寫入會存在熱點,基于TimeRangeSharding的時序數(shù)據(jù)庫寫入必然會落到最新的Shard上,其他老Shard不會接收寫入請求。對寫入性能要求很高的時序數(shù)據(jù)庫來說,熱點寫入肯定不是最優(yōu)的方案。解決這個問題最自然的思路就是再使用Hash進(jìn)行一次分區(qū),基于Key的Hash分區(qū)方案可以通過散列很好地解決熱點寫入的問題。

Shard分區(qū)好了,就可以采用分布式集群架構(gòu)予以支撐,分?jǐn)倝毫Γ岣卟⑿卸取?/p>

成本和功能

很多時間序列數(shù)據(jù)都沒有多大用處,特別是當(dāng)系統(tǒng)長時間正常運行時,完整的歷史數(shù)據(jù)意義并不大。而這些低價值數(shù)據(jù),占據(jù)大量高價值存儲空間,會讓企業(yè)“抓狂”。因此,一些共通的對時間序列數(shù)據(jù)分析的功能和操作:數(shù)據(jù)壓縮、數(shù)據(jù)保留策略、連續(xù)查詢、靈活的時間聚合等,都是為了解決時序數(shù)據(jù)庫的性價比問題的。同時,有些數(shù)據(jù)庫比如RDDTool和Graphite會自動刪除高精度的數(shù)據(jù),只保留低精度的。而這些“功能”對關(guān)系型數(shù)據(jù)庫而言,簡直是不可想象的。

還有一些成本很多人會忘記考慮,比如:License,用需要License的關(guān)系型數(shù)據(jù)庫來存儲時序數(shù)據(jù),成本根本沒法承受。

至此,我們得出的結(jié)論就一個:選擇到底用什么數(shù)據(jù)庫來支持時序數(shù)據(jù),還是需要對時序數(shù)據(jù)的需求進(jìn)行透徹的分析,然后根據(jù)時序數(shù)據(jù)的特點,來選擇適合的數(shù)據(jù)庫。

啟用名言作為本文結(jié)尾:適合的,就是最好的。

聲明:本文為轉(zhuǎn)載類文章,如涉及版權(quán)問題,請及時聯(lián)系我們刪除(QQ: 2737591964,不便之處,敬請諒解!

中傳動網(wǎng)版權(quán)與免責(zé)聲明:

凡本網(wǎng)注明[來源:中國傳動網(wǎng)]的所有文字、圖片、音視和視頻文件,版權(quán)均為中國傳動網(wǎng)(www.treenowplaneincome.com)獨家所有。如需轉(zhuǎn)載請與0755-82949061聯(lián)系。任何媒體、網(wǎng)站或個人轉(zhuǎn)載使用時須注明來源“中國傳動網(wǎng)”,違反者本網(wǎng)將追究其法律責(zé)任。

本網(wǎng)轉(zhuǎn)載并注明其他來源的稿件,均來自互聯(lián)網(wǎng)或業(yè)內(nèi)投稿人士,版權(quán)屬于原版權(quán)人。轉(zhuǎn)載請保留稿件來源及作者,禁止擅自篡改,違者自負(fù)版權(quán)法律責(zé)任。

如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。

關(guān)注伺服與運動控制公眾號獲取更多資訊

關(guān)注直驅(qū)與傳動公眾號獲取更多資訊

關(guān)注中國傳動網(wǎng)公眾號獲取更多資訊

最新新聞
查看更多資訊

娓娓工業(yè)

廣州金升陽科技有限公司

熱搜詞
  • 運動控制
  • 伺服系統(tǒng)
  • 機器視覺
  • 機械傳動
  • 編碼器
  • 直驅(qū)系統(tǒng)
  • 工業(yè)電源
  • 電力電子
  • 工業(yè)互聯(lián)
  • 高壓變頻器
  • 中低壓變頻器
  • 傳感器
  • 人機界面
  • PLC
  • 電氣聯(lián)接
  • 工業(yè)機器人
  • 低壓電器
  • 機柜
回頂部
點贊 0
取消 0