<meter id="blnnv"></meter>

                  什么是Time Series Database時序數據庫?

                  業界 來源:胡建洪 2022-05-26 17:10:14

                  1.時序數據庫的定義

                  時序數據是隨時間不斷產生的一系列數據,簡單來說,就是帶時間戳的數據。時序數據庫 (Time Series Database,TSDB) 是優化用于攝取、處理和存儲時間戳數據的數據庫。此類數據可能包括來自服務器和應用程序的指標、來自物聯網傳感器的讀數、網站或應用程序上的用戶交互或金融市場上的交易活動。

                  時序數據的主要數據屬性如下:

                  每個數據點都包含用于索引、聚合和采樣的時間戳。該數據也可以是多維的和相關的;

                  寫多讀少,需要支持秒級和毫秒級甚至納秒級高頻寫入;查詢通常是多維聚合查詢,對查詢的延遲要求比較高

                  數據的匯總視圖(例如,下采樣或聚合視圖、趨勢線)可能比單個數據點提供更多的洞察力。例如,考慮到網絡不可靠性或傳感器讀數異常,我們可能會在一段時間內的某個平均值超過閾值時設置警報,而不是在單個數據點上這樣做;

                  分析數據通常需要在一段時間內訪問它(例如,給我過去一周的點擊率數據);

                  雖然其他數據庫也可以在數據規模較小時一定程度上處理時間序列數據,但 TSDB可以更有效地處理隨時間推移的數據攝取、壓縮和聚合。以車聯網場景為例,20000輛車,每個車60個指標,假設每秒采集一次,那么每秒將上報20000 * 60 = 1200000指標值,即120W數據指標值每秒,每個指標值為16字節(假設僅包括8字節時間戳和8字節的浮點數),則每小時將產生64G左右的數據。而實際上每個指標值還會附帶標簽等額外數據,實際需要存儲空間會更大。

                  簡而言之,時序數據庫是專門用于存儲和處理時間序列數據的數據庫,支持時序數據高效讀寫、高壓縮存儲、插值和聚合等功能。

                  2.時序數據庫相關概念

                  時序數據庫是專門處理時序數據的數據庫,因此其相關概念是和時序數據緊密聯系的,下面是時序數據庫的一些基本概念。

                  * 度量 Metric:Metric 類似關系型數據庫里的表(Table),代表一系列同類時序數據的集合,例如為空氣質量傳感器建立一個 Table,存儲所有傳感器的監測數據。

                  * 標簽 Tag:Tag 描述數據源的特征,通常不隨時間變化,例如傳感器設備,包含設備 DeviceId、設備所在的 Region 等 Tag 信息,數據庫內部會自動為 Tag 建立索引,支持根據 Tag 來進行多維檢索查詢;Tag 由 Tag Key、Tag Value 組成,兩者均為 String 類型。

                  * 時間戳 Timestamp:Timestamp代表數據產生的時間點,可以寫入時指定,也可由系統自動生成;

                  * 量測值 Field:Field描述數據源的量測指標,通常隨著時間不斷變化,例如傳感器設備包含溫度、濕度等Field;

                  * 數據點Data Point: 數據源在某個時間產生的某個量測指標值(Field Value)稱為一個數據點,數據庫查詢、寫入時按數據點數來作為統計指標;

                  * 時間線 Time Series :數據源的某一個指標隨時間變化,形成時間線,Metric + Tags + Field 組合確定一條時間線;針對時序數據的計算包括降采樣、聚合(sum、count、max、min等)、插值等都基于時間線維度進行;


                  3.時序數據庫的發展趨勢

                  時序數據庫的發展趨勢,可以從DB-engines(Knowledge Base of Relational and NoSQL Database Management Systems)獲取獲取到,下圖是DB-engines收錄的數據庫近24個月的發展趨勢,其中時序數據庫的活躍度最高,且隨時間呈現越來越活躍的趨勢。


                  下圖是DB-engines收錄的時序數據庫的排名,其中排名最高的時序數據庫是2013年開源的InfluxDB。


                  時序數據庫應用場景

                  時序數據庫的應用場景在物聯網和互聯網APM等場景應用比較多,下面是列舉了一些時序數據庫的應用場景,但不是全部:

                  * 公共安全:上網記錄、通話記錄、個體追蹤、區間篩選;

                  * 電力行業:智能電表、電網、發電設備的集中監測;

                  * 互聯網:服務器/應用監測、用戶訪問日志、廣告點擊日志;

                  * 物聯網:電梯、鍋爐、機械、水表等各種聯網設備;

                  * 交通行業:實時路況、路口流量監測、卡口數據;

                  * 金融行業:交易記錄、存取記錄、ATM、POS機監測;

                  延伸閱讀
                  • 了解時序數據庫InfluxDB

                    當我們一提到InfluxDB,就會想到時序數據庫(TSDB),InfluxDB的確就是為TSDB而生,不過刨根問底,它到底為什么就是為時序存儲而生,這里面就很有學問了,我正好近期在做這方面的研究,那么

                  • TSDB關注的核心技術點在哪里?

                    說了這么多,是應該看看TSDB到底在技術層面關注哪些核心點了,基于時序業務的基本特點,總結起來TSDB需要關注的技術點主要有這么幾個:高吞吐量寫入能力。這是針對時序業務持續產生海量數據這么一個特點量身

                  • 現在都有哪些TSDB產品?

                    在最近的一年時間里,隨著物聯網技術的不斷成熟,很多創業者都希望能借助這個風口得到更多創業機會。試想當年移動互聯網剛興起的時候,也是誕生了一批規模龐大的創業者,而現在,要想在移動互聯網創業,難度已經非常

                  關注公眾號:拾黑(shiheibook)了解更多

                  贊助鏈接:

                  關注數據與安全,洞悉企業級服務市場:https://www.ijiandao.com/
                  四季很好,只要有你,文娛排行榜:https://www.yaopaiming.com/
                  讓資訊觸達的更精準有趣:https://www.0xu.cn/

                  公眾號 關注網絡尖刀微信公眾號
                  隨時掌握互聯網精彩
                  贊助鏈接
                  一级毛片丰满奶头出奶水,国产成人精品午夜福利2010,亚洲欧美激情精品一区二区,色欲av无码蜜臀AV免费播放,夜夜爽夜夜叫夜夜高潮漏水,av无码aV高潮αV喷吹免费,无码vr熟妇人妻AV在线影片