[導讀]這是一個紛雜而無規(guī)則的世界,越想忘掉的事情,越難忘記。??????正文??Redis本身內(nèi)容繁雜,要是上來就研究一細節(jié)點,如連接池、數(shù)據(jù)結(jié)構(gòu),雖可直接學到某個點的詳盡源碼內(nèi)容,甚至盡快解決一些事故,但容易溺死在細節(jié)汪洋,無法整體把控Redis。最好是先建立起“架構(gòu)”。想精通Red...
這是一個紛雜而無規(guī)則的世界,越想忘掉的事情,越難忘記。??? ?? ?正文? ?
Redis本身內(nèi)容繁雜,要是上來就研究一細節(jié)點,如連接池、數(shù)據(jù)結(jié)構(gòu),雖可直接學到某個點的詳盡源碼內(nèi)容,甚至盡快解決一些事故,但容易溺死在細節(jié)汪洋,無法整體把控Redis。最好是先建立起“架構(gòu)”。想精通Redis,須能領(lǐng)略其總體架構(gòu),再深入具體技術(shù)點。構(gòu)造Redis 這種 KV DB,首要考慮:- 數(shù)據(jù)模型
能存什么數(shù)據(jù)?如用戶信息(用戶ID、name、age、sex等),通常用 MySQL,在一個用戶ID對應一個用戶信息集合的場景下,就是KV?DB的數(shù)據(jù)模型之一,也能滿足這類存儲需求。 - 操作接口
可以怎么操作數(shù)據(jù)?如計算多個用戶的avg年齡,KV DB則無法勝任。因其只提供了簡單的操作接口,并不支持復雜聚合計算。
所以,先搞懂數(shù)據(jù)模型和操作接口,才能物盡其用。
數(shù)據(jù)模型
KV DB,最基本數(shù)據(jù)模型就是KV模型。選型KV DB時,一大因素就是其支持的V類型:- Memcached僅支持String V類型
- 而Redis支持的V類型還包括hash、list、set等
所以Redis能被更廣泛應用。
對 crud boy來說,不同V類型就意味著能支持多種業(yè)務的數(shù)據(jù)需求。
操作接口無論什么DB,基本操作都逃不開 crud:- PUT:新寫入或更新一個KV對
- GET:根據(jù)一個key讀取相應的V值
- DELETE:根據(jù)一個key刪除整個KV對
- SCAN操作:根據(jù)一段K范圍,返回相應V值
內(nèi)存 or 外存?
- 在內(nèi)存,讀寫快,百ns級。風險是一旦掉電,會丟失所有數(shù)據(jù)
- 在外存,雖可避免數(shù)據(jù)丟失,但受限于磁盤慢速讀寫(幾ms級別),KV DB整體性能會被拉低。
因此,需根據(jù)KV DB應用場景來選型。
如緩存場景下的數(shù)據(jù)需要能快速訪問但允許丟失,則采用內(nèi)存保存KV數(shù)據(jù)。
訪問模式選型
- 通過函數(shù)庫調(diào)用供外部使用如libsimplekv.so,就是以動態(tài)鏈接庫的形式鏈接到我們自己的程序,提供KV存儲功能,如RocksDB。
- 通過網(wǎng)絡框架,以Socket通信對外提供KV對操作,可提供廣泛的KV存儲服務
如Memcached和Redis。
通過網(wǎng)絡框架提供KV存儲服務:- 擴大了KV DB的生態(tài)
- 給KV DB的性能、運行模型提供了不同選型,帶來潛在問題
比如,當客戶端發(fā)送如下命令,該命令會被封裝在網(wǎng)絡包中發(fā)送給KV DB:PUT java edge
KV DB網(wǎng)絡框架接收到網(wǎng)絡包,并按照相應的協(xié)議進行解析后,可知客戶端想寫入一個鍵值對,并開始實際寫入。
I/O模型設(shè)計
網(wǎng)絡連接的處理、解析客戶端的請求及數(shù)據(jù)存取的處理,應該選擇怎樣的線程模型?- 一個線程,既要處理網(wǎng)絡連接、解析請求,又要完成數(shù)據(jù)存取,一旦某一步操作發(fā)生阻塞,整個線程就會阻塞住,這就降低了系統(tǒng)響應速度
- 多線程處理不同操作,則某個線程被阻塞時,其他線程還能正常運行。但不同線程間如果需要訪問共享資源,又會產(chǎn)生線程競爭,影響系統(tǒng)效率
所以,這里也還需精心設(shè)計。
KV對的定位
知道了要進行的KV對操作,就得查找所要操作的KV對是否存在,這就依賴KV DB的索引模塊:讓KV DB據(jù)key找到相應V的存儲位置。
不同KV DB采用的索引:- Memcached、Redis采用哈希表
- RocksDB采用跳表
一般內(nèi)存KV DB(如Redis)采用哈希表作為索引,主要因其KV基本都保存在內(nèi)存,而內(nèi)存高性能隨機訪問特性與哈希表O(1)復雜度匹配。
Redis的V支持多種類型,當通過索引找到一個K所對應V,仍需從V的復雜結(jié)構(gòu)(如set或list)中進一步找到想要數(shù)據(jù),該操作的效率本身就依賴其實現(xiàn)結(jié)構(gòu)。而Redis便采用一些高效的索引結(jié)構(gòu)作為某些V類型的底層數(shù)據(jù)結(jié)構(gòu)。
各操作的具體邏輯
不同操作找到V的存儲位置后的操作:- GET/SCAN
根據(jù)V的存儲位置返回V值 - PUT
為該KV對分配內(nèi)存空間 - DELETE
刪除KV對,并釋放內(nèi)存空間,該過程由分配器完成
重啟后快速提供服務
KV DB的KV對大小不一,分配器在處理隨機的大小內(nèi)存塊分配時,表現(xiàn)不好的話,一旦KV對數(shù)據(jù)規(guī)模過大,可能導致嚴重內(nèi)存碎片。所以分配器是KV DB中的關(guān)鍵。對內(nèi)存存儲為主的Redis更重要。Redis的內(nèi)存分配器提供了多種選擇,分配效率也不同。KV DB雖依賴內(nèi)存保存數(shù)據(jù),提供快速訪問,但也希望KV DB重啟后能快速重新提供服務,所以,在其存儲模塊增加持久化功能。
因為磁盤管理比內(nèi)存管理復雜,KV DB直接采用文件形式,將KV數(shù)據(jù)通過調(diào)用本地文件系統(tǒng)的操作接口保存在磁盤。
此時,KV DB只需考慮何時將內(nèi)存中的KV數(shù)據(jù)保存到文件:- 每個KV對都落盤保存,這雖然讓數(shù)據(jù)更可靠,但每次都寫盤,性能受大影響
- 周期性把內(nèi)存中的KV對保存到文件,避免頻繁寫盤。但數(shù)據(jù)有丟失風險
所以,Redis提供了持久化功能,還有多種執(zhí)行機制和性能優(yōu)化點。
KV DB - Redis 架構(gòu)
本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。