日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 單片機(jī) > CPP開發(fā)者
[導(dǎo)讀]hi,大家好,今天分享一些對數(shù)據(jù)結(jié)構(gòu)和算法精華總結(jié),希望對大家的面試或者工作有一定的幫助;看完本文可以學(xué)到什么知道哪些數(shù)據(jù)結(jié)構(gòu)和算法在實(shí)際工作中最常用,最重要理解一些設(shè)計(jì)上注意事項(xiàng)(經(jīng)驗(yàn)總結(jié))掌握常用數(shù)據(jù)結(jié)構(gòu)和算法核心知識(shí)點(diǎn)數(shù)據(jù)結(jié)構(gòu)工作中或者開源項(xiàng)目中最常用數(shù)據(jù)結(jié)構(gòu):數(shù)組/lis...


hi,大家好,今天分享一些對數(shù)據(jù)結(jié)構(gòu)和算法精華總結(jié),希望對大家的面試或者工作有一定的幫助;

看完本文可以學(xué)到什么

  • 知道哪些數(shù)據(jù)結(jié)構(gòu)和算法在實(shí)際工作中最常用,最重要

  • 理解一些設(shè)計(jì)上注意事項(xiàng)(經(jīng)驗(yàn)總結(jié))

  • 掌握常用數(shù)據(jù)結(jié)構(gòu)和算法核心知識(shí)點(diǎn)

數(shù)據(jù)結(jié)構(gòu)

工作中或者開源項(xiàng)目中最常用數(shù)據(jù)結(jié)構(gòu):數(shù)組/list hash tree

O(n)結(jié)構(gòu):list/棧/隊(duì)列

O(1)結(jié)構(gòu)數(shù)組/hash/位圖

O(logn)樹形結(jié)構(gòu):紅黑樹/B 樹/skip list


數(shù)組

核心點(diǎn):

1 內(nèi)存空間大小固定,如果支持動(dòng)態(tài)擴(kuò)展,需要內(nèi)存遷移,有一定的性能代價(jià),比如C STL的vector結(jié)構(gòu);

2 內(nèi)存連續(xù),對CPU cache友好,如果內(nèi)存空間足夠,能用數(shù)組就最好用數(shù)組結(jié)構(gòu);

3 ?數(shù)組空間一般都是預(yù)分配的,不會(huì)頻繁申請和釋放,所以可以提供程序性能,這個(gè)做內(nèi)存池優(yōu)化的實(shí)現(xiàn)手段;


鏈表

核心點(diǎn):

  • 可以動(dòng)態(tài)項(xiàng)擴(kuò)縮容,比較節(jié)約空間;

  • 鏈表編程邊界case檢查:??

  • 每個(gè)節(jié)點(diǎn)必須有個(gè)“指針“要么指向其他節(jié)點(diǎn),要么為空,這樣才能把鏈表串起來,任何操作都必須保證鏈表完整性,不允許節(jié)點(diǎn)無故脫鏈,所以任何操作之前,都要思考會(huì)不會(huì)導(dǎo)致節(jié)點(diǎn)脫鏈,如果不下心脫鏈就會(huì)存在內(nèi)存泄漏風(fēng)險(xiǎn);

  • 鏈表作為最基礎(chǔ)數(shù)據(jù)結(jié)構(gòu),很多高級結(jié)構(gòu):隊(duì)列,棧,hash,二叉樹,都是在鏈表基礎(chǔ)上演化而來;


編程技巧

  1. 頭結(jié)點(diǎn)解決什么問題?

頭結(jié)點(diǎn):是虛擬出來的一個(gè)節(jié)點(diǎn),不保存數(shù)據(jù)。頭結(jié)點(diǎn)的next指針指向鏈表中的第一個(gè)節(jié)點(diǎn)。對于頭結(jié)點(diǎn),數(shù)據(jù)域可以不存儲(chǔ)任何信息,也可存儲(chǔ)如鏈表長度等附加信息。頭結(jié)點(diǎn)不是鏈表所必需的。

頭指針:是指向第一個(gè)結(jié)點(diǎn)的指針,如果鏈表沒有引入頭結(jié)點(diǎn),那么頭指針指向的是鏈表的第一個(gè)結(jié)點(diǎn)。頭指針是鏈表所必需的。

[注意]無論是否有頭結(jié)點(diǎn),頭指針始終指向鏈表的第一個(gè)結(jié)點(diǎn)。如果有頭結(jié)點(diǎn),頭指針就指向頭結(jié)點(diǎn)。

1)對鏈表的刪除、插入操作時(shí),第一個(gè)結(jié)點(diǎn)的操作更方便

如果鏈表沒有頭結(jié)點(diǎn),那么頭指針指向的是鏈表的第一個(gè)結(jié)點(diǎn),當(dāng)在第一個(gè)結(jié)點(diǎn)前插入一個(gè)節(jié)點(diǎn)時(shí),那么頭指針要相應(yīng)指向新插入的結(jié)點(diǎn),把第一個(gè)結(jié)點(diǎn)刪除時(shí),頭指針的指向也要更新。也就是說如果沒有頭結(jié)點(diǎn),我們需要維護(hù)著頭指針的指向更新。因?yàn)轭^指針指向的是鏈表的第一個(gè)結(jié)點(diǎn),如果引入頭結(jié)點(diǎn)的話,那么頭結(jié)點(diǎn)的next始終都是鏈表的第一個(gè)結(jié)點(diǎn)。

2)統(tǒng)一空表和非空表的處理

有了頭結(jié)點(diǎn)之后頭指針指向頭結(jié)點(diǎn),不論鏈表是否為空,頭指針總是非空,而且頭結(jié)點(diǎn)的設(shè)置使得對鏈表的第一個(gè)位置上的操作與在表中其它位置上的操作一致,即統(tǒng)一空表和非空表的處理。

  1. 鏈表最常規(guī)操作

刪除: ?遍歷鏈表,找到刪除的節(jié)點(diǎn),保存刪除節(jié)點(diǎn)的pre節(jié)點(diǎn)和next節(jié)點(diǎn);

然后pre和next 串起來

static inline void __list_del(struct list_head * prev, struct list_head * next)
{
? ? next->prev = prev;
? ? prev->next = next;
}再釋放刪除節(jié)點(diǎn)內(nèi)存;

添加: ?遍歷鏈表找到要加入位置(或者節(jié)點(diǎn)),保存該節(jié)點(diǎn)的pre節(jié)點(diǎn)和next節(jié)點(diǎn),然后把新接入插入到鏈表中:

static inline void __list_add(struct list_head *new,
? ? struct list_head *prev,
? ? struct list_head *next)
{
? ? next->prev = new;
? ? new->next = next;
? ? new->prev = prev;
? ? prev->next = new;
}2 ?快慢指針,快慢指針一般都初始化指向鏈表的頭結(jié)點(diǎn) head,前進(jìn)時(shí)快指針 fast 在前,慢指針 slow 在后,巧妙解決一些鏈表中的問題。比如:判定鏈表中是否含有環(huán),尋找鏈表的中點(diǎn), 尋找距離尾部第K個(gè)節(jié)點(diǎn)等;

3 dummy node,dummy node是鏈表問題中一個(gè)重要的技巧,中文翻譯叫“啞節(jié)點(diǎn)”,使用通常針對單鏈表沒有前向指針的問題,保證鏈表的 head不會(huì)在刪除操作中丟失,當(dāng)鏈表的 head 有可能變化(被修改或者被刪除)時(shí),使用 dummy node 可以很好的簡化代碼,最終返回 dummy.next 即新的鏈表。

4 通常鏈表有兩種實(shí)現(xiàn)方式,一種是抽象獨(dú)立型,一種是傳統(tǒng)耦合型;

list作為常用數(shù)據(jù)結(jié)構(gòu),寫代碼時(shí)候經(jīng)常會(huì)遇到,可以看一下傳統(tǒng)list設(shè)計(jì)和抽象list設(shè)計(jì)有什么不一樣。

一般的雙向鏈表一般是如下的結(jié)構(gòu):

  • 有個(gè)單獨(dú)的頭結(jié)點(diǎn)(head)

  • 每個(gè)節(jié)點(diǎn)(node)除了包含必要的數(shù)據(jù)之外,還有2個(gè)指針(pre,next)

  • pre指針指向前一個(gè)節(jié)點(diǎn)(node),next指針指向后一個(gè)節(jié)點(diǎn)(node)

  • 頭結(jié)點(diǎn)(head)的pre指針指向鏈表的最后一個(gè)節(jié)點(diǎn)

  • 最后一個(gè)節(jié)點(diǎn)的next指針指向頭結(jié)點(diǎn)(head)



傳統(tǒng)list如下圖:

傳統(tǒng)的鏈表不同node類型,需要重新定義結(jié)構(gòu),不夠通用化,還需要為node實(shí)現(xiàn)脫鏈、入鏈操作等。

我們需要抽象出一個(gè)“基類”來實(shí)現(xiàn)鏈表的功能,其他數(shù)據(jù)結(jié)構(gòu)只需要簡單的繼承這個(gè)鏈表類就可以了。

抽象型list設(shè)計(jì)如下:

  • 鏈表不是將用戶數(shù)據(jù)保存在鏈表節(jié)點(diǎn)中,而是將鏈表節(jié)點(diǎn)保存在用戶數(shù)據(jù)中

  • 鏈表節(jié)點(diǎn)只有2個(gè)指針(prev和next)

  • prev指針指向前一個(gè)節(jié)點(diǎn)的鏈表節(jié)點(diǎn),next指針指向后一個(gè)節(jié)點(diǎn)(node)的鏈表節(jié)點(diǎn)



如下圖:



這樣設(shè)計(jì)的好處是鏈表的節(jié)點(diǎn)將獨(dú)立于用戶數(shù)據(jù)之外,便于把鏈表的操作獨(dú)立出來,和具體數(shù)據(jù)節(jié)點(diǎn)無關(guān),這里可能有些人會(huì)問,數(shù)據(jù)節(jié)點(diǎn)怎么訪問呢?通過一個(gè)container_of的宏從鏈表節(jié)點(diǎn)找到數(shù)據(jù)節(jié)點(diǎn)起始地址:


找到數(shù)據(jù)節(jié)點(diǎn)起始地址后,通過數(shù)據(jù)節(jié)點(diǎn)定義就可以訪問數(shù)據(jù)。

5 鏈表最核心技巧,就是理解指針操作(包括安全檢查-空指針判斷),不要被指針復(fù)雜的賦值操作搞暈,多敲代碼,找到經(jīng)典的鏈表練習(xí)題(28原則)不斷練習(xí),比如:判斷鏈表是否有環(huán),反轉(zhuǎn)鏈表,合并鏈表等,寫好每一題,再認(rèn)真總結(jié),唯有熟才能生巧。



核心點(diǎn):

  • 需要關(guān)注棧的深度大?。ㄈ萘浚?/p>
  • 棧各個(gè)極端情況處理,比如空,滿,溢出等;

  • 多線程下實(shí)現(xiàn)安全的棧操作;

  • 堆棧很容易被攻擊(緩沖區(qū)溢出攻擊),程序員必須特別注意避免這些實(shí)現(xiàn)的陷阱, 防止代碼產(chǎn)生安全漏洞;


使用場景

1 ?操作系統(tǒng)程序運(yùn)行棧,實(shí)現(xiàn)函數(shù)調(diào)用運(yùn)行機(jī)制;

2 ?操作前進(jìn)和后退,比如編輯器,瀏覽器等;

3 ?編譯器使用,比如表達(dá)式解析,語法檢查等;


隊(duì)列

核心點(diǎn):

  • 隊(duì)列核心作用:應(yīng)用耦合、異步處理、流量削鋒(緩沖);

  • 隊(duì)列各個(gè)極端情況處理,比如空,滿,溢出等;

  • 隊(duì)列支持多線程并發(fā)操作,加鎖或者無鎖隊(duì)列實(shí)現(xiàn);

  • 隊(duì)列零拷貝優(yōu)化,比如隊(duì)列操作零拷貝(操作指針地址或者索引),IO零拷貝;


使用場景

1 各種消息隊(duì)列中間件,比如RabbitMQ、RocketMQ、ActiveMQ、Kafka、ZeroMQ、MetaMq等;

2 各種排隊(duì)(緩沖區(qū))系統(tǒng),操作系統(tǒng)任務(wù)FIFO調(diào)度隊(duì)列,數(shù)據(jù)包發(fā)送隊(duì)列,凡是需要滿足FIFO場景,都是可以用隊(duì)列實(shí)現(xiàn);


Hash結(jié)構(gòu):

hash結(jié)構(gòu)核心點(diǎn):

  1. Hash是以空間換時(shí)間結(jié)構(gòu),需要評估好所有Hash頭結(jié)構(gòu)的內(nèi)存使用量;

  2. Hash桶選擇需要考慮到內(nèi)存和沖突鏈長度大?。ㄓ绊懖檎倚?;

  3. hash的優(yōu)化 --解決hash沖突

    3.1 內(nèi)存有限場景下,就需要優(yōu)化沖突鏈結(jié)構(gòu)(鏈表轉(zhuǎn)紅黑樹);

    3.2 優(yōu)化hash函數(shù),讓hash結(jié)果更均勻;

    3.3 可以考慮雙重hash(空間和時(shí)間,還有編碼復(fù)雜度的一種折中方案)

    ?

  4. 需要考慮hash擴(kuò)容

    4.1 在設(shè)計(jì)hash結(jié)構(gòu)的時(shí)候,需要考慮未來可用戶量增長后導(dǎo)致規(guī)格變大,這樣原先hash結(jié)構(gòu)已經(jīng)不合適,沖突鏈太長,導(dǎo)致查詢效率急速降低,所以再最初設(shè)計(jì)的時(shí)候,需要考慮到rehash設(shè)計(jì)(為什么不一次設(shè)置為最大,因?yàn)閮?nèi)存不是無限的,需要考慮一定時(shí)間還可以提供很好的服務(wù),不需要升級版本),當(dāng)hash沖突鏈太長后,進(jìn)行rehash流程;

    4.2 rehash算法有很多,需要考慮幾點(diǎn):

    a. 要不要保證hash一致性,擴(kuò)容后,重hash還是不變,這個(gè)在負(fù)載均衡網(wǎng)關(guān)里面很重要,需要保證hash選擇RS后端服務(wù)節(jié)點(diǎn)不變,否則會(huì)到存量連接走到其他RS節(jié)點(diǎn),讓服務(wù)變得不可用,甚至斷開(tcp需要建立會(huì)話,其他RS沒有這個(gè)會(huì)話)等。?所以這里可能會(huì)采用一致性hash算法,或者其他hash算法,保證相同client去相同RS。

  5. b. 在rehash過程中,由于需要保證業(yè)務(wù)正常,需要保證在修改過程中,所以為了減少鎖影響,一般采用雙份內(nèi)存,逐步把原h(huán)ash數(shù)據(jù)遷移到新hash結(jié)構(gòu)(防止大規(guī)模rehash導(dǎo)致CPU性能瓶頸),當(dāng)存量遷移完后,可以快速加鎖切換hash結(jié)構(gòu),這樣可以減少服務(wù)不可用時(shí)間;


其實(shí)redis的rehash算法,就是類似這種,屬于漸進(jìn)式rehash算法, 好處在于它采取分而治之的方式, 將 rehash 鍵值對所需的計(jì)算工作均灘到對字典的每個(gè)添加、刪除、查找和更新操作上, 從而避免了集中式 rehash 而帶來的龐大計(jì)算量。

業(yè)界還有其他擴(kuò)容的算法,比如Linear Hash Tables是一種動(dòng)態(tài)擴(kuò)展空間的哈希表,會(huì)隨著插入的元素的增多而自動(dòng)擴(kuò)展空間等;


使用場景

1 redis的dict結(jié)構(gòu)設(shè)計(jì);

2 簽名算法MD5算法;

3 數(shù)據(jù)包校驗(yàn) CRC算法;

4 負(fù)載均衡LB選擇后端服務(wù)器hash算法;

5 布隆過濾器:布隆過濾器被廣泛用于黑名單過濾、垃圾郵件過濾、爬蟲判重系統(tǒng)以及緩存穿透問題。對于數(shù)量小,內(nèi)存足夠大的情況,我們可以直接用hashMap或者h(yuǎn)ashSet就可以滿足這個(gè)活動(dòng)需求了。但是如果數(shù)據(jù)量非常大,比如5TB的硬盤上放滿了用戶的參與數(shù)據(jù),需要一個(gè)算法對這些數(shù)據(jù)進(jìn)行去重,取得活動(dòng)的去重參與用戶數(shù)。這種時(shí)候,布隆過濾器就是一種比較好的解決方案了。


位圖(Bitmap)

核心點(diǎn):

  • 即位(Bit)的集合,是一種數(shù)據(jù)結(jié)構(gòu),可用于記錄大量的0-1狀態(tài),在很多地方都會(huì)用到,優(yōu)勢是可以在一個(gè)非常高的空間利用率下保存大量0-1狀態(tài)。

  • 本質(zhì)上是采用了bit位來表示元素狀態(tài),從而在特定場景下能夠極大的節(jié)省存儲(chǔ)空間,非常適合對海量數(shù)據(jù)的查找,判重,刪除等問題的處理;

  • 數(shù)據(jù)稀疏。又比如要存入(10,8887983,93452134)這三個(gè)數(shù)據(jù),我們需要建立一個(gè) 99999999 長度的 BitMap ,但是實(shí)際上只存了3個(gè)數(shù)據(jù),這時(shí)候就有很大的空間浪費(fèi),碰到這種問題的話,可以通過引入 Roaring BitMap 來解決,就是通過壓縮算法進(jìn)行空間壓縮。

  • 數(shù)據(jù)碰撞。比如將字符串映射到 BitMap 的時(shí)候會(huì)有碰撞的問題,那就可以考慮用 Bloom Filter 來解決,Bloom Filter 使用多個(gè) Hash 函數(shù)來減少?zèng)_突的概率


使用場景

1 在Java里面一個(gè)int類型占4個(gè)字節(jié),假如要對于10億個(gè)int數(shù)據(jù)進(jìn)行處理呢?10億*4/1024/1024/1024=4個(gè)G左右,需要4個(gè)G的內(nèi)存。如果能夠采用bit儲(chǔ),10_0000_0000Bit=1_2500_0000byte=122070KB=119MB, 那么在存儲(chǔ)空間方面可以大大節(jié)省。在Java里面,BitMap已經(jīng)有對應(yīng)實(shí)現(xiàn)的數(shù)據(jù)結(jié)構(gòu)類java.util.BitSet,BitSet的底層使用的是long類型的數(shù)組來存儲(chǔ)元素。

2 redis bitmap;

3 布隆過濾器;

4 ?Linux內(nèi)核(如inode,磁盤塊);

紅黑樹

核心點(diǎn)

  • 在已經(jīng)有了AVL之類的BBST,為什么還需要引入紅黑樹?我們希望數(shù)據(jù)結(jié)構(gòu)具有關(guān)聯(lián)性,即相鄰版本之間,比如說第一次插入,和第二次插入時(shí),樹的結(jié)構(gòu)不能發(fā)生太大變化,應(yīng)該可以經(jīng)過O(1)次數(shù)就可以變化完成。對于AVL樹來說,插入是滿足這個(gè)條件的,刪除卻不滿足這個(gè)條件。紅黑樹就滿足這一特性,插入和刪除操作后的拓?fù)渥兓粫?huì)超過O(1)。

  • 紅黑樹與AVL樹相似,但提供更快的實(shí)時(shí)有界最壞情況下的插入和刪除性能(分別達(dá)到最多兩輪和三輪以平衡樹),但速度稍慢(但仍為O(log n))查找時(shí)間;

  • 紅黑樹和AVL樹一樣都對插入時(shí)間、刪除時(shí)間和查找時(shí)間提供了最好可能的最壞情況擔(dān)保。這不只是使它們在時(shí)間敏感的應(yīng)用,如實(shí)時(shí)應(yīng)用(real time application)中有價(jià)值,而且使它們有在提供最壞情況擔(dān)保的其他數(shù)據(jù)結(jié)構(gòu)中作為基礎(chǔ)模板的價(jià)值;例如,在計(jì)算幾何中使用的很多數(shù)據(jù)結(jié)構(gòu)都可以基于紅黑樹實(shí)現(xiàn)。

  • 紅黑樹在函數(shù)式編程中也特別有用,在這里它們是最常用的持久數(shù)據(jù)結(jié)構(gòu)(persistent data structure)之一,它們用來構(gòu)造關(guān)聯(lián)數(shù)組和集合,每次插入、刪除之后它們能保持為以前的版本。除了的時(shí)間之外,紅黑樹的持久版本對每次插入或刪除需要的空間。

  • 紅黑樹相對于AVL樹來說,犧牲了部分平衡性以換取插入/刪除操作時(shí)少量的旋轉(zhuǎn)操作,整體來說性能要優(yōu)于AVL樹。

  • 維護(hù)紅黑樹的平衡需要考慮7種不同的情況:

  • 紅黑樹為什么綜合性能好?

因?yàn)?strong>紅黑樹利用了緩存。

Robert Sedgewick, ?紅黑樹的發(fā)明人,在《算法(第4版)》 中說過, 紅黑樹等價(jià)于2-3樹, 換句話說,對于每個(gè)2-3樹,都存在至少一個(gè)數(shù)據(jù)元素是同樣次序的紅黑樹。在2-3樹上的插入和刪除操作也等同于在紅黑樹中顏色翻轉(zhuǎn)和旋轉(zhuǎn)。這使得2-3樹成為理解紅黑樹背后的邏輯的重要工具,這也是很多介紹算法的教科書在紅黑樹之前介紹2-3樹的原因,盡管2-3樹在實(shí)踐中不經(jīng)常使用。

其中2-節(jié)點(diǎn) 等價(jià)于普通平衡二叉樹的節(jié)點(diǎn),3-節(jié)點(diǎn) 本質(zhì)上是非平衡性的緩存

當(dāng)需要再平衡(rebalance)時(shí),增刪操作時(shí),2-節(jié)點(diǎn) 與 3-節(jié)點(diǎn)間 的 轉(zhuǎn)化會(huì)吸收不平衡性,減少旋轉(zhuǎn)次數(shù),使再平衡盡快結(jié)束。

在綜合條件下,增刪操作相當(dāng)時(shí),數(shù)據(jù)的隨機(jī)性強(qiáng)時(shí),3-節(jié)點(diǎn)的非平衡性緩沖效果越明顯。因此紅黑樹的綜合性能更優(yōu)。

繼續(xù)追根溯源,紅黑樹的性能優(yōu)勢,本質(zhì)上是用空間換時(shí)間。


發(fā)展:

我們將紅黑樹分成這么幾種類型:左傾紅黑樹、右傾紅黑樹、AA樹。

左傾紅黑樹(LLRB,Left-Learning Red-Black Tree),一個(gè)節(jié)點(diǎn)如果有紅色子節(jié)點(diǎn),那么,它的紅色子節(jié)點(diǎn)是向左傾斜的。

右傾紅黑樹(RLRB,Right-Learning Red-Black Tree),也是一樣的道理,即紅色子節(jié)點(diǎn)向右傾斜。

左傾紅黑樹(*LLRB**)是一種類型的自平衡二叉查找樹。它是紅黑樹的變體,并保證對操作相同漸近的復(fù)雜性,但被設(shè)計(jì)成更容易實(shí)現(xiàn)。

AA樹是紅黑樹的一種變種,是Arne Andersson教授在1993年年在他的論文"Balanced search trees made simple"中介紹,設(shè)計(jì)的目的是減少紅黑樹考慮的不同情況,區(qū)別于紅黑樹的是,AA樹的紅節(jié)點(diǎn)只能作為右葉子,從而大大簡化了維護(hù)2-3樹的模擬,因?yàn)锳A樹有嚴(yán)格的條件(紅節(jié)點(diǎn)只能為右節(jié)點(diǎn)),故只需考慮2種情形:

使用場景

1 C

廣泛用在C 的STL中。如map和set都是用紅黑樹實(shí)現(xiàn)的;

2 Java

Java的TreeMap實(shí)現(xiàn);

HashMap的底層實(shí)現(xiàn),在JDK1.8中為了解決過度哈希沖突帶來的長鏈表,當(dāng)鏈表長度大于某個(gè)閾值會(huì)將鏈表轉(zhuǎn)為紅黑樹;

3 Linux操作系統(tǒng)

?????CFS進(jìn)程調(diào)度算法中,vruntime利用紅黑樹來進(jìn)行存儲(chǔ),選擇最小vruntime節(jié)點(diǎn)調(diào)度。

數(shù)據(jù)包CD / DVD驅(qū)動(dòng)程序執(zhí)行相同的操作。

高分辨率計(jì)時(shí)器代碼使用rbtree來組織未完成的計(jì)時(shí)器請求。

ext3文件系統(tǒng)跟蹤紅黑樹中的目錄條目。

虛擬內(nèi)存結(jié)構(gòu)管理(VMA).。

多路復(fù)用技術(shù)的Epoll的核心結(jié)構(gòu)也是紅黑樹 雙向鏈表。

加密密鑰和網(wǎng)絡(luò)數(shù)據(jù)包均由紅黑樹跟蹤。

4 Linux應(yīng)用程序

nginx用紅黑樹管理timer等。

5 實(shí)際工作中也會(huì)用到紅黑樹

1 我們做的是大流量網(wǎng)關(guān),100G 流量,pps 實(shí)際是5000w pps 左右, 我們路由表項(xiàng)總共是5000w。

2 當(dāng)時(shí)采用數(shù)據(jù)結(jié)構(gòu)是hash list,路由規(guī)模還會(huì)不斷增大,但不能無腦增加hash桶,這個(gè)會(huì)增加內(nèi)存,本身當(dāng)時(shí)網(wǎng)關(guān)內(nèi)存就不是很充裕,所以這里要把list換成紅黑樹。

3 ?但之前l(fā)ist都是用RCU鎖(因?yàn)殒湵聿僮骺梢栽踊?4位指針))實(shí)現(xiàn)多核并發(fā)訪問,但紅黑樹這種樹形結(jié)構(gòu)要實(shí)現(xiàn)無鎖多核并發(fā)一直是比較困難的點(diǎn),每次變更可能會(huì)產(chǎn)生多次位移(旋轉(zhuǎn))操作,多個(gè)操作比較困實(shí)現(xiàn)原子化。

4 ?最終想到一個(gè)比較好方法是 雙份指針,用空間換時(shí)間,紅黑樹維護(hù)兩份指針(骨架),當(dāng)前使用的active指針,更新操作backup指針,等更新backup指針后,再原子交換根節(jié)點(diǎn),這樣不妨礙其他核讀,然后再同步指針拓?fù)潢P(guān)系到備份指針。


跳表(skip list)

核心點(diǎn):

1 跳表本質(zhì)上是對鏈表的一種優(yōu)化,通過逐層跳步采樣的方式構(gòu)建索引,以加快查找速度。使用概率均衡的思路,確定新插入節(jié)點(diǎn)的層數(shù),使其滿足集合分布,在保證相似的查找效率簡化了插入實(shí)現(xiàn)。

2 skiplist的復(fù)雜度和紅黑樹一樣,而且實(shí)現(xiàn)起來更簡單;

3 在并發(fā)環(huán)境下skiplist有另外一個(gè)優(yōu)勢,紅黑樹在插入和刪除的時(shí)候可能需要做一些rebalance的操作,這樣的操作可能會(huì)涉及到整個(gè)樹的其他部分,而skiplist的操作顯然更加局部性一些,鎖需要盯住的節(jié)點(diǎn)更少,因此在這樣的情況下性能好一些;

使用場景

1 HBase MemStore 的數(shù)據(jù)結(jié)構(gòu):HBase 屬于 LSM Tree 結(jié)構(gòu)的數(shù)據(jù)庫,LSM Tree 結(jié)構(gòu)的數(shù)據(jù)庫有個(gè)特點(diǎn),實(shí)時(shí)寫入的數(shù)據(jù)先寫入到內(nèi)存,內(nèi)存達(dá)到閾值往磁盤 flush 的時(shí)候,會(huì)生成類似于 StoreFile 的有序文件,而跳表恰好就是天然有序的,所以在 flush 的時(shí)候效率很高。

2 Google 開源的 key/value 存儲(chǔ)引擎 LevelDB 以及 Facebook 基于 LevelDB 優(yōu)化的 RocksDB 都是 LSM Tree 結(jié)構(gòu)的數(shù)據(jù)庫,他們內(nèi)部的 MemTable 都是使用了跳表這種數(shù)據(jù)結(jié)構(gòu);

3 ?redis的sorted set內(nèi)部實(shí)現(xiàn);


B/B 樹(平衡多路查找樹)


核心點(diǎn):

1 B樹和B+樹的出現(xiàn)是因?yàn)榇疟PIO;眾所周知,IO操作的效率很低,那么,當(dāng)在大量數(shù)據(jù)存儲(chǔ)中,查詢時(shí)我們不能一下子將所有數(shù)據(jù)加載到內(nèi)存中,只能逐一加載磁盤頁,每個(gè)磁盤頁對應(yīng)樹的節(jié)點(diǎn)。造成大量磁盤IO操作(最壞情況下為樹的高度)。平衡二叉樹由于樹深度過大而造成磁盤IO讀寫過于頻繁,進(jìn)而導(dǎo)致效率低下。所以,我們?yōu)榱藴p少磁盤IO的次數(shù),就你必須降低樹的深度,將“瘦高”的樹變得“矮胖”。一個(gè)基本的想法就是:

  1. 每個(gè)節(jié)點(diǎn)存儲(chǔ)多個(gè)元素

  2. 摒棄二叉樹結(jié)構(gòu),采用多叉樹

這樣就引出來了一個(gè)新的查找樹結(jié)構(gòu) ——多路查找樹(multi-way search tree)。一顆平衡多路查找樹自然可以使得數(shù)據(jù)的查找效率保證在O(logN)這樣的對數(shù)級別上。

2 B-Tree是為磁盤等外存儲(chǔ)設(shè)備設(shè)計(jì)的一種平衡查找樹。系統(tǒng)從磁盤讀取數(shù)據(jù)到內(nèi)存時(shí)是以磁盤塊(block)為基本單位的,位于同一個(gè)磁盤塊中的數(shù)據(jù)會(huì)被一次性讀取出來,B Tree是在B-Tree基礎(chǔ)上 ? 的一種優(yōu)化,使其更適合實(shí)現(xiàn)外存儲(chǔ)索引結(jié)構(gòu);

3 B Tree 只有葉子結(jié)點(diǎn)存儲(chǔ)數(shù)據(jù),所有非葉子結(jié)點(diǎn)(內(nèi)部結(jié)點(diǎn))不存儲(chǔ)數(shù)據(jù),只有指向子結(jié)點(diǎn)的指針。葉子結(jié)點(diǎn)均在同一層,且葉子結(jié)點(diǎn)之間類似于鏈表結(jié)構(gòu),即有指針指向下一個(gè)葉子結(jié)點(diǎn);

4 由于B 樹在內(nèi)部節(jié)點(diǎn)上不包含數(shù)據(jù)信息,因此在內(nèi)存頁中能夠存放更多的key。數(shù)據(jù)存放的更加緊密,具有更好的空間局部性。因此訪問葉子節(jié)點(diǎn)上關(guān)聯(lián)的數(shù)據(jù)也具有更好的緩存命中率

5 B 樹的葉子結(jié)點(diǎn)都是相鏈的,因此對整棵樹的便利只需要一次線性遍歷葉子結(jié)點(diǎn)即可。而且由于數(shù)據(jù)順序排列并且相連,所以便于區(qū)間查找和搜索。而B樹則需要進(jìn)行每一層的遞歸遍歷,相鄰的元素可能在內(nèi)存中不相鄰,所以緩存命中性沒有B 樹好,B樹也有優(yōu)點(diǎn),其優(yōu)點(diǎn)在于:由于B樹的每一個(gè)節(jié)點(diǎn)都包含key和value,因此經(jīng)常訪問的元素可能離根節(jié)點(diǎn)更近,因此訪問也更迅速。


使用場景

MySQL InnoDB存儲(chǔ)引擎就是用B Tree實(shí)現(xiàn):

  • 每個(gè)級別的所有頁面都相互雙向鏈接,并且在每個(gè)頁面內(nèi),記錄按升序單獨(dú)鏈接。非葉頁包含“指針”(包含子頁碼)而不是非關(guān)鍵行數(shù)據(jù)。

算法

一些的重要算法,很多算法在工作中都經(jīng)常使用;



排序算法核心:


核心點(diǎn):

  • 穩(wěn)定性得好處:從一個(gè)鍵上排序,然后再從另一個(gè)鍵上排序,第一個(gè)鍵排序的結(jié)果可以為第二個(gè)鍵排序所用,多重key值排序;

  • 大多數(shù)語言的標(biāo)準(zhǔn)庫排序算法是快速排序

核心原理是通過選擇一個(gè)元素作為基點(diǎn),然后通過與基點(diǎn)比較,根據(jù)比較結(jié)果進(jìn)行分類(移動(dòng)元素),再遞歸下去,直到不能遞歸為止,這樣整個(gè)數(shù)組就有序了;

標(biāo)準(zhǔn)庫中的sort,是通過先快排,遞歸深度超過一個(gè)閥值就改成堆排,然后對最后的幾個(gè)進(jìn)行插入排序來實(shí)現(xiàn)的;

快速排序復(fù)雜度是nlogn,但實(shí)際綜合性能最好;

原因:

1. 快速排序中,每次數(shù)據(jù)移動(dòng)都意味著該數(shù)據(jù)距離它正確的位置越來越近,而在其他同等級排序中,類似將堆尾部的數(shù)據(jù)移到堆頂這樣的操作只會(huì)使相應(yīng)的數(shù)據(jù)遠(yuǎn)離它正確的位置,后續(xù)必然有一些操作再將其移動(dòng),即“做了好多無用功”。

2. 快速排序通常比其他排序算法快得多,因?yàn)樗偷剡\(yùn)行,無需創(chuàng)建任何輔助數(shù)組來保存臨時(shí)值。與歸并排序之類的東西相比,這可能是一個(gè)巨大的優(yōu)勢,因?yàn)榉峙浜腿∠峙漭o助數(shù)組所需的時(shí)間可能很明顯。就地操作還提高了快速排序的局部性。?????????????????

? ? ? ? ? ?

  • 增量型排序(比如實(shí)時(shí)計(jì)算topN這種)采用是堆排序(最小堆或者最大堆);


字符串匹配算法

核心點(diǎn):

  • 盡可能利用一切可以利用信息,比如模式串本身信息,后綴信息,比較后的殘余信息等;

  • 掌握正則表達(dá)式語法;

  • 理解模式匹配:KMP、Boyer-Moore算法;

使用場景:

1 ?linux文本處理三劍客 grep ,awk, sed 等用了大量正則表達(dá)式算法。

2 文本編輯器使用大量字符串匹配算法。


圖論

核心點(diǎn):

  • 實(shí)際工作中網(wǎng)絡(luò)會(huì)用到部分圖算法,比如網(wǎng)絡(luò)拓?fù)渑判?,OSPF路由協(xié)議(最短路徑);

  • 如果你要參加ACM or OJ 這種比賽,可以學(xué)一些常用圖算法:最短路徑、最小生成樹、網(wǎng)絡(luò)流建模;

使用場景:

1 游戲開發(fā)中會(huì)用到大量的圖算法:路徑搜索算法(BFS,DFS,A*);

2 導(dǎo)航軟件會(huì)用到大量的圖算法:最短路徑,路徑搜索算法;

3 網(wǎng)絡(luò)bridge的STP協(xié)議用到最小生成樹算法;

4 網(wǎng)頁排名中PageRank 算法;


搜索(遍歷) 剪枝

核心點(diǎn):

  • 核心是減少解空間,窮舉 排除法;

  • 核心是減少解空間,遞歸 判斷;

使用場景:

1 ?深度優(yōu)先搜索、廣度優(yōu)先搜索、A*算法、回溯算法、蒙特卡洛樹搜索;


二分法

核心點(diǎn):

  • 前置條件,需要有序;

  • 全面考慮算法邊界點(diǎn),實(shí)現(xiàn)細(xì)節(jié),溢出等問題;

  • 不能在線增量計(jì)算;


使用場景:

1 用二分法計(jì)算方程近似解;

2 機(jī)器學(xué)習(xí)二分分類算法;

3?有序序列快速查找場景;



分治算法


核心點(diǎn):

  • 一是自頂向下分解問題,二是自底向上抽象合并;

  • 將一個(gè)難以直接解決的大問題,分割成一些規(guī)模較小的相同問題,以便各個(gè)擊破,分而治之;?


使用場景:

1 二分搜索,排序算法(快速排序,歸并排序),動(dòng)態(tài)規(guī)劃;

2 傅立葉變換(快速傅立葉變換);

3 程序模塊化設(shè)計(jì);


動(dòng)態(tài)規(guī)劃(DP)

?

核心點(diǎn):

  • 實(shí)際工作中很少用到,工作多年,從來沒有在工作中使用過動(dòng)態(tài)規(guī)劃。

  • 核心是了解其思想和原理:

  1. 動(dòng)態(tài)規(guī)劃最核心的思想,就在于拆分子問題,記住過往,減少重復(fù)計(jì)算;

  2. 深刻理解最優(yōu)子結(jié)構(gòu),重疊子問題,狀態(tài)轉(zhuǎn)移方程,無后效性,以及邊界條件;

  3. 熟悉各種類型DP特點(diǎn),普通DP,區(qū)間DP,樹形DP,數(shù)位DP,狀態(tài)壓縮DP等;

  • 應(yīng)對面試,刷幾道題就行,一般面試很少出動(dòng)態(tài)規(guī)劃的題,校招可能會(huì)出,社招基本上不會(huì)出;

  • 如果你要參加ACM or OJ 這種比賽,必須掌握, 這個(gè)區(qū)分菜鳥的分界點(diǎn)。

使用場景:

1 切割鋼條問題, Floyd最短路問題,最大不下降子序列,矩陣鏈乘,凸多邊形三角剖分,0-1背包,最長公共子序列,最優(yōu)二分搜索樹;

2 運(yùn)籌學(xué),經(jīng)濟(jì)學(xué)等;

最后總結(jié)

程序 = 數(shù)據(jù)結(jié)構(gòu) 算法?? ? ? ? ? ? ? ? ? ? ?

? ? ? ? ? ? ? ? ? ? ? ??? ? ? ? ? ? ? ? ?---Niklaus EmilWirth

程序本質(zhì)是數(shù)據(jù)結(jié)構(gòu) 算法,任何一門語言都可以這樣理解,這個(gè)公式對計(jì)算機(jī)科學(xué)的影響程度足以類似物理學(xué)中愛因斯坦的“E=MC^2”——一個(gè)公式展示出了程序的本質(zhì)。


其實(shí)在工作中,最重要是設(shè)計(jì)好數(shù)據(jù)結(jié)構(gòu),因?yàn)樵谠O(shè)計(jì)數(shù)據(jù)結(jié)構(gòu)的時(shí)候,就是性能和實(shí)現(xiàn)難度的權(quán)衡,程序當(dāng)然是越簡單越好,但為了性能,有時(shí)候不得不設(shè)計(jì)出像紅黑樹這種復(fù)雜數(shù)據(jù)結(jié)構(gòu)。


希望我們都可以掌握好算法核心思想,和常見數(shù)據(jù)結(jié)構(gòu)精妙設(shè)計(jì),幫助我們在面試和工作中打好堅(jiān)實(shí)的基礎(chǔ);

擴(kuò)展閱讀

https://www.cnblogs.com/binarylei/p/12419863.html

https://en.wikipedia.org/wiki/Quicksort

https://mp.weixin.qq.com/s/7PZ6L1YzPZdiMNK25sUqjg

https://blog.jcole.us/2013/01/10/btree-index-structures-in-innodb/

https://www.drdobbs.com/parallel/choose-concurrency-friendly-data-structu/208801371

https://cloud.tencent.com/developer/article/1136054

Robert Sedgewick. Left-leaning Red–Black Trees

https://cloud.tencent.com/developer/news/652039

https://github.com/greyireland/algorithm-pattern

https://www.huaweicloud.com/articles/1bce95370dbe6348fe3f277968cf078c.html


- EOF -

本站聲明: 本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點(diǎn),本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時(shí)聯(lián)系本站刪除。
換一批
延伸閱讀

LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: 驅(qū)動(dòng)電源

在工業(yè)自動(dòng)化蓬勃發(fā)展的當(dāng)下,工業(yè)電機(jī)作為核心動(dòng)力設(shè)備,其驅(qū)動(dòng)電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中,反電動(dòng)勢抑制與過流保護(hù)是驅(qū)動(dòng)電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié),集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動(dòng)性能的關(guān)鍵。

關(guān)鍵字: 工業(yè)電機(jī) 驅(qū)動(dòng)電源

LED 驅(qū)動(dòng)電源作為 LED 照明系統(tǒng)的 “心臟”,其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而,在實(shí)際應(yīng)用中,LED 驅(qū)動(dòng)電源易損壞的問題卻十分常見,不僅增加了維護(hù)成本,還影響了用戶體驗(yàn)。要解決這一問題,需從設(shè)計(jì)、生...

關(guān)鍵字: 驅(qū)動(dòng)電源 照明系統(tǒng) 散熱

根據(jù)LED驅(qū)動(dòng)電源的公式,電感內(nèi)電流波動(dòng)大小和電感值成反比,輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字: LED 設(shè)計(jì) 驅(qū)動(dòng)電源

電動(dòng)汽車(EV)作為新能源汽車的重要代表,正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動(dòng)汽車的核心技術(shù)之一是電機(jī)驅(qū)動(dòng)控制系統(tǒng),而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動(dòng)系統(tǒng)中的關(guān)鍵元件,其性能直接影響到電動(dòng)汽車的動(dòng)力性能和...

關(guān)鍵字: 電動(dòng)汽車 新能源 驅(qū)動(dòng)電源

在現(xiàn)代城市建設(shè)中,街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分,其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步,高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢逐漸取代傳統(tǒng)光源,成為大功率區(qū)域...

關(guān)鍵字: 發(fā)光二極管 驅(qū)動(dòng)電源 LED

LED通用照明設(shè)計(jì)工程師會(huì)遇到許多挑戰(zhàn),如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關(guān)鍵字: LED 驅(qū)動(dòng)電源 功率因數(shù)校正

在LED照明技術(shù)日益普及的今天,LED驅(qū)動(dòng)電源的電磁干擾(EMI)問題成為了一個(gè)不可忽視的挑戰(zhàn)。電磁干擾不僅會(huì)影響LED燈具的正常工作,還可能對周圍電子設(shè)備造成不利影響,甚至引發(fā)系統(tǒng)故障。因此,采取有效的硬件措施來解決L...

關(guān)鍵字: LED照明技術(shù) 電磁干擾 驅(qū)動(dòng)電源

開關(guān)電源具有效率高的特性,而且開關(guān)電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機(jī)重量也有所下降,所以,現(xiàn)在的LED驅(qū)動(dòng)電源

關(guān)鍵字: LED 驅(qū)動(dòng)電源 開關(guān)電源

LED驅(qū)動(dòng)電源是把電源供應(yīng)轉(zhuǎn)換為特定的電壓電流以驅(qū)動(dòng)LED發(fā)光的電壓轉(zhuǎn)換器,通常情況下:LED驅(qū)動(dòng)電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字: LED 隧道燈 驅(qū)動(dòng)電源
關(guān)閉