當前位置：首頁 > > 后端技術指南針

圖解：零拷貝Zero-Copy技術大揭秘

時間：2020-10-12 16:39:28

關鍵字： Linux 編程嵌入式

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]像大白這種調包俠，深知不懂底層技術點就如同空中樓閣，再這樣下去面阿里p10是沒希望了。想到這里，我開始慌了，所以今天和大家一起學習個底層技術點-零拷貝Zero-Copy。

1.前言

像大白這種調包俠，深知不懂底層技術點就如同空中樓閣，再這樣下去面阿里p10是沒希望了。

想到這里，我開始慌了，所以今天和大家一起學習個底層技術點-零拷貝Zero-Copy。

Linux系統(tǒng)中一切皆文件，仔細想一下Linux系統(tǒng)的很多活動無外乎讀操作和寫操作，零拷貝就是為了提高讀寫性能而出現(xiàn)的。

廢話不多說，馬上開大車，走起！

2. 數(shù)據(jù)拷貝基礎過程

在Linux系統(tǒng)內部緩存和內存容量都是有限的，更多的數(shù)據(jù)都是存儲在磁盤中。對于Web服務器來說，經常需要從磁盤中讀取數(shù)據(jù)到內存，然后再通過網卡傳輸給用戶：

上述數(shù)據(jù)流轉只是大框，接下來看看幾種模式。

2.1 僅CPU方式

當應用程序需要讀取磁盤數(shù)據(jù)時，調用read()從用戶態(tài)陷入內核態(tài)，read()這個系統(tǒng)調用最終由CPU來完成；
CPU向磁盤發(fā)起I/O請求，磁盤收到之后開始準備數(shù)據(jù)；
磁盤將數(shù)據(jù)放到磁盤緩沖區(qū)之后，向CPU發(fā)起I/O中斷，報告CPU數(shù)據(jù)已經Ready了；
CPU收到磁盤控制器的I/O中斷之后，開始拷貝數(shù)據(jù)，完成之后read()返回，再從內核態(tài)切換到用戶態(tài)；

2.2 CPU&DMA方式

CPU的時間寶貴，讓它做雜活就是浪費資源。

直接內存訪問（Direct Memory Access），是一種硬件設備繞開CPU獨立直接訪問內存的機制。所以DMA在一定程度上解放了CPU，把之前CPU的雜活讓硬件直接自己做了，提高了CPU效率。

目前支持DMA的硬件包括：網卡、聲卡、顯卡、磁盤控制器等。

有了DMA的參與之后的流程發(fā)生了一些變化：

最主要的變化是，CPU不再和磁盤直接交互，而是DMA和磁盤交互并且將數(shù)據(jù)從磁盤緩沖區(qū)拷貝到內核緩沖區(qū)，之后的過程類似。

“
【敲黑板】無論從僅CPU方式和DMA&CPU方式，都存在多次冗余數(shù)據(jù)拷貝和內核態(tài)&用戶態(tài)的切換。
”

我們繼續(xù)思考Web服務器讀取本地磁盤文件數(shù)據(jù)再通過網絡傳輸給用戶的詳細過程。

3.普通模式數(shù)據(jù)交互

一次完成的數(shù)據(jù)交互包括幾個部分：系統(tǒng)調用syscall、CPU、DMA、網卡、磁盤等。

系統(tǒng)調用syscall是應用程序和內核交互的橋梁，每次進行調用/返回就會產生兩次切換：

調用syscall 從用戶態(tài)切換到內核態(tài)
syscall返回從內核態(tài)切換到用戶態(tài)

來看下完整的數(shù)據(jù)拷貝過程簡圖：

讀數(shù)據(jù)過程：

應用程序要讀取磁盤數(shù)據(jù)，調用read()函數(shù)從而實現(xiàn)用戶態(tài)切換內核態(tài)，這是第1次狀態(tài)切換；
DMA控制器將數(shù)據(jù)從磁盤拷貝到內核緩沖區(qū)，這是第1次DMA拷貝；
CPU將數(shù)據(jù)從內核緩沖區(qū)復制到用戶緩沖區(qū)，這是第1次CPU拷貝；
CPU完成拷貝之后，read()函數(shù)返回實現(xiàn)用戶態(tài)切換用戶態(tài)，這是第2次狀態(tài)切換；

寫數(shù)據(jù)過程：

應用程序要向網卡寫數(shù)據(jù)，調用write()函數(shù)實現(xiàn)用戶態(tài)切換內核態(tài)，這是第1次切換；
CPU將用戶緩沖區(qū)數(shù)據(jù)拷貝到內核緩沖區(qū)，這是第1次CPU拷貝；
DMA控制器將數(shù)據(jù)從內核緩沖區(qū)復制到socket緩沖區(qū)，這是第1次DMA拷貝；
完成拷貝之后，write()函數(shù)返回實現(xiàn)內核態(tài)切換用戶態(tài)，這是第2次切換；

綜上所述：

讀過程涉及2次空間切換、1次DMA拷貝、1次CPU拷貝；
寫過程涉及2次空間切換、1次DMA拷貝、1次CPU拷貝；

可見傳統(tǒng)模式下，涉及多次空間切換和數(shù)據(jù)冗余拷貝，效率并不高，接下來就該零拷貝技術出場了。

4. 零拷貝技術

4.1 出現(xiàn)原因

我們可以看到，如果應用程序不對數(shù)據(jù)做修改，從內核緩沖區(qū)到用戶緩沖區(qū)，再從用戶緩沖區(qū)到內核緩沖區(qū)。兩次數(shù)據(jù)拷貝都需要CPU的參與，并且涉及用戶態(tài)與內核態(tài)的多次切換，加重了CPU負擔。

我們需要降低冗余數(shù)據(jù)拷貝、解放CPU，這也就是零拷貝Zero-Copy技術。

4.2 解決思路

目前來看，零拷貝技術的幾個實現(xiàn)手段包括：mmap+write、sendfile、sendfile+DMA收集、splice等。

4.2.1 mmap方式

mmap是Linux提供的一種內存映射文件的機制，它實現(xiàn)了將內核中讀緩沖區(qū)地址與用戶空間緩沖區(qū)地址進行映射，從而實現(xiàn)內核緩沖區(qū)與用戶緩沖區(qū)的共享。

這樣就減少了一次用戶態(tài)和內核態(tài)的CPU拷貝，但是在內核空間內仍然有一次CPU拷貝。

mmap對大文件傳輸有一定優(yōu)勢，但是小文件可能出現(xiàn)碎片，并且在多個進程同時操作文件時可能產生引發(fā)coredump的signal。

4.2.2 sendfile方式

mmap+write方式有一定改進，但是由系統(tǒng)調用引起的狀態(tài)切換并沒有減少。

sendfile系統(tǒng)調用是在 Linux 內核2.1版本中被引入，它建立了兩個文件之間的傳輸通道。

sendfile方式只使用一個函數(shù)就可以完成之前的read+write 和 mmap+write的功能，這樣就少了2次狀態(tài)切換，由于數(shù)據(jù)不經過用戶緩沖區(qū)，因此該數(shù)據(jù)無法被修改。

從圖中可以看到，應用程序只需要調用sendfile函數(shù)即可完成，只有2次狀態(tài)切換、1次CPU拷貝、2次DMA拷貝。

但是sendfile在內核緩沖區(qū)和socket緩沖區(qū)仍然存在一次CPU拷貝，或許這個還可以優(yōu)化。

4.2.3 sendfile+DMA收集

Linux 2.4 內核對 sendfile 系統(tǒng)調用進行優(yōu)化，但是需要硬件DMA控制器的配合。

升級后的sendfile將內核空間緩沖區(qū)中對應的數(shù)據(jù)描述信息（文件描述符、地址偏移量等信息）記錄到socket緩沖區(qū)中。

DMA控制器根據(jù)socket緩沖區(qū)中的地址和偏移量將數(shù)據(jù)從內核緩沖區(qū)拷貝到網卡中，從而省去了內核空間中僅剩1次CPU拷貝。

這種方式有2次狀態(tài)切換、0次CPU拷貝、2次DMA拷貝，但是仍然無法對數(shù)據(jù)進行修改，并且需要硬件層面DMA的支持，并且sendfile只能將文件數(shù)據(jù)拷貝到socket描述符上，有一定的局限性。

4.2.4 splice方式

splice系統(tǒng)調用是Linux 在 2.6 版本引入的，其不需要硬件支持，并且不再限定于socket上，實現(xiàn)兩個普通文件之間的數(shù)據(jù)零拷貝。

splice 系統(tǒng)調用可以在內核緩沖區(qū)和socket緩沖區(qū)之間建立管道來傳輸數(shù)據(jù)，避免了兩者之間的 CPU 拷貝操作。

splice也有一些局限，它的兩個文件描述符參數(shù)中有一個必須是管道設備。

5.本文小結

本文通過介紹數(shù)據(jù)交互的基本過程、傳統(tǒng)模式的缺點，進而介紹了零拷貝的一些實現(xiàn)方法。

零拷貝技術是非常底層且重要的讀寫優(yōu)化，對于服務并發(fā)能力的提升有很大幫助，就這么多吧，下期再見！

免責聲明：本文內容由21ic獲得授權后發(fā)布，版權歸原作者所有，本平臺僅提供信息存儲服務。文章僅代表作者個人觀點，不代表本平臺立場，如有問題，請聯(lián)系我們，謝謝！

本站聲明：本文章由作者或相關機構授權發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點，本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者，如若文章內容侵犯您的權益，請及時聯(lián)系本站刪除。

換一批

與傳統(tǒng)的驅動方式相比，共陰恒流驅動在能效有哪些優(yōu)勢

LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字：驅動電源

[電源]

工業(yè)電機驅動電源設計：反電動勢抑制與過流保護的集成方案

在工業(yè)自動化蓬勃發(fā)展的當下，工業(yè)電機作為核心動力設備，其驅動電源的性能直接關系到整個系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動勢抑制與過流保護是驅動電源設計中至關重要的兩個環(huán)節(jié)，集成化方案的設計成為提升電機驅動性能的關鍵。

關鍵字：工業(yè)電機驅動電源

[電源]

如何解決 LED 驅動電源的易損壞問題

LED 驅動電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個照明設備的使用壽命。然而，在實際應用中，LED 驅動電源易損壞的問題卻十分常見，不僅增加了維護成本，還影響了用戶體驗。要解決這一問題，需從設計、生...

關鍵字：驅動電源照明系統(tǒng) 散熱

[電力電工電路]

LED設計中LED驅動電源的公式

根據(jù)LED驅動電源的公式，電感內電流波動大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關鍵字： LED 設計驅動電源

[汽車電子]

EV主驅IGBT隔離驅動電源方案選擇問題探討

電動汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產業(yè)的重要發(fā)展方向。電動汽車的核心技術之一是電機驅動控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機驅動系統(tǒng)中的關鍵元件，其性能直接影響到電動汽車的動力性能和...

關鍵字：電動汽車新能源驅動電源

[電源]

合理的驅動電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設中，街道及停車場照明作為基礎設施的重要組成部分，其質量和效率直接關系到城市的公共安全、居民生活質量和能源利用效率。隨著科技的進步，高亮度白光發(fā)光二極管(LED)因其獨特的優(yōu)勢逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關鍵字：發(fā)光二極管驅動電源 LED

[消費電子]

AC-DC電源轉換拓撲結構設計

LED通用照明設計工程師會遇到許多挑戰(zhàn)，如功率密度、功率因數(shù)校正(PFC)、空間受限和可靠性等。

關鍵字： LED 驅動電源功率因數(shù)校正

[電源]

針對于LED照明驅動電源技術中的電磁干擾其中的三大硬件問題措施

在LED照明技術日益普及的今天，LED驅動電源的電磁干擾(EMI)問題成為了一個不可忽視的挑戰(zhàn)。電磁干擾不僅會影響LED燈具的正常工作，還可能對周圍電子設備造成不利影響，甚至引發(fā)系統(tǒng)故障。因此，采取有效的硬件措施來解決L...

關鍵字： LED照明技術電磁干擾驅動電源

[電源]

LED驅動電源的核心部分“開關管”和“變換器”設計技巧

開關電源具有效率高的特性,而且開關電源的變壓器體積比串聯(lián)穩(wěn)壓型電源的要小得多,電源電路比較整潔,整機重量也有所下降,所以,現(xiàn)在的LED驅動電源

關鍵字： LED 驅動電源開關電源

[電源]

最全LED驅動電源及散熱設計方案介紹

LED驅動電源是把電源供應轉換為特定的電壓電流以驅動LED發(fā)光的電壓轉換器，通常情況下：LED驅動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關鍵字： LED 隧道燈驅動電源

圖解：零拷貝Zero-Copy技術大揭秘

1.前言

2. 數(shù)據(jù)拷貝基礎過程

2.1 僅CPU方式

2.2 CPU&DMA方式

3.普通模式數(shù)據(jù)交互

4. 零拷貝技術

4.1 出現(xiàn)原因

4.2 解決思路

4.2.1 mmap方式

4.2.2 sendfile方式

4.2.3 sendfile+DMA收集

4.2.4 splice方式

5.本文小結

與傳統(tǒng)的驅動方式相比，共陰恒流驅動在能效有哪些優(yōu)勢

工業(yè)電機驅動電源設計：反電動勢抑制與過流保護的集成方案

如何解決 LED 驅動電源的易損壞問題

LED設計中LED驅動電源的公式

EV主驅IGBT隔離驅動電源方案選擇問題探討

合理的驅動電源方案成為大功率區(qū)域照明的主流選擇

AC-DC電源轉換拓撲結構設計

針對于LED照明驅動電源技術中的電磁干擾其中的三大硬件問題措施

LED驅動電源的核心部分“開關管”和“變換器”設計技巧

最全LED驅動電源及散熱設計方案介紹

常用的LED驅動電源有哪些？工作原理是什么？

LED驅動電源的類型可分為有哪些？

解散全部員工！深圳又一電子大廠宣布停產結業(yè)

崧盛股份：大功率LED驅動電源行業(yè)門檻高，新進入者面臨三大壁壘

關于LED驅動電源的分類以及特點解析，你了解嗎？

你知道常見的LED驅動電源種類以及它們有哪些特點嗎？

關于LED驅動電源特點以及在設計時需要注意的關鍵點

多路 LED 驅動電源技術的開發(fā)與可靠性研究分析

值得大家學習的LED驅動電源的特點以及工作原理概述

Cree宣布徹底告別LED和照明行業(yè)