發(fā)現(xiàn)內(nèi)存泄漏：如何用kmemleak與kasan定位驅(qū)動(dòng)中的野指針

時(shí)間：2026-03-09 09:37:20

關(guān)鍵字： kmemleak kasan

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]Linux內(nèi)核驅(qū)動(dòng)，內(nèi)存泄漏與野指針是兩大頑疾。內(nèi)存泄漏會(huì)導(dǎo)致系統(tǒng)資源逐漸耗盡，而野指針則可能引發(fā)不可預(yù)知的崩潰或數(shù)據(jù)損壞。本文將深入解析kmemleak與KASAN(Kernel Address Sanitizer)的工作原理，并通過C語言示例展示如何利用這兩種工具定位驅(qū)動(dòng)中的野指針問題。

Linux內(nèi)核驅(qū)動(dòng)，內(nèi)存泄漏與野指針是兩大頑疾。內(nèi)存泄漏會(huì)導(dǎo)致系統(tǒng)資源逐漸耗盡，而野指針則可能引發(fā)不可預(yù)知的崩潰或數(shù)據(jù)損壞。本文將深入解析kmemleak與KASAN(Kernel Address Sanitizer)的工作原理，并通過C語言示例展示如何利用這兩種工具定位驅(qū)動(dòng)中的野指針問題。

一、內(nèi)存泄漏與野指針的本質(zhì)

內(nèi)存泄漏指動(dòng)態(tài)分配的內(nèi)存未被釋放，導(dǎo)致系統(tǒng)無法回收資源。野指針則指向無效內(nèi)存地址，可能源于未初始化、越界訪問或釋放后未置空。在驅(qū)動(dòng)開發(fā)中，野指針常表現(xiàn)為：

未初始化指針：指針變量未初始化，其值隨機(jī)指向非法地址。

釋放后訪問：內(nèi)存釋放后指針未置空，繼續(xù)訪問導(dǎo)致非法操作。

越界訪問：指針超出數(shù)組或結(jié)構(gòu)體邊界，訪問未分配內(nèi)存。

二、kmemleak：內(nèi)存泄漏的“偵探”

原理

kmemleak是Linux內(nèi)核提供的內(nèi)存泄漏檢測工具，通過標(biāo)記“根集”(全局變量、棧、寄存器等)并周期性掃描內(nèi)存，構(gòu)建從根集到已分配內(nèi)存塊的引用圖。若某內(nèi)存塊無法從根集到達(dá)，則判定為疑似泄漏。

關(guān)鍵步驟：

標(biāo)記根集：將已知的合法內(nèi)存區(qū)域(如全局變量)標(biāo)記為起始點(diǎn)。

掃描內(nèi)存：遍歷內(nèi)存(包括SLAB、vmalloc等區(qū)域)，尋找可能是指針的值。

構(gòu)建引用圖：若某值指向已分配內(nèi)存塊的起始地址，則標(biāo)記該塊為“可達(dá)”。

報(bào)告泄漏：不可達(dá)的內(nèi)存塊被標(biāo)記為泄漏，并記錄分配地址、大小及調(diào)用棧。

應(yīng)用示例

假設(shè)驅(qū)動(dòng)中存在以下內(nèi)存泄漏：

static void *leaky_alloc(void) {

void *ptr = kmalloc(1024, GFP_KERNEL);

if (!ptr) return NULL;

// 忘記釋放ptr

return ptr;

}

使用kmemleak定位：

編譯內(nèi)核：啟用CONFIG_DEBUG_KMEMLEAK選項(xiàng)。

觸發(fā)掃描：通過/sys/kernel/debug/kmemleak接口手動(dòng)觸發(fā)掃描。

分析報(bào)告：報(bào)告會(huì)顯示泄漏內(nèi)存的分配地址及調(diào)用棧，指向leaky_alloc函數(shù)。

優(yōu)點(diǎn)：無需修改代碼，對(duì)系統(tǒng)性能影響較小，能檢測大多數(shù)真正的內(nèi)存泄漏。

局限：可能誤報(bào)(如特殊存儲(chǔ)的指針未被識(shí)別)或漏報(bào)(無法檢測邏輯泄漏)。

三、KASAN：野指針的“終結(jié)者”

原理

KASAN通過編譯時(shí)插樁和影子內(nèi)存(Shadow Memory)技術(shù)，實(shí)時(shí)檢測內(nèi)存越界訪問和使用已釋放內(nèi)存的行為。其核心機(jī)制包括：

影子內(nèi)存：為每8字節(jié)物理內(nèi)存分配1字節(jié)影子內(nèi)存，記錄訪問狀態(tài)(如是否可尋址)。

插樁檢查：在每次內(nèi)存訪問前插入檢查代碼，驗(yàn)證目標(biāo)地址的影子內(nèi)存狀態(tài)。

錯(cuò)誤報(bào)告：若檢測到非法訪問(如越界或use-after-free)，立即觸發(fā)內(nèi)核異常并打印詳細(xì)錯(cuò)誤信息。

關(guān)鍵技術(shù)：

通用模式(Generic KASAN)：字節(jié)級(jí)精度，但開銷較大(2x-3x性能下降)。

軟件標(biāo)簽?zāi)Ｊ?SW_TAGS)：適用于ARM64等平臺(tái)，精度較低但開銷小。

應(yīng)用示例

假設(shè)驅(qū)動(dòng)中存在野指針越界訪問：

static void wild_pointer_access(void) {

int arr[10] = {0};

int *ptr = arr;

for (int i = 0; i <= 10; i++) { // 越界訪問

ptr[i] = i;

}

使用KASAN定位：

編譯內(nèi)核：啟用CONFIG_KASAN選項(xiàng)(如CONFIG_KASAN_GENERIC)。

運(yùn)行測試：觸發(fā)wild_pointer_access函數(shù)執(zhí)行。

捕獲錯(cuò)誤：KASAN會(huì)立即報(bào)告越界訪問，顯示錯(cuò)誤地址、訪問類型及調(diào)用棧。

優(yōu)點(diǎn)：實(shí)時(shí)檢測，能精準(zhǔn)定位野指針問題，極大縮短調(diào)試時(shí)間。

局限：性能開銷較大，僅適用于開發(fā)和測試環(huán)境。

四、實(shí)戰(zhàn)：結(jié)合kmemleak與KASAN定位復(fù)雜問題

假設(shè)驅(qū)動(dòng)中存在以下復(fù)合問題：

內(nèi)存泄漏：動(dòng)態(tài)分配的內(nèi)存未釋放。

野指針：釋放后未置空的指針被越界訪問。

static void *complex_leak_and_wild(void) {

void *ptr1 = kmalloc(1024, GFP_KERNEL);

void *ptr2 = kmalloc(512, GFP_KERNEL);

if (!ptr1 || !ptr2) goto fail;

kfree(ptr1); // 釋放ptr1但未置空

ptr1 = NULL; // 實(shí)際代碼中可能遺漏此行

// 野指針越界訪問

int *wild_ptr = (int *)ptr2;

for (int i = 0; i <= 128; i++) { // 越界訪問ptr2

wild_ptr[i] = i;

}

return ptr2; // 返回ptr2但未釋放，導(dǎo)致泄漏

fail:

if (ptr1) kfree(ptr1);

if (ptr2) kfree(ptr2);

return NULL;

}

定位步驟：

啟用KASAN：編譯內(nèi)核時(shí)啟用CONFIG_KASAN，運(yùn)行測試觸發(fā)越界訪問錯(cuò)誤，定位到complex_leak_and_wild函數(shù)中的野指針問題。

修復(fù)野指針：在釋放ptr1后立即置空，并修正越界訪問邏輯。

啟用kmemleak：編譯內(nèi)核時(shí)啟用CONFIG_DEBUG_KMEMLEAK，運(yùn)行測試后掃描內(nèi)存泄漏，定位到complex_leak_and_wild函數(shù)中未釋放的ptr2。

修復(fù)內(nèi)存泄漏：在函數(shù)返回前釋放ptr2。

五、總結(jié)

kmemleak與KASAN是Linux內(nèi)核驅(qū)動(dòng)開發(fā)中不可或缺的調(diào)試工具：

kmemleak：擅長檢測內(nèi)存泄漏，通過全局掃描和引用圖分析，幫助開發(fā)者定位未釋放的內(nèi)存塊。

KASAN：專注于實(shí)時(shí)檢測野指針問題，通過影子內(nèi)存和插樁技術(shù)，精準(zhǔn)捕獲越界訪問和使用已釋放內(nèi)存的行為。

結(jié)合兩者使用，可覆蓋驅(qū)動(dòng)開發(fā)中的主要內(nèi)存問題場景，顯著提升代碼質(zhì)量與穩(wěn)定性。在實(shí)際開發(fā)中，建議：

在開發(fā)階段啟用KASAN，實(shí)時(shí)捕獲野指針問題。

在測試階段啟用kmemleak，定期掃描內(nèi)存泄漏。

通過/sys/kernel/debug/kmemleak和內(nèi)核日志分析問題，結(jié)合調(diào)用棧定位根因。

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請(qǐng)聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請(qǐng)及時(shí)聯(lián)系本站刪除。

換一批

高內(nèi)聚低耦合在C中的實(shí)踐：避免架構(gòu)腐爛的3個(gè)關(guān)鍵決策點(diǎn)

嵌入式系統(tǒng)與底層驅(qū)動(dòng)開發(fā)，C語言因其高效性和可控性成為主流選擇。然而，隨著項(xiàng)目規(guī)模擴(kuò)大，代碼結(jié)構(gòu)易陷入“架構(gòu)腐爛”——模塊間依賴錯(cuò)綜復(fù)雜，修改一處需牽動(dòng)全局，維護(hù)成本指數(shù)級(jí)增長。高內(nèi)聚低耦合作為軟件設(shè)計(jì)的黃金準(zhǔn)則，能有效...

關(guān)鍵字：嵌入式底層驅(qū)動(dòng)

[嵌入式分享]

對(duì)抗噪聲：STM32上手勢識(shí)別傳感器的硬件去噪電路設(shè)計(jì)

嵌入式系統(tǒng)開發(fā)手勢識(shí)別作為非接觸式人機(jī)交互的核心技術(shù)，正從實(shí)驗(yàn)室走向消費(fèi)級(jí)應(yīng)用。然而，傳感器采集的原始信號(hào)常因電磁干擾、電源噪聲或機(jī)械抖動(dòng)產(chǎn)生失真，導(dǎo)致識(shí)別準(zhǔn)確率下降。本文以STM32微控制器與PAJ7620手勢識(shí)別傳感...

關(guān)鍵字： STM32 手勢識(shí)別噪聲

[嵌入式分享]

基于TCP通信的MQTT應(yīng)用：STM32上實(shí)現(xiàn)輕量級(jí)物聯(lián)網(wǎng)通信的“三步走”

在資源受限的STM32微控制器上實(shí)現(xiàn)可靠的物聯(lián)網(wǎng)通信，需兼顧協(xié)議輕量化、內(nèi)存占用低和功耗優(yōu)化。本文以STM32F407(Cortex-M4內(nèi)核，192KB RAM)為例，提出“TCP基礎(chǔ)通信→MQTT協(xié)議適配→低功耗優(yōu)化...

關(guān)鍵字： TCP MQT

[嵌入式分享]

從IMU到AI：STM32上基于加速度計(jì)的手勢識(shí)別數(shù)據(jù)流設(shè)計(jì)

嵌入式人工智能領(lǐng)域，基于微機(jī)電系統(tǒng)(IMU)的手勢識(shí)別技術(shù)正從實(shí)驗(yàn)室走向?qū)嶋H應(yīng)用。以STM32微控制器為核心，結(jié)合三軸加速度計(jì)與輕量級(jí)機(jī)器學(xué)習(xí)模型，可構(gòu)建低功耗、實(shí)時(shí)性的手勢識(shí)別系統(tǒng)。本文以STM32H743為例，闡述從...

關(guān)鍵字： IMU AI

[嵌入式分享]

Wireshark的C語言調(diào)試助手：抓包分析HTTP服務(wù)器通信異常

在C語言開發(fā)的HTTP服務(wù)器項(xiàng)目中，通信異常是常見的調(diào)試挑戰(zhàn)。Wireshark作為網(wǎng)絡(luò)協(xié)議分析領(lǐng)域的“瑞士軍刀”，通過捕獲和分析數(shù)據(jù)包，能夠精準(zhǔn)定位HTTP通信中的異常環(huán)節(jié)。本文結(jié)合實(shí)際案例，闡述如何利用Wiresha...

關(guān)鍵字： Wireshark C語言

[嵌入式分享]

W5500的開箱即用，30分鐘實(shí)現(xiàn)STM32+W5500的MQTT通信

在物聯(lián)網(wǎng)設(shè)備開發(fā)中，快速實(shí)現(xiàn)穩(wěn)定可靠的網(wǎng)絡(luò)通信是項(xiàng)目成功的關(guān)鍵。W5500作為一款集成硬件TCP/IP協(xié)議棧的以太網(wǎng)控制器，憑借其"開箱即用"的特性，可大幅縮短STM32平臺(tái)的網(wǎng)絡(luò)功能開發(fā)周期。本文通...

關(guān)鍵字： STM32 W5500

[嵌入式分享]

W5500的多線程優(yōu)化：SPI總線沖突與MQTT任務(wù)調(diào)度的平衡術(shù)

嵌入式物聯(lián)網(wǎng)設(shè)備，W5500以太網(wǎng)控制器憑借其硬件TCP/IP協(xié)議棧特性，成為實(shí)現(xiàn)MQTT通信的高效選擇。然而，當(dāng)系統(tǒng)需要同時(shí)處理傳感器數(shù)據(jù)采集、MQTT消息發(fā)布、OTA升級(jí)等多任務(wù)時(shí)，SPI總線訪問沖突與MQTT任務(wù)調(diào)...

關(guān)鍵字： W5500 多線程

[嵌入式分享]

W5500的MQTT直通車，繞過LWIP的輕量化通信方案

在物聯(lián)網(wǎng)設(shè)備開發(fā)領(lǐng)域，網(wǎng)絡(luò)通信的穩(wěn)定性與資源占用始終是開發(fā)者面臨的兩大核心挑戰(zhàn)。傳統(tǒng)方案中，基于STM32等MCU的軟件協(xié)議棧(如LWIP)雖能實(shí)現(xiàn)基礎(chǔ)通信功能，但在復(fù)雜電磁環(huán)境或資源受限場景下，常因CPU負(fù)載過高、內(nèi)存...

關(guān)鍵字： W5500 MQTT

[嵌入式分享]

Unity框架5分鐘上手：C項(xiàng)目單元測試從零到一的完整流程

在嵌入式系統(tǒng)開發(fā)中，某醫(yī)療設(shè)備團(tuán)隊(duì)曾因缺乏單元測試導(dǎo)致代碼集成階段發(fā)現(xiàn)37個(gè)隱蔽缺陷，修復(fù)成本高達(dá)項(xiàng)目預(yù)算的22%。引入U(xiǎn)nity測試框架后，團(tuán)隊(duì)在開發(fā)周期內(nèi)捕獲了92%的缺陷，回歸測試效率提升5倍。這一案例揭示了單元測...

關(guān)鍵字：嵌入式 Unity