日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 嵌入式 > 嵌入式軟件
[導(dǎo)讀]各位工程師在Linux下開發(fā)程序時,有沒有遇到由于系統(tǒng)中存在某些小故障而跳出了“Oops”提示的情況,此時你是如何排查故障?一行行的查看代碼嗎?其實不用那么復(fù)雜,本文將為你介紹一種高效的Linux編程的故障排除方法。

各位工程師在Linux下開發(fā)程序時,有沒有遇到由于系統(tǒng)中存在某些小故障而跳出了“Oops”提示的情況,此時你是如何排查故障?一行行的查看代碼嗎?其實不用那么復(fù)雜,本文將為你介紹一種高效的Linux編程的故障排除方法。

在分析Oops之前,我們先來看以下這么一個例子,使用GPIO的中斷做掉電檢測,參考《嵌入式Linux開發(fā)教程下冊》的驅(qū)動框架,設(shè)計如下程序框圖:

 

 

這個框架設(shè)計之初的理想流程為:應(yīng)用啟動->程序初始化->應(yīng)用open設(shè)備->等待中斷事件,但實際項目開發(fā)時,往往發(fā)生許許多多不可預(yù)測的事情。如小王正在調(diào)Qt應(yīng)用,發(fā)現(xiàn)老王的進程老在打印,那就不讓老王的進程開機自啟動,調(diào)了兩三天后,不定時地提示個Oops提示,小王按照“以前代碼不出現(xiàn),新加的出現(xiàn),那么起因絕對在新代碼內(nèi)”的慣性思維,認為是新加的Qt導(dǎo)致的,然后小王就不斷測試,不斷查找bug中.......這樣就過去了十年。

但原因其實是小王沒有open設(shè)備,即驅(qū)動層沒有初始化定時器隊列,那么中斷處理函數(shù)中50ms觸發(fā)的隊列就為一個空值,空指針時Linux內(nèi)核當(dāng)然“哎呦”一下提醒你了,而不定時地提示其實就是因為電源不定時地松動,gpio檢測到掉電了所以觸發(fā)了中斷。

實際上,這樣的案例十分常見,原本想A->B->C,實際使用是A->D->C,又或者驅(qū)動中有某個變量忘記初始化等等,這時分析Oops就可以十分快速地解決問題。那接下來我們就用Linux中標準驅(qū)動去觸發(fā)一個Oops,對的你沒看錯,Linux內(nèi)核標準源碼也存在這樣的異常,而且我們也可以去修復(fù)這樣的問題。

使用我司的EasyARM-iMX283開發(fā)板,內(nèi)核源碼為光盤內(nèi)的Linux-2.6.35.3.tar.bz2,編譯方法請參考光盤資料,我們需要把lcd的背光驅(qū)動修改為ko模式。

 

 

燒錄完新內(nèi)核,加載新編譯出來的drivers/video/backlight/mxs_bl.ko文件就會提示以下Oops信息:

 

 

乍看之下,這段信息跟亂碼差不多,但只要你一層層地分析,你就會發(fā)現(xiàn),這些信息已經(jīng)告訴了我們錯誤的原因。接下來就開始我們的Oops分析之旅。

1、主要錯誤信息

 

 

用于提示錯誤的類型,這里表示使用空指針。

2、操作入口

 

 

用于提示錯誤的操作,這里表示加載mxs_bl模塊時出錯,對應(yīng)于加載操作insmod mxs_bl.ko。

3、PC指針

 

 

用于提示出錯時的PC指針位置,PC指針即當(dāng)前程序運行點的地址,這里提示表示錯誤函數(shù)為regulator_set_current_limit,偏移地址為0xc。

4、LR指針

 

 

用于提示出錯時的LR指針位置,LR指針即調(diào)用子函數(shù)的上一個函數(shù)名以及入口偏移量,這里表示上一個函數(shù)為set_bl_intensity,偏移地址為0xd8。即set_bl_intensity調(diào)用regulator_set_current_limit時出錯。

5、寄存器值

 

 

用于記錄出錯時各個寄存器的值,對于匯編比較熟悉的同志們可以研究一下這段信息。

6、出錯進程信息

 

 

用于提示出錯的進程id號與進程名稱。出錯進程為insmod, PID號2261,對于多任務(wù)系統(tǒng)中,可能存在多個PID調(diào)用同一個接口的情況。

7、出錯時的堆棧信息

 

 

用于提示出錯時堆棧內(nèi)保存的寄存器信息,當(dāng)程序由于中斷發(fā)生或子程序調(diào)用時,會執(zhí)行壓棧操作,即將運行環(huán)境保存到堆棧內(nèi),保證退出中斷或跳出子程序后,運行環(huán)境不發(fā)生改變。

而此處的堆棧信息即記錄了程序運行時的環(huán)境信息。從中我們可以找到許多LR地址,從而分析出函數(shù)調(diào)用關(guān)系,與下一段的信息有類似作用。

8、函數(shù)執(zhí)行的回溯關(guān)系

 

 

用于表示函數(shù)的調(diào)用關(guān)系,通過這段信息我們可以知道,函數(shù)的整個執(zhí)行流程,知道它的函數(shù)調(diào)用關(guān)系,最后整理出來的函數(shù)執(zhí)行流程如下:

 

 

從中我們看到了熟悉的init函數(shù)、probe函數(shù)、以及清楚probe函數(shù)下執(zhí)行的操作過程是到哪一步出錯的?,F(xiàn)在我們知道了代碼的執(zhí)行流程,出錯的PC指針的位置,但還是看不到代碼,出錯指針處我們只看到了一串?dāng)?shù)字,那么接下來我們就操作一下,把pc指針的數(shù)據(jù)變?yōu)橛幸饬x的代碼。

第一步,分辨出錯誤代碼在什么位置

這次實驗涉及的二進制文件有內(nèi)核的燒錄固件以及驅(qū)動的ko文件,所以第一步分析就需要確定出錯代碼是在內(nèi)核固件里還是ko文件里。

首先得到內(nèi)核代碼的范圍,用以下命令將內(nèi)核反匯編。

 

 

查看這個文件的格式如是:

 

 

第一列行數(shù),第二列運行地址,第三列二進制碼,第四列匯編代碼,既然第二列為運行地址,即等同于程序運行到這行時,pc指針的值等于這個數(shù)值。這樣只要翻看這個文件的頭部以及尾部,就能知道內(nèi)核代碼的PC指針范圍為:c0008000~c0562338。

根據(jù)前面第5步寄存器值,出錯時PC指針為c02f1878,即在內(nèi)核源碼范圍內(nèi)。

第二步,分析出錯函數(shù)的出錯語句

那么根據(jù)第3步PC指針,得到regulator_set_current_limit的匯編代碼,如下:

 

 

函數(shù)入口地址為c02f186c 。

在第3步PC指針指出偏移地址為“PC is at regulator_set_current_limit+0xc”。

PC = 0xc02f1878 = 0xc02f186c + 0xc,符合匯編代碼地址。

第三步,找到出錯函數(shù)的C語言代碼

這步可以說是最困難的,因為內(nèi)核代碼層次多,同名函數(shù)也可能存在許多份,可能幾份編譯進內(nèi)核(static聲明的局部函數(shù)),也可能沒編譯進內(nèi)核,如何從眾多的代碼中分析出具體哪段呢。

本人就使用了一些小手段,首先給每個同名函數(shù)的入口加段亂碼,讓編譯器篩選出編譯進內(nèi)核的文件(因為亂碼,所以編譯會報錯),然后給剩下的函數(shù)加打印語句,通常經(jīng)過第一步之后,可選的目標就兩三個,通過打印進一步確認代碼即可。

以下為篩選出來的C語言代碼。

 

 

看到這好像是定位了函數(shù),但對于不熟悉匯編的人來說,C與匯編還是沒有關(guān)聯(lián)起來,好像進入了死胡同,但先別氣餒,從上面的匯編代碼中我們知道,函數(shù)名即為函數(shù)的首地址,那么調(diào)用子函數(shù)即需要讓CPU知道子函數(shù)名,那么匯編如何調(diào)用子函數(shù)呢?使用bl指令, bl+子函數(shù)名。既然匯編有這么一個特性,那么我們看匯編代碼。

上面582734行為“bl c0493104 ”這句調(diào)用了子函數(shù),再看C中調(diào)用此函數(shù)的語句。

 

 

那么結(jié)果顯而易見,不可能定義個變量都報錯吧,所以唯一可能錯誤的語句就是struct regulator_dev *rdev = regulator->rdev,同理,這句的前半部也只是定義一個rdev的變量,再結(jié)合內(nèi)核給出來的提示——空指針,所以錯誤就是regulator->rdev是一個空指針。

最終的問題就歸結(jié)于,為什么regulatar->rdev為空指針。這部分的查閱代碼以及推理需要更深層次地挖掘,工作量也非本文能說清的,故作者在這里就大膽地推測與上面的A->B->C模型類似。所以我們就需要在這個資源存在的時刻,調(diào)用它之前給它賦值。

這時侯,我們就需要拿出第8步函數(shù)執(zhí)行的回溯關(guān)系圖,既然知道這個圖中最后的函數(shù)的輸入?yún)?shù)regulator的rdev為空,那么我們就關(guān)心regulator結(jié)構(gòu)體以及它的意義。從結(jié)構(gòu)體的意義我們才能知道如何給它賦值。

 

 

在相關(guān)的代碼文件中搜索關(guān)鍵字”regulator”或”regulator =”(建議搜這個,因為這種才是賦值語句)得到如下代碼。

 

 

分析這個函數(shù)可知,regulator實際是pdata的一個成員,他需要data來初始化,那么接下來的事情就簡單了,在回溯關(guān)系中找一個位置把data的數(shù)據(jù)塞入pdata中,剛好這段函數(shù)就是初始化的regulator的,那就直接拿去用吧。

把這段添加到probe函數(shù)內(nèi)的這個位置,實現(xiàn)了在mxsbl_probe和mxsbl_do_probe之間賦值此變量。

 

這樣重新編譯后即可正常加載ko文件。

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

CPU親和度通過限制進程或線程可以運行的CPU核心集合,使得它們只能在指定的CPU核心上執(zhí)行。這可以減少CPU緩存的失效次數(shù),提高緩存命中率,從而提升系統(tǒng)性能。

關(guān)鍵字: Linux 嵌入式

在Linux系統(tǒng)性能優(yōu)化中,內(nèi)存管理與網(wǎng)絡(luò)連接處理是兩大核心領(lǐng)域。vm.swappiness與net.core.somaxconn作為關(guān)鍵內(nèi)核參數(shù),直接影響系統(tǒng)在高負載場景下的穩(wěn)定性與響應(yīng)速度。本文通過實戰(zhàn)案例解析這兩個...

關(guān)鍵字: Linux 內(nèi)存管理

對于LLM,我使用b谷歌Gemini的免費層,所以唯一的成本是n8n托管。在使用了n8n Cloud的免費積分后,我決定將其托管在Railway上(5美元/月)。然而,由于n8n是開源的,您可以在自己的服務(wù)器上托管它,而...

關(guān)鍵字: 人工智能 n8n Linux

在Linux系統(tǒng)管理中,權(quán)限控制是安全運維的核心。本文通過解析/etc/sudoers文件配置與組策略的深度應(yīng)用,結(jié)合某金融企業(yè)生產(chǎn)環(huán)境案例(成功攔截98.7%的非法提權(quán)嘗試),揭示精細化權(quán)限管理的關(guān)鍵技術(shù)點,包括命令別...

關(guān)鍵字: Linux 用戶權(quán)限 sudoers文件

Linux內(nèi)核中的信號量(Semaphore)是一種用于資源管理的同步原語,它允許多個進程或線程對共享資源進行訪問控制。信號量的主要作用是限制對共享資源的并發(fā)訪問數(shù)量,從而防止系統(tǒng)過載和數(shù)據(jù)不一致的問題。

關(guān)鍵字: Linux 嵌入式

在云計算與容器化技術(shù)蓬勃發(fā)展的今天,Linux網(wǎng)絡(luò)命名空間(Network Namespace)已成為構(gòu)建輕量級虛擬網(wǎng)絡(luò)的核心組件。某頭部互聯(lián)網(wǎng)企業(yè)通過命名空間技術(shù)將測試環(huán)境資源消耗降低75%,故障隔離效率提升90%。本...

關(guān)鍵字: Linux 云計算

在Linux內(nèi)核4.18+和主流發(fā)行版(RHEL 8/Ubuntu 20.04+)全面轉(zhuǎn)向nftables的背景下,某電商平臺通過遷移將防火墻規(guī)則處理效率提升40%,延遲降低65%。本文基于真實生產(chǎn)環(huán)境案例,詳解從ipt...

關(guān)鍵字: nftables Linux

在Linux設(shè)備驅(qū)動開發(fā)中,等待隊列(Wait Queue)是實現(xiàn)進程睡眠與喚醒的核心機制,它允許進程在資源不可用時主動放棄CPU,進入可中斷睡眠狀態(tài),待資源就緒后再被喚醒。本文通過C語言模型解析等待隊列的實現(xiàn)原理,結(jié)合...

關(guān)鍵字: 驅(qū)動開發(fā) C語言 Linux

在Unix/Linux進程間通信中,管道(pipe)因其簡單高效被廣泛使用,但默認的半雙工特性和無同步機制容易導(dǎo)致數(shù)據(jù)競爭。本文通過父子進程雙向通信案例,深入分析互斥鎖與狀態(tài)機在管道同步中的應(yīng)用,實現(xiàn)100%可靠的數(shù)據(jù)傳...

關(guān)鍵字: 管道通信 父子進程 Linux

RTOS :RTOS的核心優(yōu)勢在于其實時性。它采用搶占式調(diào)度策略,確保高優(yōu)先級任務(wù)能夠立即獲得CPU資源,從而在最短時間內(nèi)完成處理。RTOS的實時性是通過嚴格的時間管理和任務(wù)調(diào)度算法實現(xiàn)的,能夠滿足對時間敏感性要求極高的...

關(guān)鍵字: Linux RTOS
關(guān)閉