當(dāng)前位置：首頁 > 工業(yè)控制 > 電路設(shè)計(jì)項(xiàng)目集錦

如何測量測量和理解AMD Versal AI引擎應(yīng)用程序的延遲

時(shí)間：2025-10-17 17:33:13

關(guān)鍵字： AI引擎 TLAST

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]在之前的教程中，我們已經(jīng)看到我們可以從AI引擎模擬中獲得循環(huán)信息，這是循環(huán)近似，因此它給出了我們將在實(shí)際硬件上得到的非常接近的估計(jì)。我認(rèn)為從AI引擎模擬器生成的軌跡中測量延遲會很有趣。

在之前的教程中，我們已經(jīng)看到我們可以從AI引擎模擬中獲得循環(huán)信息，這是循環(huán)近似，因此它給出了我們將在實(shí)際硬件上得到的非常接近的估計(jì)。我認(rèn)為從AI引擎模擬器生成的軌跡中測量延遲會很有趣。

注意：本教程是使用AMD Vitis 2025.1創(chuàng)建的。工具流程在其他版本的工具中可能會有所不同。

測量AI引擎圖的延遲

在之前的教程中，在運(yùn)行AIE模擬器之后，我們在模擬生成的輸出文件(output.txt)中得到以下輸出：

以T開頭的行給出了示例的時(shí)間戳，如下所示。

第一個(gè)，1510400ps意味著第一個(gè)樣本在1.5104 us之后出現(xiàn)在AI引擎陣列的輸出中。因此這大概就是AI引擎數(shù)組的初始延遲(從第一個(gè)樣本輸入到第一個(gè)樣本輸出)。

如果我們檢查兩個(gè)連續(xù)線路之間的時(shí)間戳，我們可以看到每個(gè)連續(xù)的樣本在6.4 ns或156.25 MHz之后到達(dá)。

我們可以在查看平臺屬性時(shí)找到類似的數(shù)字(打開AI引擎組件設(shè)置文件vis -comp)。(點(diǎn)擊平臺信息)

我們可以看到這個(gè)頻率與我們平臺上的PL時(shí)鐘的頻率相匹配

然后查看從模擬(output.txt)生成的輸出文件的第63-65行，我們可以看到以下內(nèi)容：

TLAST表示下面的樣本是圖迭代的最后一個(gè)樣本。這意味著我們的圖(帶有2個(gè)核)需要1.70個(gè)函數(shù)來完成第一次圖迭代。這個(gè)時(shí)間包括填充輸入緩沖區(qū)、運(yùn)行兩個(gè)內(nèi)核和輸出輸出緩沖區(qū)的時(shí)間。

然后查看output.txt文件的第128-130行：

這顯示了圖迭代的最后一個(gè)樣本的時(shí)間戳。這意味著第二次迭代在0.9536秒內(nèi)完成。這比第一次迭代要快得多。其原因是乒乓緩沖區(qū)作為圖的輸入，正如我們在上一教程中看到的那樣。

雖然要開始圖的第一次迭代，我們必須等待ping緩沖區(qū)填滿輸入數(shù)據(jù)，但第二次迭代的情況并非如此，因?yàn)楫?dāng)內(nèi)核處理ping緩沖區(qū)時(shí)，pong緩沖區(qū)已經(jīng)填滿了。

為了更好地了解不同階段引入的延遲，一個(gè)好方法是查看可以從模擬中生成的跟蹤。

默認(rèn)情況下不啟用跟蹤。我們需要在仿真設(shè)置文件(launch.json)中啟用EnableTraces選項(xiàng)，從而在仿真選項(xiàng)中啟用它們。

如果我們再次運(yùn)行模擬，我們將能夠在REPORTS > Trace下看到跟蹤。

這是我們從跟蹤報(bào)告中得到的視圖

我們可以看到，AI Engine Tiles組織了各種信息，如功能運(yùn)行，鎖或dma。

淺綠色和淺藍(lán)色的方框表示內(nèi)核執(zhí)行。正如我們在之前的文章中看到的那樣，圖(以及內(nèi)核)運(yùn)行了4次，并且在同一個(gè)AI引擎貼圖上執(zhí)行的內(nèi)核一個(gè)接一個(gè)地執(zhí)行。

如果我們將游標(biāo)放在第二個(gè)內(nèi)核第一次運(yùn)行的末尾，我們可以看到它表示1.460 us，這與我們從模擬文件中的第一個(gè)時(shí)間戳中獲得的初始延遲非常接近。

然后，我們可以首先在內(nèi)核的第一次和第二次執(zhí)行開始時(shí)添加游標(biāo)。

兩個(gè)核(1475 - 524 ns)之間的時(shí)間差為951 ns。這也接近我們在測量第二次圖執(zhí)行的時(shí)間減去從輸出文本文件的時(shí)間戳中得到的第一次迭代的最后一個(gè)樣本的時(shí)間時(shí)得到的值。

這基本上是我們的圖在數(shù)據(jù)流水線(圖不等待數(shù)據(jù)運(yùn)行處理)時(shí)完成迭代(包括2個(gè)內(nèi)核的執(zhí)行)所需的時(shí)間。

總結(jié)

在本文中，我們看到了如何測量AI Engine模擬輸出文本文件中的延遲，以及如何啟用和分析模擬中的跟蹤，以獲得更細(xì)粒度的圖延遲測量。

本文編譯自hackster.io

本站聲明：本文章由作者或相關(guān)機(jī)構(gòu)授權(quán)發(fā)布，目的在于傳遞更多信息，并不代表本站贊同其觀點(diǎn)，本站亦不保證或承諾內(nèi)容真實(shí)性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者，如若文章內(nèi)容侵犯您的權(quán)益，請及時(shí)聯(lián)系本站刪除。

換一批

與傳統(tǒng)的驅(qū)動方式相比，共陰恒流驅(qū)動在能效有哪些優(yōu)勢

LED驅(qū)動電源的輸入包括高壓工頻交流(即市電)、低壓直流、高壓直流、低壓高頻交流(如電子變壓器的輸出)等。

關(guān)鍵字：驅(qū)動電源

[電源]

工業(yè)電機(jī)驅(qū)動電源設(shè)計(jì)：反電動勢抑制與過流保護(hù)的集成方案

在工業(yè)自動化蓬勃發(fā)展的當(dāng)下，工業(yè)電機(jī)作為核心動力設(shè)備，其驅(qū)動電源的性能直接關(guān)系到整個(gè)系統(tǒng)的穩(wěn)定性和可靠性。其中，反電動勢抑制與過流保護(hù)是驅(qū)動電源設(shè)計(jì)中至關(guān)重要的兩個(gè)環(huán)節(jié)，集成化方案的設(shè)計(jì)成為提升電機(jī)驅(qū)動性能的關(guān)鍵。

關(guān)鍵字：工業(yè)電機(jī) 驅(qū)動電源

[電源]

如何解決 LED 驅(qū)動電源的易損壞問題

LED 驅(qū)動電源作為 LED 照明系統(tǒng)的 “心臟”，其穩(wěn)定性直接決定了整個(gè)照明設(shè)備的使用壽命。然而，在實(shí)際應(yīng)用中，LED 驅(qū)動電源易損壞的問題卻十分常見，不僅增加了維護(hù)成本，還影響了用戶體驗(yàn)。要解決這一問題，需從設(shè)計(jì)、生...

關(guān)鍵字：驅(qū)動電源照明系統(tǒng) 散熱

[電力電工電路]

LED設(shè)計(jì)中LED驅(qū)動電源的公式

根據(jù)LED驅(qū)動電源的公式，電感內(nèi)電流波動大小和電感值成反比，輸出紋波和輸出電容值成反比。所以加大電感值和輸出電容值可以減小紋波。

關(guān)鍵字： LED 設(shè)計(jì) 驅(qū)動電源

[汽車電子]

EV主驅(qū)IGBT隔離驅(qū)動電源方案選擇問題探討

電動汽車(EV)作為新能源汽車的重要代表，正逐漸成為全球汽車產(chǎn)業(yè)的重要發(fā)展方向。電動汽車的核心技術(shù)之一是電機(jī)驅(qū)動控制系統(tǒng)，而絕緣柵雙極型晶體管(IGBT)作為電機(jī)驅(qū)動系統(tǒng)中的關(guān)鍵元件，其性能直接影響到電動汽車的動力性能和...

關(guān)鍵字：電動汽車新能源驅(qū)動電源

[電源]

合理的驅(qū)動電源方案成為大功率區(qū)域照明的主流選擇

在現(xiàn)代城市建設(shè)中，街道及停車場照明作為基礎(chǔ)設(shè)施的重要組成部分，其質(zhì)量和效率直接關(guān)系到城市的公共安全、居民生活質(zhì)量和能源利用效率。隨著科技的進(jìn)步，高亮度白光發(fā)光二極管(LED)因其獨(dú)特的優(yōu)勢逐漸取代傳統(tǒng)光源，成為大功率區(qū)域...

關(guān)鍵字：發(fā)光二極管驅(qū)動電源 LED

[消費(fèi)電子]