如何利用銳龍人工智能技術將 RGB 圖像優(yōu)化轉換為負像的實例操作
本次演示展示了如何利用“跟蹤”功能,通過使用 AMD Ryzen AI Phoenix 中的 AIE 語言和 AIE API,高效地實現(xiàn)彩色圖像的“反向”處理。
要求/條件
AMD Ryzen AI Phoenix. 基于 Linux® 的開發(fā)環(huán)境。Python®(用于測試自動化和結果驗證)。IRON API 和基于 MLIR 的 AI 引擎工具鏈。OpenCV(開源計算機視覺庫)
項目簡介
該系統(tǒng)級芯片(SOC)旨在加快 AIE-ML 算法的運行速度,以實現(xiàn)卓越的出色性能。而神經(jīng)處理單元(NPU)組件則具有……
?16 個人工智能核心用于計算任務
?4 快速內存訪問用的內存模塊
?4 沙姆 DMA 用于在 L3 內存中進行數(shù)據(jù)的讀入和寫入操作
問題陳述
在該 3 核設計中,這些核心大多處于“鎖步”狀態(tài),從而浪費了寶貴的計算能力。
三核設計模式
3 個核心設計
?鎖止持續(xù)時間:1286000納秒
?核心執(zhí)行時間:156000 納秒
?處理一行數(shù)據(jù)所需的總時間為 1442000 納秒。
解決方案
在對這些痕跡進行分析之后,人們發(fā)現(xiàn)……
?R、G 和 B 三個通道的處理過程可以集中在同一個核心上進行。
?用于輸入和輸出的乒乓緩沖區(qū)可以通過減少整體內存占用來轉換為單個輸入緩沖區(qū)和單個輸出緩沖區(qū)。
?僅有一個 S2MM 和 MM2S 通道與 BD 鏈路及鎖相結合,用于調控數(shù)據(jù)流和核心執(zhí)行過程。
如何優(yōu)化“AMD銳龍人工智能神經(jīng)網(wǎng)絡單元將彩色圖像轉換為負圖像”的功能
結構
計算的數(shù)據(jù)流
1 核設計模式
?單個組件的鎖止持續(xù)時間為 320000 納秒
?核心執(zhí)行時間:單個組件 190000 微秒
?3 行數(shù)據(jù)(R、G、B)的執(zhí)行時間 - 1528000 納秒,與 1442000 納秒較為接近 - 采用 3 核設計的單行處理方式。
然后,核心部分會對每個像素進行取反操作,接著將轉換后的像素重新傳輸至 L3 內存。
輸入圖像
輸出圖像
結論
本次課程將演示如何利用“跟蹤”功能來分析程序的執(zhí)行情況并對其進行優(yōu)化。
簡要描述這兩種實現(xiàn)方式之間的相似之處:
* 僅捕獲與 AIE 核相關的信息參數(shù)
本文編譯自hackster.io





