如何利用銳龍人工智能技術(shù)將 RGB 圖像優(yōu)化轉(zhuǎn)換為負(fù)像的實(shí)例操作
本次演示展示了如何利用“跟蹤”功能,通過(guò)使用 AMD Ryzen AI Phoenix 中的 AIE 語(yǔ)言和 AIE API,高效地實(shí)現(xiàn)彩色圖像的“反向”處理。
要求/條件
AMD Ryzen AI Phoenix. 基于 Linux® 的開(kāi)發(fā)環(huán)境。Python®(用于測(cè)試自動(dòng)化和結(jié)果驗(yàn)證)。IRON API 和基于 MLIR 的 AI 引擎工具鏈。OpenCV(開(kāi)源計(jì)算機(jī)視覺(jué)庫(kù))
項(xiàng)目簡(jiǎn)介
該系統(tǒng)級(jí)芯片(SOC)旨在加快 AIE-ML 算法的運(yùn)行速度,以實(shí)現(xiàn)卓越的出色性能。而神經(jīng)處理單元(NPU)組件則具有……
?16 個(gè)人工智能核心用于計(jì)算任務(wù)
?4 快速內(nèi)存訪問(wèn)用的內(nèi)存模塊
?4 沙姆 DMA 用于在 L3 內(nèi)存中進(jìn)行數(shù)據(jù)的讀入和寫入操作
問(wèn)題陳述
在該 3 核設(shè)計(jì)中,這些核心大多處于“鎖步”狀態(tài),從而浪費(fèi)了寶貴的計(jì)算能力。
三核設(shè)計(jì)模式
3 個(gè)核心設(shè)計(jì)
?鎖止持續(xù)時(shí)間:1286000納秒
?核心執(zhí)行時(shí)間:156000 納秒
?處理一行數(shù)據(jù)所需的總時(shí)間為 1442000 納秒。
解決方案
在對(duì)這些痕跡進(jìn)行分析之后,人們發(fā)現(xiàn)……
?R、G 和 B 三個(gè)通道的處理過(guò)程可以集中在同一個(gè)核心上進(jìn)行。
?用于輸入和輸出的乒乓緩沖區(qū)可以通過(guò)減少整體內(nèi)存占用來(lái)轉(zhuǎn)換為單個(gè)輸入緩沖區(qū)和單個(gè)輸出緩沖區(qū)。
?僅有一個(gè) S2MM 和 MM2S 通道與 BD 鏈路及鎖相結(jié)合,用于調(diào)控?cái)?shù)據(jù)流和核心執(zhí)行過(guò)程。
如何優(yōu)化“AMD銳龍人工智能神經(jīng)網(wǎng)絡(luò)單元將彩色圖像轉(zhuǎn)換為負(fù)圖像”的功能
結(jié)構(gòu)
計(jì)算的數(shù)據(jù)流
1 核設(shè)計(jì)模式
?單個(gè)組件的鎖止持續(xù)時(shí)間為 320000 納秒
?核心執(zhí)行時(shí)間:?jiǎn)蝹€(gè)組件 190000 微秒
?3 行數(shù)據(jù)(R、G、B)的執(zhí)行時(shí)間 - 1528000 納秒,與 1442000 納秒較為接近 - 采用 3 核設(shè)計(jì)的單行處理方式。
然后,核心部分會(huì)對(duì)每個(gè)像素進(jìn)行取反操作,接著將轉(zhuǎn)換后的像素重新傳輸至 L3 內(nèi)存。
輸入圖像
輸出圖像
結(jié)論
本次課程將演示如何利用“跟蹤”功能來(lái)分析程序的執(zhí)行情況并對(duì)其進(jìn)行優(yōu)化。
簡(jiǎn)要描述這兩種實(shí)現(xiàn)方式之間的相似之處:
* 僅捕獲與 AIE 核相關(guān)的信息參數(shù)
本文編譯自hackster.io





