如何將 MediaPipe 模型部署到嵌入式平臺邊緣

時間：2026-01-20 13:43:02

關(guān)鍵字：嵌入式 MediaPipe 模型 CPU

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]量化任務(wù)在內(nèi)部使用 AIMET 框架來對模型進行量化處理。要完成這一量化操作，需要使用訓(xùn)練數(shù)據(jù)集的一部分。所需校準(zhǔn)數(shù)據(jù)的大小通常在數(shù)千個樣本的量級。

極速模型

在本項目中，我首先回顧了在部署 MediaPipe 模型時可能出現(xiàn)的挑戰(zhàn)，特別是針對高通龍翼 QCS6490 芯片而言。

然后，我將逐一解決這些挑戰(zhàn)，之后再將模型部署到 QAI Hub 工作平臺中。

最后，我將進行分析以確定我們的加速目標(biāo)是否已經(jīng)達成。

高通人工智能工作臺

高通公司提供了一套在線工具，使用戶能夠?qū)⒛Ｐ筒渴鸬剿麄兊男酒O(shè)備上。

QAI 中心工作臺允許用戶自行導(dǎo)入模型(BYOM)和數(shù)據(jù)集(BYOD)，以便對其進行編譯、量化，并優(yōu)化以適配在高通設(shè)備上的部署。

量化步驟是可選的，具體取決于所針對的設(shè)備。

在該項目中，我們將專門針對 QCS6490 設(shè)備的神經(jīng)處理單元進行研究，因此將需要進行量化處理。

QAI 中心工作臺支持以下模型格式作為輸入：

?PyTorch

?ONNX(開放神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換格式)

其他框架則是通過轉(zhuǎn)換為 ONNX 格式來間接獲得支持的。在我們的案例中，我們將把 MediaPipe 模型從 TFLite 格式轉(zhuǎn)換為 ONNX 格式，使用 tf2onnx 工具。

此次部署包含以下任務(wù)，這些任務(wù)在 QAI Hub 工作臺中被稱為“作業(yè)”：

?量化

?編譯

?驗證;確認(rèn)

?簡介

量化任務(wù)在內(nèi)部使用 AIMET 框架來對模型進行量化處理。要完成這一量化操作，需要使用訓(xùn)練數(shù)據(jù)集的一部分。所需校準(zhǔn)數(shù)據(jù)的大小通常在數(shù)千個樣本的量級。

編譯任務(wù)可以針對多個運行時目標(biāo)進行部署：

?TFLite 運行時(量子神經(jīng)網(wǎng)絡(luò)代理)

?ONNX 運行時

?高通人工智能運行時(QAIRT)

在這個項目中，我對使用 QNN 代理的 TFLite 運行時與 QAIRT 進行了對比研究并進行了探索。

我的理解是，使用 ONNX 運行時進行部署僅在 Windows 系統(tǒng)上可行，而在嵌入式 Linux 系統(tǒng)上則無法實現(xiàn)。

“驗證”和“配置”任務(wù)可用于在實際的目標(biāo)設(shè)備(在我們的案例中為 QCS6490)上對模型進行推理和/或進行性能分析。這些任務(wù)是在云端執(zhí)行的，并且是在實際設(shè)備上進行的。我曾遇到過一些情況，這些任務(wù)因代理設(shè)備不可用而超時。

在這個項目中，我使用了 QAI Hub 工作臺的 2026.01.05.0 版本，其包含以下內(nèi)容：

?AI 資源中心工作臺：aihub-2026.01.05.0

?QAIRT：2.40.0.251030114326_189385

高通公司的流程和相關(guān)文檔一直在不斷變化，每次改進都會使用戶體驗得到提升。

從 Vision AI-KIT 6490 上的 QIRP 1.6 版本圖像開始

該項目是在 Vision AI-KIT 6490 上進行測試的，所使用的圖像為 QIRP 1.6 版本。如果您所使用的板子不同，或者使用的 QIRP 版本不同，那么其他部分中的說明可能需要進行修改。

請使用以下啟動指南將 QIRP 1.6 鏡像程序化到 QCS6490 視覺人工智能套件中：

?Vision AI-KIT 6490 創(chuàng)業(yè)指南 v1.4

這將提供有關(guān)如何對最新版本的 QIRP 1.6 圖像進行編程的說明(文件名為 visionai_6490_qirp_1.6_v4.zip)：

?visionai_6490_qirp_1.6_v4.zip

在使用 QIRP 1.6 鏡像啟動 Vision AI-KIT 6490 后，您可以使用出廠即用演示來進行一次完整性檢查：

請注意底部的系統(tǒng)溫度圖和系統(tǒng)使用率圖。在我們的探索過程中，我們會利用這些數(shù)據(jù)。

在“視覺 AI-KIT 6490”上安裝 QAI Hub

首先，要確保在 Vision AI-KIT 6490 上所做的更改能夠持久生效：

QAI Hub 客戶端可以通過 pip 進行安裝。我們還將安裝對 PyTorch 和 TFLite 的支持：

我嘗試安裝“qai-hub[onnx]”這個軟件包，但安裝過程失敗了。這似乎證實了我的看法，即使用 ONNX 運行時進行部署僅在 Windows 系統(tǒng)上可行，而在嵌入式 Linux 系統(tǒng)上則無法實現(xiàn)。

我們還可以安裝 QAI 中心模型庫，具體操作如下：

然后按照以下命令輸入您的登錄信息一次：

作為一項驗證手段，您可以列出 QAI 中心工作臺所支持的設(shè)備：

QAI 平臺上的 MediaPipe 模型

如果您已經(jīng)閱讀過高通公司的相關(guān)文檔，您就會發(fā)現(xiàn)他們已經(jīng)在其 QAI 平臺上部署了 MediaPipe 模型。

那么……我們?yōu)槭裁匆匦掳l(fā)明輪子呢?

這不僅是一個非常好的問題，而且也是一個非常重要的需要強調(diào)的觀點。

首先，在我撰寫這篇文章之時，以下這些 mediapipe 模型中僅有 1 個在高通 QCS6490 芯片上得到了支持：

?mediapipe_hand => 在 QCS6490 上不支持

?mediapipe_face => 在 QCS6490 上已支持

?mediapipe_pose => 在 QCS6490 上不支持

其次，高通公司選擇支持較舊版本的 mediapipe 模型(v0.07)，而非最新的版本(v0.10)。

這一點非常重要，需要特別強調(diào)一下，因為在 v0.7 版本之后，我們對手掌檢測和手部特征點模型進行了重大更新，這些更新專門用于手勢和手語識別：

?SignAll SDK：使用 MediaPipe 構(gòu)建的手語交互界面現(xiàn)已面向開發(fā)者開放 - 谷歌開發(fā)者博客

事實上，高通公司選擇支持的是由開源社區(qū)將這些模型轉(zhuǎn)換為 PyTorch 版本后的版本：

?[維杜爾·薩蒂賈] 布萊茲帕爾姆：vidursatija/布萊茲帕爾姆

?[馬蒂希·霍勒曼斯] 布萊澤臉 - PyTorch ： hollance/BlazeFace-PyTorch

?[扎克·穆雷茲] MediaPipePyTorch ：zmurez/MediaPipePytorch

盡管 zmurez 沒有透露用于生成 PyTorch 版本模型的轉(zhuǎn)換腳本，但 vidrsatija 和 holland(zmurez 的研究工作基于他們的成果)確實以 Jupyter 筆記本的形式提供了這些轉(zhuǎn)換腳本。

不幸的是，這些轉(zhuǎn)換腳本/筆記本僅適用于 v0.7 版本，而不適用于后續(xù)版本(相信我，我試過了……).

當(dāng)我們在 QCS6490 板上運行支持的 mediapipe_face 模型時，可以看到對 zmurez/MediaPipePyTorch 倉庫的引用：

選擇這個過時的模型對我來說毫無意義，除了可能是在整合的時候，只有 PyTorch 被 Qualcomm AI 堆棧所支持之外?

當(dāng)我將這些模型部署到 AMD/Xilinx 的 Vitis-AI 平臺時，我也遇到了同樣的情況。

不管原因如何，我認(rèn)為都有機會進一步加強對 MediaPipe 的支持。由于我們可以將 TFLite 模型轉(zhuǎn)換為 ONNX 格式，所以我為 QCS6490 上的 MediaPipe 模型提出了以下更新的流程：

在高通平臺上部署 MediaPipe 所面臨的挑戰(zhàn)

在第一部分中，我遇到的第一個難題是：在嵌入式平臺上運行 MediaPipe 模型時，其性能會明顯低于在現(xiàn)代計算機上的表現(xiàn)。這就是我試圖通過 QAI Hub Workbench 來加速這些模型的原因。

第二個挑戰(zhàn)在于，谷歌并未提供用于訓(xùn)練 MediaPipe 模型的數(shù)據(jù)集。由于量化需要使用其中的一部分訓(xùn)練數(shù)據(jù)，這就要求我們自己去收集這些數(shù)據(jù)。

為了應(yīng)對這些挑戰(zhàn)，我們將克隆以下存儲庫(blaze_tutorial)，該存儲庫將用于在 QAI Hub Workbench 中對云端的模型進行量化、編譯和性能分析：

創(chuàng)建量化校準(zhǔn)數(shù)據(jù)集

正如“QAI Hub 工作臺概述”部分所描述的那樣，量化階段需要數(shù)百到數(shù)千個數(shù)據(jù)樣本，理想情況下應(yīng)是從訓(xùn)練數(shù)據(jù)中選取的一部分樣本。由于我們無法獲取訓(xùn)練數(shù)據(jù)集，所以我們需要自己生成這些數(shù)據(jù)。

我們可以使用修改后的 blaze_app_python.py 腳本生成校準(zhǔn)數(shù)據(jù)集，具體步驟如下：

對于每一張包含至少一只手的輸入圖像，我們想要生成：

?手掌檢測輸入圖像：經(jīng)過調(diào)整大小并填充至模型輸入尺寸的圖像

?手部特征點輸入圖像：每個手部的裁剪圖像，經(jīng)過調(diào)整大小處理以適應(yīng)模型的輸入尺寸。

輸入圖像的可能來源如下：

?Kaggle：存在眾多數(shù)據(jù)集，并且這些數(shù)據(jù)集可以被重復(fù)使用。

?Pixabay：包含多段有趣視頻，從中可以提取出圖片。

對于 Kaggle 這個案例，如果我們采用以下這樣一個現(xiàn)有的數(shù)據(jù)集：

?[Kaggle] 手勢數(shù)據(jù)集(由瑞蒂卡·吉里達爾創(chuàng)作)

我們可以對 blaze_app_python 倉庫中的 blaze_detect_live.py 腳本進行修改，從而創(chuàng)建一個版本，該版本能夠掃描所有圖像，并生成一個特定于 NumPy 的二進制格式文件(*.npy)，其中包含我們在量化步驟中所需的校準(zhǔn)數(shù)據(jù)：

?blaze_app_python/calib_dataset_kaggle/gen_calib_hand_dataset.py

要運行此腳本，請前往“blaze_app_python/calib_dataset_kaggle”目錄，將 Kaggle 數(shù)據(jù)集下載到該子目錄中，然后按照以下方式啟動腳本：

這將為 0.10 版本的手掌檢測和手部特征點模型生成以下校準(zhǔn)數(shù)據(jù)：

?calib_palm_detection_192_dataset.npy 文件：包含 1871 個 192x192 像素的 RGB 圖像樣本。

?calib_hand_landmark_224_dataset.npy 文件：包含 1880 個 224x224 像素的 RGB 圖像樣本。

最終我決定不使用這個數(shù)據(jù)集，但還是記錄下了整個過程以便日后參考，這個過程可以適用于任何其他 Kaggle 數(shù)據(jù)集。

再次說明，我們可以對 blaze_app_python 倉庫中的 blaze_detect_live.py 腳本進行修改，從而生成一個新的版本。該版本將對視頻進行掃描，并生成一個包含量化步驟校準(zhǔn)數(shù)據(jù)的 NumPy 特定的二進制格式文件(*.npy)：

?blaze_app_python/calib_dataset_pixabay/gen_calib_hand_dataset.py

要運行此腳本，請前往“blaze_app_python/calib_dataset_pixabay”目錄，將 Pixabay 視頻下載到“videos”子目錄中，然后按照以下方式啟動腳本：

這將為 0.10 版本的手掌檢測和手部特征點模型生成以下校準(zhǔn)數(shù)據(jù)：

?calib_palm_detection_192_dataset.npy 文件：包含 1577 個 192x192 像素的 RGB 圖像樣本。

calib_hand_landmark_224_dataset.npy 文件：包含 2595 個 224x224 像素的 RGB 圖像樣本。

您可以自由選擇上述所描述的任一數(shù)據(jù)源，或者使用您自己的數(shù)據(jù)源作為量化階段的數(shù)據(jù)。

我已經(jīng)將關(guān)于這個子主題(為各種版本的模型創(chuàng)建手部/面部/姿勢數(shù)據(jù)集)的探索成果存入了以下兩個檔案中：

?Kaggle：calib_dataset_kaggle.zip

?Pixabay：calib_dataset_pixabay.zip

為了此次探索，我準(zhǔn)備了校準(zhǔn)數(shù)據(jù)(來自 Pixabay)，您可以按照以下方式下載并提取這些數(shù)據(jù)：

模型轉(zhuǎn)換

使用 QAI Hub Workbench 進行部署的第二步是下載 TFLite 模型，并使用 tf2onnx 工具將其轉(zhuǎn)換為 ONNX 格式：

?get_tflite_models.sh：從谷歌下載 TFLite 模型

?convert_models.sh：使用 tf2onnx 工具將模型轉(zhuǎn)換為 ONNX 格式

使用以下命令來下載并轉(zhuǎn)換 mediapipe 模型為 ONNX 格式：

模型部署

既然我們有了校準(zhǔn)數(shù)據(jù)，并且我們的模型已轉(zhuǎn)換為 ONNX 格式，那么就可以使用 AI Hub 工作臺來執(zhí)行模型量化、性能分析和編譯操作了。

為此我準(zhǔn)備了一份腳本：

?qai_hub_workbench_flow.py

此腳本在被調(diào)用時會接受三個(3)參數(shù)：

?名稱：型號名稱(例如：palm_detection_lite)

?模型：模型文件(例如：models/palm_detection_lite.onnx)

?說明：輸入尺寸(例如：256)

“名稱參數(shù)”用于指明我們所部署的模型類型，例如對于手掌檢測器而言，可以是“palm_detection_lite”或“palm_detection_full”;而對于手部特征點模型，則可以是“hand_landmark_lite”或“hand_landmark_full”。而“分辨率”則表示模型的輸入尺寸。

這兩項參數(shù)將決定用于量化操作的校準(zhǔn)數(shù)據(jù)集是哪一個。例如：

?名稱：palm_detection_lite，大小：192 => 文件名：calib_palm_detection_192_dataset.npy

?名稱=hand_landmark_lite，大小=224 => calib_hand_landmark_224_dataset.npy

該腳本將為以下目標(biāo)運行環(huán)境生成輸出文件：

?TFLite(*.tflite)

?onnx(*.onnx.zip)

?qnn_dlc (*.dlc)

?qnn_context_binary (*.bin)

?預(yù)編譯的 QNN ONNX 文件(*.onnx.zip)

我將僅使用以下兩個目標(biāo)運行時環(huán)境來進行推理測試：

?TFLite (*.tflite) => 使用 TFLite(搭配 QNN 代理)

?qnn_context_binary (*.bin) => 使用 QAIRT

我已提供了另一份腳本，該腳本將調(diào)用 qai_hub_workbench_flow.py 腳本來對模型進行量化、編譯和性能分析：

?deploy_models_qai_hub_workbench.sh

在執(zhí)行之前，您需要對以下列表進行修改：

?模型列表：請指定您想要部署的模型(或多個模型)

以下是修改后的腳本版本，它將部署 0.10 版本的掌部檢測和手部特征點模型。

此腳本的執(zhí)行方式如下：

完成之后，以下編譯好的模型將位于當(dāng)前目錄中：

?palm_detection_full.tflite、palm_detection_full.bin……

?hand_landmarks_full.tflite、hand_landmarks_full.bin……

?palm_detection_lite.tflite、palm_detection_lite.bin……

?hand_landmarks_lite.tflite、hand_landmarks_lite.bin 等……

為了方便起見，我已將 QCS6490 的編譯模型存入以下檔案中：

?TFLite 模型(*.tflite)：blaze_tflite_qnn_models_qcs6490.zip

?QAIRT 模型(*.bin)：blaze_qairt_models_qcs6490.zip

在 QAI 資源中心工作臺中分析結(jié)果

在“職位”頁面中，如果我們點擊“個人資料”選項卡，就能看到針對每個模型的個人資料生成結(jié)果：

如果我們將運行在 CPU 上的未量化 ONNX 模型與運行在 NPU 上的量化模型進行比較：

?“手掌檢測(基于 QAIRT 版本)”：66.4 毫秒 => 1.3 毫秒

?hand_landmarks_full(QAIRT 版本)：47.4 毫秒 => 1 毫秒

如果我們將運行在 CPU 上的未量化 ONNX 模型與運行在 NPU 上的量化模型進行比較：

?“palm_detection_lite(基于QAIRT的版本)：54.7 毫秒 => 1.2 毫秒”

?hand_landmarks_lite(基于 QAIRT 的版本)：29.9 毫秒 => 0.7 毫秒

這是顯著的加速(幅度在 30 倍到 60 倍之間)!

在量化模型的性能分析結(jié)果中存在一個異常情況：

?palm_detection_full(TFlite 版本)：66.4 毫秒 => 31.0 毫秒

如果我們點擊該任務(wù)以了解其運行情況，就會發(fā)現(xiàn)該模型在 NPU 上的加速程度并不完全，仍有 150 層運算是在 CPU 上進行的。

所有其他的工作都采用了干凈的 NPU 實現(xiàn)方式，包括 palm_detection_full 模型的 QAIRT 版本：

如果我們向下滾動并選擇“運行時層分析”部分，然后點擊“查看操作跟蹤”按鈕，就能獲得逐層的詳細分析報告：

如果我們查看每個模型的層數(shù)(中央處理器、神經(jīng)處理單元、圖形處理器等)，則在性能測試報告中可得到以下所報告的層數(shù)：

“ONNX 層”指的是我們作為 QAI Hub 工作臺輸入所使用的浮點型 ONNX 模型。

“TFLite 層”指的是經(jīng)過量化處理的模型，專為 TFLite 運行時環(huán)境設(shè)計。

“QAIRT 層”對應(yīng)的是經(jīng)過量化處理的模型，其目標(biāo)是“qnn_compiled_binary”，并且可以與高通 AI 運行時配合使用。

模型準(zhǔn)確率

如果我們查看模型的準(zhǔn)確率，那么在量化任務(wù)中我們得到的結(jié)果如下：

我們可以看到，模型的準(zhǔn)確度仍有待提高。這可能與校準(zhǔn)數(shù)據(jù)有關(guān)，但我尚未進一步進行調(diào)查。

使用 0.07 版本的手掌檢測模型時，能達到最佳的準(zhǔn)確度。

在“手部特征點模型”0.07 版本中，達到了最差的準(zhǔn)確度。這一點可以從 0.07 版本的流程中看出，即手部能夠被正確檢測出來，但特征點的準(zhǔn)確性卻不高。

不幸的是，手部特征點模型 v0.10 版本的 PSNR 計算出現(xiàn)了錯誤，所以我不清楚具體的指標(biāo)數(shù)值是什么，但它們看起來肯定是準(zhǔn)確的，所以我推測其數(shù)值肯定高于 30 分貝。

除了方向判斷有誤(總是錯誤地報告為“左手”)之外。

模型執(zhí)行

為了支持 QCS6490 型號，對“blaze_app_python”應(yīng)用程序進行了以下增強，添加了相應(yīng)的推理目標(biāo)：

如圖所示，我已經(jīng)為原始的 TFLite 模型以及這些模型的 PyTorch 版本(v0.07)提供了支持。

我們也可以運行未量化化的 ONNX 模型，但更重要的是，通過以下兩個運行時目標(biāo)實現(xiàn)了在 NPU 上的執(zhí)行支持：

?TFLite(采用 QNN 代理)

?QAIRT

我針對 TFLite(并使用了 QNN 代理)編寫的最終推理代碼，實際上采用了 EdgeAI Lite-RT(即谷歌最新版的 TFLite)，該代碼可在“blaze_app_python”存儲庫中的“blaze_tflite_qnn”子目錄中找到：

?blaze_app_python/blaze_tflite_qnn/blazedetector.py

?blaze_app_python/blaze_tflite_qnn/blazelandmark.py

我們需要確保我們的電路板上具備所需的庫文件，而實際上它確實具備：

我為 QAIRT 編寫的最終推理代碼可以在“blaze_app_python”存儲庫中的“blaze_qairt”子目錄下找到：

?blaze_app_python/blaze_qairt/blazedetector.py

?blaze_app_python/blaze_qairt/blazelandmark.py

我們需要在我們的板子上安裝 QAIRT SDK，這可以通過以下步驟來完成。

首先，我們下載并安裝了 QAIRT SDK 的 2.40 版本：

然后，我們(可選地)會克隆、構(gòu)建并安裝 QAI 應(yīng)用程序構(gòu)建器：

在“視覺 AI-KIT 6490”設(shè)備上安裝 Python 應(yīng)用程序

首先，我們要確保我們的更改能夠持久生效：

該 Python 演示應(yīng)用程序需要一些特定的包，這些包可以通過以下方式安裝：

該 Python 應(yīng)用程序可通過以下 GitHub 倉庫進行訪問：

若要成功使用帶有原始 TFLite 模型的 Python 示例程序，需從谷歌網(wǎng)站下載這些模型：

若要成功使用與 QCS6490 型號配套的 Python 示例程序，需按照以下步驟進行下載：

你們都準(zhǔn)備好了!

在 Vision AI-KIT 6490 上啟動 Python 應(yīng)用程序

正如我們在第 1 部分中所看到的，Python 應(yīng)用程序能夠啟動多種雙推理流程的變體，這些變體可以通過以下參數(shù)進行篩選：

——布萊茲：手部動作 | 面部表情 | 姿態(tài)動作

--目標(biāo)：blaze_tflite | ... | blaze_tflite_qnn | blaze_qairt

--pipeline：管道的特定名稱(可通過 --list 參數(shù)進行查詢)

為了顯示所有支持的管道列表，請按照以下方式運行 Python 腳本：

為了啟動用于手部檢測和關(guān)鍵點識別的 v0.10 便攜版管道，以及帶有 QNN 代理的 TFLite 運行時，請按照以下方式使用 Python 腳本：

這將啟動針對 QCS6490 系統(tǒng)編譯的 0.10(精簡版)版本的模型，如圖所示：

之前的視頻并未進行加速處理。該視頻顯示，在未檢測到手部時(運行一種模型：手掌檢測)，幀率為約 30 幀每秒;在檢測到一只手時(運行兩種模型：手掌檢測和手部特征點檢測)，幀率為約 20 幀每秒;在檢測到兩只手時(運行三種模型：手掌檢測和兩只手特征點檢測)，幀率為約 15 幀每秒。

這比在 CPU 上運行的原始 TFLite 模型要差一些，所以對于這種情況，我不得不考慮放棄使用 TFLite 并采用 QNN 代理的做法。

為了啟動用于手部檢測和關(guān)鍵點識別的 v0.10 便攜版管道以及高通 AI 運行時，請按照以下方式使用 Python 腳本：

這將啟動針對 QCS6490 系統(tǒng)編譯的 0.10(精簡版)版本的模型，如圖所示：

之前的視頻并未進行加速處理。該視頻顯示，在未檢測到手部時(運行一種模型：手掌檢測)，幀率為 30 幀每秒;當(dāng)檢測到一只手時(運行兩種模型：手掌檢測和手部特征點檢測)，幀率為 30 幀每秒;當(dāng)檢測到兩只手時(運行三種模型：手掌檢測和兩個手的特征點檢測)，幀率為 30 幀每秒。

與使用 QNN 代理的 TFLite 運行時相比，高通 AI 運行時實現(xiàn)了顯著的加速!

為了了解使用 QAIRT 運行的模型的實際表現(xiàn)，我們需要暫時斷開 USB 攝像頭(該攝像頭決定了 30 幀每秒的幀率)。我們將在下一節(jié)中進行此項操作。

在“視覺 AI-KIT 6490”平臺上對模型進行基準(zhǔn)測試

為了獲得穩(wěn)定的輪廓結(jié)果，我們使用了一張測試圖片(包含雙手)，該圖片可以從谷歌上下載，具體操作如下：

我們可以使用以下命令來直觀地比較原始的 TFLite 模型與 QAIRT 加速模型的性能分析結(jié)果：

以下圖表將會出現(xiàn)：

您可能已經(jīng)注意到圖表中的柱狀圖存在一些抖動現(xiàn)象，因此我們將把一系列數(shù)據(jù)保存到 CSV 文件中，然后對結(jié)果進行平均處理，以便更清晰地了解其性能情況。

我沒有這種自動化的流程，所以這是一個需要人工操作的流程，包括采集、處理和呈現(xiàn)等環(huán)節(jié)……

以下命令可用于使用 QCS6490 模型和測試圖像為 qairt_hand_v0_10_lite 流水線生成性能報告結(jié)果：

以下命令可用于使用 TFLite 模型及測試圖像為 tfl_hand_v0_10_lite 流水線生成性能報告結(jié)果：

對于 qairt_hand_v0_10_full 和 tfl_hand_v0_10_full 這兩個模型，也采用了同樣的操作。

所有.csv 文件中的數(shù)據(jù)均進行了平均處理，然后使用 Excel 進行了繪圖。

以下是使用 QAIRT 部署的模型的性能分析結(jié)果，與參考的 TFLite 模型進行了對比：

同樣，需要指出的是，這些基準(zhǔn)測試是通過單線程的 Python 腳本完成的。如果采用多線程實現(xiàn)方式，還有進一步加速的空間。在圖形運行器等待從一個模型的子圖中獲取數(shù)據(jù)的同時，可以同時啟動另一個(或多個其他)模型……

此外，還有機會通過使用 C++ 代碼來加快整個開發(fā)流程的進度……

已知問題

盡管我已經(jīng)對 palm_detection 和 hand_landmarks 這兩個模型的 v0.07 版本進行了量化和部署，但 hand_landmarks 模型的準(zhǔn)確性已經(jīng)下降了，所以在您的應(yīng)用中請不要再使用這個模型。

對于 0.10 版本的手部特征點數(shù)據(jù)，手的朝向似乎沒有得到正確處理。這些模型總是返回約 1.0 的數(shù)值，這對應(yīng)于“左手”。

本文編譯自hackster.io

如何將 MediaPipe 模型部署到嵌入式平臺邊緣

與傳統(tǒng)的驅(qū)動方式相比，共陰恒流驅(qū)動在能效有哪些優(yōu)勢

工業(yè)電機驅(qū)動電源設(shè)計：反電動勢抑制與過流保護的集成方案

如何解決 LED 驅(qū)動電源的易損壞問題

LED設(shè)計中LED驅(qū)動電源的公式

EV主驅(qū)IGBT隔離驅(qū)動電源方案選擇問題探討

合理的驅(qū)動電源方案成為大功率區(qū)域照明的主流選擇

AC-DC電源轉(zhuǎn)換拓?fù)浣Y(jié)構(gòu)設(shè)計

針對于LED照明驅(qū)動電源技術(shù)中的電磁干擾其中的三大硬件問題措施

LED驅(qū)動電源的核心部分“開關(guān)管”和“變換器”設(shè)計技巧

最全LED驅(qū)動電源及散熱設(shè)計方案介紹

常用的LED驅(qū)動電源有哪些？工作原理是什么？

LED驅(qū)動電源的類型可分為有哪些？

解散全部員工！深圳又一電子大廠宣布停產(chǎn)結(jié)業(yè)

崧盛股份：大功率LED驅(qū)動電源行業(yè)門檻高，新進入者面臨三大壁壘

關(guān)于LED驅(qū)動電源的分類以及特點解析，你了解嗎？

你知道常見的LED驅(qū)動電源種類以及它們有哪些特點嗎？

關(guān)于LED驅(qū)動電源特點以及在設(shè)計時需要注意的關(guān)鍵點

多路 LED 驅(qū)動電源技術(shù)的開發(fā)與可靠性研究分析

值得大家學(xué)習(xí)的LED驅(qū)動電源的特點以及工作原理概述

Cree宣布徹底告別LED和照明行業(yè)