ZHCACX6 july 2023 AM62A1-Q1 , AM62A3 , AM62A7
AM62A SoC 包含各種處理內(nèi)核和硬件加速器。監(jiān)測(cè)這些元件上的負(fù)載對(duì)于探索整個(gè)系統(tǒng)功能和擴(kuò)展機(jī)會(huì)非常重要。缺陷檢測(cè)演示使用 tiperfoverlay gstreamer 插件在屏幕底部以條形圖的形式顯示內(nèi)核負(fù)載。圖 5-2 顯示了運(yùn)行缺陷檢測(cè)演示時(shí) AM62A 內(nèi)核負(fù)載圖的屏幕截圖。默認(rèn)情況下,該圖每?jī)擅敫乱淮危岳寐拾俜直刃问斤@示負(fù)載。除了 tiperfoverlay gstreamer 插件之外,第二個(gè)可直接在終端上顯示內(nèi)核性能的選項(xiàng)是 perf_stats 工具(具有文件保存功能)。此選項(xiàng)相比 tiperfoverlay 更精確,tiperfoverlay 會(huì)給 Arm 內(nèi)核和 DDR 帶來(lái)額外負(fù)載,以繪制圖形并在屏幕上疊加。
圖 5-2 使用 tiperfoverlay gstreamer 插件的缺陷檢測(cè)演示底部顯示的內(nèi)核負(fù)載條形圖(該圖經(jīng)過(guò)編輯以適合頁(yè)面)圖 5-2 中的圖形顯示,除了整個(gè)支持 Linux 的進(jìn)程外,缺陷檢測(cè)演示僅利用了 Arm 內(nèi)核容量的約 39%(四個(gè) A53 內(nèi)核的平均值)。同時(shí),應(yīng)用中使用的 yolox-nano-lite 利用了 C7xMMA 深度學(xué)習(xí)加速器的約 22%。值得注意的是,在本實(shí)驗(yàn)中,C7xMMA 的時(shí)鐘頻率為 850MHz,而不是 1000MHz。換句話(huà)說(shuō),如果 C7xMMA 加速器的時(shí)鐘頻率為 1000MHz,其利用率將低于報(bào)告的 22%。用于讀取操作的 DDR 為 1706MB/s,用于寫(xiě)入操作的 DDR 為 1118MB/s,因此總操作速率為 2824MB/s。在 3200MT/s 速率下使用 32 位 DDR4 時(shí),AM62A 支持速率為 12.8GB/s 的總 DDR 頻帶。2824MB/s 的總速率利用了總 DDR 帶寬的約 22%。
Arm 內(nèi)核、加速器和 DDR 帶寬的這些低利用率值表明,AM62A 有很大的擴(kuò)展空間,可以運(yùn)行其他應(yīng)用或擴(kuò)展缺陷檢測(cè)應(yīng)用本身,例如使用另一個(gè)更快的攝像頭來(lái)提高幀速率。此外,由于內(nèi)核利用率較低,可以靈活選擇合適的 AM6A SoC 型號(hào)。圖 5-2 中顯示的內(nèi)核負(fù)載適用于 SoC AM62A 系列的 AM62A74 型號(hào)。該型號(hào)配備四個(gè) A53 Arm 內(nèi)核和一個(gè)能夠執(zhí)行 2TOPS 的 C7xMMA 深度學(xué)習(xí)加速器。低利用率值表明,可在 AM62A 的其他低端型號(hào)(例如 AM62A3,其中包括兩個(gè) Arm 內(nèi)核和一個(gè) 1TOPS 深度學(xué)習(xí)加速器)上實(shí)現(xiàn)當(dāng)前形式的缺陷檢測(cè)演示。