通過模擬ML實現(xiàn)前所未有的節(jié)能


原標題:通過模擬ML實現(xiàn)前所未有的節(jié)能

模擬計算將是確保未來能夠支持ML的必要工具。
機器學習 (ML) 的興起催生了一類全新的用例和應用程序。具體而言,邊緣計算和邊緣 ML 增強了傳統(tǒng)設備監(jiān)控、分析和自動化日常任務的能力。
盡管取得了這些進步,但仍然存在一個主要挑戰(zhàn):如何平衡這些設備的高功率需求。 機器學習應用程序 滿足獨立電池供電設備的低功耗要求?對于這些應用,傳統(tǒng)的數(shù)字電子產品不再是最佳選擇。模擬計算已成為在邊緣實現(xiàn)超低功耗ML的明顯選擇。
隨著邊緣ML的出現(xiàn),該行業(yè)已經看到響應環(huán)境中刺激的智能設備的激增。例如,今天的許多家庭都托管了一個虛擬助手,如亞馬遜Alexa或Google Home,在執(zhí)行任務之前監(jiān)聽關鍵字。其他示例包括監(jiān)控框架中運動的安全攝像頭,以及在工業(yè)方面檢測工業(yè)機器性能異常的傳感器。
無論具體應用如何,所有這些設備都從根本上依賴于 “始終在線”機器學習,如圖 1 所示。

圖 1:傳統(tǒng)的始終在線系統(tǒng)必須對所有數(shù)據(jù)進行數(shù)字化和處理。
換句話說,這些設備會持續(xù)監(jiān)視其環(huán)境中的某些外部觸發(fā)器,例如音頻關鍵字或異常事件。一旦檢測到這種刺激,設備就會被觸發(fā)。在智能助手的示例中,設備等待聽到關鍵字,然后將后續(xù)音頻發(fā)送到云端進行處理。
關于這個方案,應該注意兩個重要因素。首先,為了使方案正常工作,設備必須始終處于打開狀態(tài),不斷感知可能隨時(或永遠不會)隨機發(fā)生的外部觸發(fā)的環(huán)境。其次,為了獲得最佳延遲和隱私,必須在邊緣執(zhí)行刺激檢測。
其結果是器件功率效率和性能之間的基本權衡。為了檢測刺激,機器必須持續(xù)開啟和 執(zhí)行機器學習計算 以確定感興趣的事件是否已發(fā)生。由于其中許多設備在相對高功率的數(shù)字片上系統(tǒng) (SoC) 上運行相關的 ML 算法,因此它們只需等待觸發(fā)事件即可消耗大部分功率。
面向 ML 的模擬計算
在這些挑戰(zhàn)中,模擬計算最近以低功耗ML為目的而重新興起。
與通過符號計算(1和0)執(zhí)行算術運算的數(shù)字計算相反,模擬計算依賴于精確的電壓和電流值。出于多種原因,模擬計算特別適合 ML 應用。
一個主要原因是,幾乎所有 ML 應用程序都從分析原始形式的數(shù)據(jù)(最初是模擬數(shù)據(jù))開始的。由于大多數(shù)傳感器的輸出是模擬信號,因此模擬計算之所以有意義,因為它能夠以數(shù)據(jù)的原始格式進行計算,從而節(jié)省功耗和時間,從而消除了 ML 工作流程中昂貴的模數(shù)轉換需求。
而且,計算要求 機器學習算法 與模擬計算機的功能很好地保持一致。例如,ML 中最基本的任務之一是乘法累加 (MAC) 函數(shù)。您 可以 通過 對 進出 節(jié)點 的 電流 求和, 輕松 實現(xiàn) 模擬 電路 中的 MAC 功能。事實上,MAC功能需要許多晶體管來實現(xiàn)數(shù)字實現(xiàn),而只需使用幾個晶體管就可以更有效地在模擬中完成。
最后,與數(shù)字計算相比,應用能夠以明顯更低的功耗執(zhí)行模擬MAC功能和其他模擬計算。
模擬機器學習解決方案
目前市場上很少有模擬計算解決方案。然而,在可用的解決方案中,Aspinity的解決方案尤其獨特。
無脊椎性產生 模擬機器學習芯片 旨在以原始格式檢測和分類傳感器驅動的事件。如圖2所示,該芯片由不同的級組成,包括模擬輸入/輸出(I/O)、傳感器接口、信號分解和多層神經網絡。

圖 2:Aspinity 模擬 ML 芯片的框圖。(來源:阿斯皮尼蒂)
每個級都由可配置的模擬模塊(CAB)組成,這些模擬模塊是特定于功能的模擬模塊,用戶可以通過軟件根據(jù)其特定需求進行編程和配置。
在這些模塊中是Aspinity專有的模擬非易失性存儲器(NVM)。NVM 存儲偏差和權重等值,并允許系統(tǒng)微調 CAB,以考慮由固有現(xiàn)象(如不匹配和溫度)引起的可變性。使用 NVM,您可以確保每個模擬電路按預期運行,并且彼此完全相同。
用戶可以利用這些工具根據(jù)其應用需求定制解決方案,支持各種輸入傳感器類型和數(shù)字 I/O 兼容性。
模擬電源效率
由于高度可靠和高性能模擬計算的出現(xiàn),對于始終在線的ML,存在一種很有前途的電源效率解決方案。
系統(tǒng)可以利用模擬計算來執(zhí)行智能設備所需的始終在線的 ML 處理,如圖 3 所示。

圖 3:使用模擬計算,可以顯著降低始終在線的 ML 系統(tǒng)功耗。
在這種架構中,Aspinity的模擬ML芯片可以位于傳感器和數(shù)字電子設備之間。這里,上游 模擬芯片 將持續(xù)對原始傳感器數(shù)據(jù)執(zhí)行必要的ML計算,并在檢測到觸發(fā)器時喚醒必要的下游數(shù)字電子設備。
這種設置的主要好處是前所未有的節(jié)能。與高耗電的數(shù)字電子設備始終處于打開狀態(tài)的傳統(tǒng)架構相反,該解決方案允許關閉數(shù)字電子設備,除非需要它們。
同時,模擬處理器以~20 μA的極小功耗執(zhí)行始終在線的事件檢測。因此,最初消耗約7450 μA的系統(tǒng)現(xiàn)在可以消耗低至70 μA或更低,具體取決于應用。
為了進一步量化這一優(yōu)勢,內部測試表明,與傳統(tǒng)方案相比,語音檢測等常見應用在增加模擬計算后,能效可提高92×倍。其他應用,如玻璃破碎檢測,已證明節(jié)能高達105×。
面向未來邊緣的模擬
隨著邊緣 ML 成為我們技術世界中越來越重要的一部分,對電源效率的需求從未如此之大。在所有可用的解決方案中,模擬計算(經證明可將功耗降低幾個數(shù)量級)具有推動該領域發(fā)展的獨特優(yōu)勢。
為了確保一個可以支持ML的未來,我們已經習慣了一種可行和可持續(xù)的方式,在這里 模擬計算 將是一個必要的工具。
責任編輯:David
【免責聲明】
1、本文內容、數(shù)據(jù)、圖表等來源于網絡引用或其他公開資料,版權歸屬原作者、原發(fā)表出處。若版權所有方對本文的引用持有異議,請聯(lián)系拍明芯城(marketing@iczoom.com),本方將及時處理。
2、本文的引用僅供讀者交流學習使用,不涉及商業(yè)目的。
3、本文內容僅代表作者觀點,拍明芯城不對內容的準確性、可靠性或完整性提供明示或暗示的保證。讀者閱讀本文后做出的決定或行為,是基于自主意愿和獨立判斷做出的,請讀者明確相關結果。
4、如需轉載本方擁有版權的文章,請聯(lián)系拍明芯城(marketing@iczoom.com)注明“轉載原因”。未經允許私自轉載拍明芯城將保留追究其法律責任的權利。
拍明芯城擁有對此聲明的最終解釋權。