侵權投訴
訂閱
糾錯
加入自媒體

存算一體:內核架構創新,打破算力能效極限|深度研報

2023-05-31 18:21
光錐智能
關注

作者|王嘉攀 司馬潔

本報告由勢乘資本和光錐智能聯合發布

在后摩爾時代,存算一體作為可10倍提升單位功耗下算力的顛覆性技術之一,其底層原理、應用前景及可實現性如何?當前的產業現狀及行業創新創業機遇如何?本文從底層技術原理、產業需求變革說起,全面梳理存算一體產業創新浪潮與投資機遇圖景:

一、核心判斷及觀點

1.存算一體屬于芯片的底層架構創新,階段非常早期,其產業鏈空白度及機遇挑戰不亞于20年前從頭開始發展GPU。

2.相對于量子計算、光子芯片、非硅基芯片等前沿算力方案,受益于介質等技術成熟,存算一體芯片更有希望在3-5年內廣泛落地。

3.存算一體領域屬于少有的國內外同時起步的芯片領域,中國更有希望做出引領世界的產品。

4.當前產業界及投資方認為產業鏈上下游仍不完善,仍需5-10年才能投入使用,但這也意味著更為全面的創新機遇。5.當前行業玩家競爭主要集中在不同的存儲介質,長期來看存儲介質路線并無差別,在設計方法論、測試、量產、軟件、場景選擇等方面全方位競爭是長期關鍵。6.第一款、第二款芯片場景的選擇非常重要,率先取得商業化驗證,打造爆款是未來三年勝出關鍵。7.作為新興技術,產業人才主要集中于學界而非企業界,因此院校技術、人才轉化資源非常關鍵。8.除創業公司外,大學院校及巨頭也在同步做研發,長期來看,真正強勁的競爭對手可能是觀望中的巨頭。9.存算一體芯片相對于CPU/GPU等主流算力并非是取代關系,未來將會成為主流算力的重要補充,更側重于高能效的算力。

二、存算一體技術的背景及原理

在全球數據量呈指數級暴漲,算力相對于AI運算供不應求的現狀下,存算一體技術主要解決了高算力帶來的高能耗成本矛盾問題,有望實現降低一個數量級的單位算力能耗,在功耗敏感的百億級AIoT設備上、高能耗的數據中心、自動駕駛等領域有望發揮其低功耗、低時延、高算力密度等優勢。

在現有的成熟架構及工藝下,當前依靠制程技術進步,增加晶體管密度提升算力、降低功耗已逐步趨于物理極限,且成本逐步提高;

在馮諾依曼架構下,由于數據存儲與運算單元分離,算力提升受限,功耗增加:

應對存儲單元與計算單元分離的現狀,存算一體技術思路應運而生,在器件單元上存儲與計算單元融合,通過底層的架構創新解決馮諾依曼架構的固有瓶頸:

由于存儲介質技術在近年來不斷突破,此外AIoT時代對于設備的智能化、低功耗、體積小、低時延等特性提出了天然要求(而現有的技術路線未能很好的滿足需求),在技術突破疊加市場需求的雙重作用力下,存算一體技術當前已到達產業化爆發拐點:

相對于五十多年前CPU的誕生以及二十多年前GPU的誕生,當前存算一體技術仍處于早期階段,未來依靠其更好的并行度、更好的能效比等特性,有望成為智能化時代的主流算力平臺之一,與現有的算力解決方案互為補充。伴隨架構創新的巨大機遇和算力需求的變化,在存算一體領域有希望孕育下一個千億美元級的芯片巨頭,當前我國存算一體技術研發與國外處于齊頭并進的階段,我國存算一體技術及產業有望引領世界。

存算一體當前有一些相似的稱呼(如近存計算),其內在結構差別如下:

近存計算:不改變計算單元和存儲單元本身設計功能,通過采用先進的封裝方式及合理的硬件布局和結構優化,增強二者間通信寬帶,增大傳輸速率;本質上屬于馮諾依曼架構,通過拉近存儲單元和計算單元的距離,對“存儲墻”進行優化。

內存儲計算:存儲單元與計算單元完全融合,無獨立計算單元,通過存儲器顆粒上嵌入算法,由存儲器芯片內部的存儲單元完成計算操作;其設計難度更高,未來可提升的空間也更大,但需要獲得代工廠許可支持。本文所探討是存算一體/存內計算企業主要集中于這類。

三、存儲介質技術路線的選擇

分析存算一體,當前存算一體芯片研發企業/機構在成熟介質上的切入點集中在SRAM、Nor-Flash和DRAM等;部分學術機構選擇切入RRAM等新型介質研發。

從存儲介質的分類來講,分為易失性存儲器和非易失性存儲器。

上圖引自方正證券研報

當前不同的存儲介質在計算機架構中均承擔著必要的工作任務,其中SRAM距離CPU最近,響應時間最快,存儲容量較;

其次分別是DRAM、NAND-Flash等介質,在傳輸速率、存儲容量上各有其特點:

1.易失性存儲器:即在正常關閉系統或者突然性、意外性關閉系統的時候,數據會丟失,成本高。

DRAM:內存條(一個存儲單元僅需一個晶體管和一個小電容),占據58%的半導體存儲市場份額,當前已突破20nm,往10nm過渡。

SRAM:CPU緩存(一個存儲單元需要4-6個晶體管),特點是速度最快(納秒級),不需要一直充電。

2.非易失性存儲器:在上述斷電情況下數據不會丟失,成本低。

NAND Flash:如固態硬盤、U盤和內存;容量大,但讀寫速度極低。

NOR Flash:代碼型內存,主要存一些指令;如機頂盒、網關、路由器中嵌入代碼的存儲;容量較小且寫入數據極低,但讀速較快。

長期來看,存算一體芯片產品化的快速發展離不開新型存儲介質成熟度提升的助推,以下為不同新型存儲介質的原理比較:

長期來看,RRAM(憶阻器)是除了電阻器、電容器、電感器之外的一大新發現;其與生物神經突觸有著非常類似的特性,因此也被成為電子突觸器件。

以下為新型存儲介質的性能比較:

以下為不同存儲介質的存儲原理及客觀性能比較;其中成熟的存儲介質如SRAM、DRAM、Flash基于電荷的移動完成數據存儲;新型存儲介質與RRAM、MRAM等基于電阻大小的變化完成數據存儲功能。

除介質以外,選擇數字計算與模擬計算也是影響存算一體芯片性能的因素之一;其中數字計算精度更高。

四、存算一體應用場景

1.存算一體架構與深度學習網絡運算模型高度重合。

通用性計算芯片在服務特定AI算法方面并不具備性價比優勢,為AI定制的芯片將成為人工智能產業鏈條上的底層核心技術。

存內計算作為創新芯片架構形式,突破了存儲墻問題,且其本質是乘積累加運算(Multiply Accumulate, MAC)操作加快的體現,與深度學習網絡運算模型中的基本算子高度契合,使得基于存內計算架構的芯片相比于市場已有的AI加速芯片,在計算效率(TOPS/W)方面有數量級上的提升。

智能時代里,從可穿戴到自動駕駛,功耗約束下場景里的計算效率都是永恒的主題,存內計算是解放算力、提升能效比最強有力的武器之一。

資料來源:《先進存算一體芯片設計》、知乎陳巍探芯

2.存算一體芯片適用的行業/場景

(1)小算力場景:邊緣側對成本、功耗、時延、開發難度非常敏感

中早期的存算一體芯片算力較小,從小算力1TOPS開始往上走,解決的是音頻類、健康類及低功耗視覺終端側應用場景,AI落地的芯片性能及功耗問題。

我們預測從邊緣端接入的智能設備的市場體量將快速增長,智能產品覆蓋面積越來越大,產品形態的多樣性將迎來爆發式的增長?梢灶A見,由于傳輸延遲或數據安全考慮,很多數據處理及推理運算將在端側發生。

(2)大算力場景:GPU在算力和能效上都無法同時與專用加速芯片競爭

目前云計算算力市場,GPU的單一架構已經不能適應不同AI計算場景的算法離散化特點,如在圖像、推薦、NLP領域有各自的主流算法架構。隨著存算一體芯片算力不斷提升,使用范圍逐漸擴展到大算力應用領域。針對大算力場景>100TOPS,在無人車、泛機器人、智能駕駛,云計算領域提供高性能大算力和高性價比的產品。存算技術可支持成熟制程下匹配傳統結構+高級節點才能提供的計算能力,節約制造成本,繞過工藝封鎖等問題。自動駕駛要求很高,算力、可靠性、穩定性需要同時達標,需要數年,目前仍有工藝挑戰和迭代,現在也還做不到數據中心的水平。

3.存算一體的其他延伸應用:感存算一體、類腦計算

存算一體作為基礎原理,同樣也衍生了如感存算一體、類腦計算等創新技術方向:

(1)感存算一體:

傳統芯片,需要先利用傳感器芯片收集信息、存儲芯片進行存儲、利用計算芯片來處理數據。感存算一體集傳感、儲存和運算為一體,在存算一體的基礎上增加了傳感,三位合一提高整體效率。在傳感器自身包含的AI存算一體芯片上運算,來實現零延時和超低功耗的智能處理。研究成果來看,包括壓力、光學、氣體三大類;從當前應用方向來看,包括實現更高效的機器視覺和類腦計算。(2)類腦計算:類腦計算又被稱為神經形態計算,是借鑒生物神經系統信息處理模式和結構的計算理論、體系結構、芯片設計以及應用模型與算法的總稱。試圖借鑒人腦的物理結構和工作特點,讓計算機完成特定計算任務,從而高速處理信息,屬于大算力高能效領域。存算一體天然是將存儲和計算結合在一起的技術,天然適合應用在類腦計算領域,并成為類腦計算的關鍵技術基石。

五、產業現狀與未來趨勢

1.存算一體技術當前面臨的挑戰:存算一體技術是一門非常復雜的綜合性創新,產業還算不上成熟,在產業鏈方面仍舊存在上游支撐不足,下游應用不匹配的諸多挑戰,但諸多的挑戰同時也構成了當前存算一體創新未來可構筑的綜合性壁壘。

2.存算一體技術發展趨勢:更高精度、更高算力、更高能效。

3.當前產業面臨的人才及生態問題:(1)作為一個新領域,存算一體芯片復合型人才稀缺,人才更多在學術界。完成存算一體芯片的產品化開發,需同時具備較強的學術原創能力(存算一體的架構和編譯器設計、存算相關的量化算法開發等)及工程實踐能力(場景理解能力、芯片落地能力)。(2)從上游到下游的生態不完整,既是挑戰也是機遇。存算一體芯片的大規模落地需與芯片廠商、軟件工具廠商以及應用集成廠商等產業生態合作伙伴的大力協同研發和推廣應用。需有一套方便、可用的工具鏈和軟件,讓采購方遷移成本低。兼容現有的軟件生態,讓采購方用起來“無感”,如可直接利用現有GPU訓練軟件框架。引導采購方逐步切入專用工具鏈進行模型適配、壓縮等,更好利用存算一體的優勢,逐步建立生態。

六、行業相關企業分析

當前我國存算一體芯片創新企業與海外創新企業屬于齊頭并進階段,共同探索存算一體技術產業化落地及應用場景,在AIoT時代巨大的應用場景下,未來我國存算一體領域有望產生引領世界的創新企業。

國內存算一體芯片企業有:蘋芯科技、后摩智能、知存科技、億鑄科技、智芯科、千芯科技、九天睿芯等創新企業;國外有如Mythic、Syntiant等公司。以下為國內外部分存算一體企業簡介:

附錄:賽道內主要玩家的部分產品進展及性能

       原文標題 : 存算一體:內核架構創新,打破算力能效極限|深度研報

聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

發表評論

0條評論,0人參與

請輸入評論內容...

請輸入評論/評論長度6~500個字

您提交的評論過于頻繁,請輸入驗證碼繼續

暫無評論

暫無評論

光通訊 獵頭職位 更多
文章糾錯
x
*文字標題:
*糾錯內容:
聯系郵箱:
*驗 證 碼:

粵公網安備 44030502002758號

国产视频在