7 月 11 日,英特爾宣布正式面向中國市場推出第二代深度學習加速器——Habana Gaudi2,該產品可用于加速 AI 訓練及推理,合作方名單上包括了浪潮信息、新華三、超聚變等中國的主要服務器廠商。
“在過去六個月,AI 加速芯片因為大模型的關系忽然又再火了一把,接下來我們會有更多的資源投入,利用本土團隊讓這些中國定制版的產品能夠加速落地。”英特爾公司執行副總裁、數據中心與人工智能事業部總經理 Sandra Rivera 對第一財經表示,未來會在合法合規的情況下推出更多針對中國市場的定制產品。
Habana Gaudi 2 作為英特爾 AI 戰略的關鍵產品之一,有望打破目前芯片市場的固有格局。
Habana Labs 成立于 2016 年,主要研發方向為人工智能、深度學習計算等,創業初期就得到了英特爾的投資,而后在 2019 年 12 月以 20 億美元被其正式收購。
根據英特爾官方信息,Habana 的第二代加速器 Gaudi2 主要解決了大規模語言模型、生成式 AI 模型的強算力需求問題。從參數看,該芯片采用臺積電 7nm 工藝制造,集成 24 個可編程的 Tenor 張量核心(TPC)、48MB SRAM 緩存、21 個 10 萬兆內部互連以太網接口(ROCEv2 RDMA)、96GB HBM2E 高帶寬內存(總帶寬 2.4TB/s)、多媒體引擎等,支持 PCIe 4.0 x16,最高功耗 800W。
在性能上,根據機器學習與人工智能開放產業聯盟 MLCommons 在六月底公布的 AI 性能基準測試 MLPerf Training 3.0 結果顯示,Gaudi2 是除了英偉達產品外,唯一能把 MLPerf GPT 3.0 模型跑起來的芯片。
在發布會上,英特爾更是毫不避諱將產品與英偉達的同類產品進行比較,官方展出的 PPT 顯示,Gaudi2 運行 ResNet-50 的每瓦性能約是英偉達 A100 的 2 倍,運行 1760 億參數 BLOOMZ 模型的每瓦性能約達 A100 的 1.6 倍。
“英特爾正在降低人工智能的準入門檻,并強化客戶在云端通過網絡和智能邊緣部署這一關鍵業務技術的能力,從而幫助構建中國人工智能的未來。”Sandra Rivera 表示,雖然是定制版本,但是在性能上沒有打折,網速和國際版相比從 24 個網口變成 21 個網口,但整個性能還是基本一致的。
“在 4 月份的時候,看到了各種人工智能帶來的芯片需求,包括 Gaudi 在內,需求至少翻了兩倍以上。”Sandra 透露,英特爾在 2025 年將會把 Gaudi 的 AI 芯片跟 GPU 路線圖合二為一,推出一個更整合的 GPU 產品,以構造可持續的軟件生態。
伴隨著大模型的火熱,目前全球各大芯片公司都在積極進行 AI 芯片的布局。除了英偉達、英特爾等海外芯片廠商外,初創公司如 Wave Computing、Groq、寒武紀、比特大陸等也加入了競爭的行列,陸續推出了針對 AI 的芯片和硬件系統。
在此前舉行的世界人工智能大會(WAIC)上,包括昆侖芯、登臨、瀚博、天數智芯、燧原、墨芯、沐曦在內的芯片廠商也展示了各自 AI 芯片的能力。據不完全統計,目前與大模型“沾邊”的 AI 芯片廠商已經超過三十家。
在業內人士看來,以 GPU、FPGA、ASIC 為代表的 AI 芯片是目前可規模商用 AI 芯片的主要陣地,這類芯片主要基于傳統芯片架構,對某類特定算法或者場景進行 AI 計算加速。此外,還有偏向于前沿技術的類腦芯片、可重構通用 AI 芯片等,但距離大規模商用還有較長距離。
文章來源:http://www.codekj.com/html/news/xwdt/2023_07/13/3023940.html