AI芯片的戰役正愈演愈烈。
7月11日,英特爾(33.98, 0.68, 2.04%)面向中國市場推出了AI芯片Habana Gaudi 2,Gaudi 2直接對標英偉達GPU的100系列,欲爭奪AI算力市場的寶座。
眾所周知,目前GPU資源緊缺,英偉達的100系列在國內禁售,而百模大戰之下算力的需求還在飆升。對于中國市場而言,當前急需AI芯片“解渴”,對于英特爾而言,眼下正值算力緊缺的窗口期,也是進攻的絕佳時機。
英特爾也強調,Gaudi 2芯片是專為訓練大語言模型而構建,采用7納米制程,有24個張量處理器核心。事實上,去年英特爾就已經在海外發布了Gaudi 2,此次在中國推出的是“中國特供版”。
由于各國的出口管制限制,外界首要關心的是AI芯片在中國市場的供應可持續性。對此,英特爾公司執行副總裁、數據中心與人工智能事業部總經理Sandra Rivera在接受21世紀經濟報道記者采訪時做出了肯定的回答。
Sandra Rivera說道:“這張卡也是中國定制版的產品,對于出口或者是支持中國的客戶是沒有任何問題的。英特爾肯定是合法合規地在中國繼續支持我們的客戶,不管是Gaudi 2或者是未來的Gaudi 3,我們一定是在合法合規的情況下做出一些中國定制的產品,以滿足中國的客戶的需求。”
同時,芯片的性能并沒有打折,她表示:“在網絡速度上,(中國版)和國際版相比,是從24個網口變成21個網口,但是整體性能還是基本一致的。”
隨著大模型的日新月異,英特爾在近幾個月內圍繞著Gaudi2繼續進行優化。
Sandra Rivera介紹道,在性能上,根據機器學習與人工智能開放產業聯盟MLCommons在6月底公布的AI性能基準測試MLPerf Training 3.0結果顯示,Gaudi 2是除了英偉達產品外,唯一能把MLPerf GPT 3.0模型跑起來的芯片。
在發布會現場,英特爾也直接將Gaudi2和英偉達的A100進行比較,其野心可見一斑。根據英特爾公布的數據,從計算機視覺模型訓練到1760億參數的BLOOMZ推理,Gaudi 2每瓦性能約A100的2倍,模型訓練和部署的功耗降低約一半。
同時,英特爾高管還介紹道,目前相比A100,Gaudi 2價格更有競爭力,且性能更高。接下來到9月,采用FP8軟件的Gaudi 2預計能夠提供比H100更高的性價比。
整體而言,除了芯片,在此次發布會上,英特爾展示了一系列支持大模型的算力解決體系,接下來具體的落地應用和產品迭代狀況也受到關注。
一方面,目前在中國市場上,英特爾已經和浪潮信息、新華三、超聚變等國內主要的服務器廠商合作,其中,浪潮信息的NF5698G7是專為面向生成式AI市場的新款AI服務器,支持8顆OAM高速互聯的Gaudi2加速器,而在終端客戶方面,Sandra Rivera表示:“中國市場對人工智能解決方案的需求非常強勁,我們正在與幾乎所有傳統客戶洽談。我們的云服務提供商、通信服務提供商都是企業客戶,因此對人工智能解決方案有著強烈的需求。”
另一方面,在產品路線上,英特爾近年一直強調XPU,即多樣化、多組合的異構計算。在AI相關的產品線上,既有集成AI加速器的CPU處理器、有GPU產品,以及Habana Gaudi系列代表的ASIC類型AI芯片。
Habana Labs成立于2016年,主要研發方向為人工智能、深度學習計算等,創業初期就得到了英特爾的投資,而后在2019年12月以20億美元被其正式收購。
對于GPU和AI芯片的組合,Sandra Rivera透露:“Gaudi是一個人工智能加速的專屬產品,在英特爾產品里,如果是針對大模型這個工作負載,它是性能最佳、最優的一個產品。明年我們還會有下一代產品Gaudi 3發布。在2025年的時候,我們會把Gaudi的AI芯片跟GPU路線圖合二為一,推出一個更整合的GPU的產品。”
大模型的火熱還在持續拉動AI芯片的需求。
Sandra Rivera告訴21世紀經濟報道記者:“在4月份回顧一季度的情況時,我們看到了各種人工智能帶來的芯片需求,包括Gaudi在內,需求至少翻了兩倍以上。”
TrendForce集邦咨詢向21世紀經濟報道記者提供的數據顯示,目前主要由搭載NVIDIA A100、H100、AMD(114.58, 3.26, 2.93%) MI300,以及大型CSP業者如Google、AWS等自主研發ASIC的AI服務器成長需求較為強勁,2023年AI服務器出貨量(包含搭載GPU、FPGA、ASIC等)出貨量預估近120萬臺,年增率近38%,AI芯片出貨量同步看漲,可望成長突破五成。
芯片廠商們也在AI領域開足馬力。英偉達不必多言,當前不論是100系列還是800系列,都十分緊缺,在AI芯片市場上占據先發優勢;在6月中旬,AMD推出了新一代AI芯片、數據中心CPU以及DPU,其中AI芯片Instinct MI 300X,直接對標英偉達H100;此外,谷歌(119.62, 1.91, 1.62%)、亞馬遜(130.8, 2.02, 1.57%)、百度(148.83, 5.50, 3.84%)等大廠也都在自研AI芯片,在算力市場上的競爭維度更加豐富。
而除了硬件之外,軟件也同樣關鍵。比如,目前大部分AI芯片都繞不開英偉達的CUDA平臺,CUDA建立了一套軟硬件間的開發標準。如何從CUDA遷移、如何建立自己的優勢生態都是挑戰者的重要課題。
對于軟件生態的競爭,Sandra Rivera表示:“軟件開發或者是開發者生態,其實是英特爾多年的一個強項,在整個數據中心領域的軟件生態中,一個是x86的軟件生態,另外一個是CUDA。而且我們注意到,隨著越來越多的公司希望使用人工智能,軟件生態系統也正在加速挖掘更多硬件潛能,以大幅提高生產力。”
她進一步談道:“英特爾希望能在多種語言環境中,能夠提供更簡便的應用。通過軟件、庫和工具提供一種模塊化的方法,來優化并加速跨多種架構的異構負載。當然在人工智能或者是AI運算的時候,確實很多人在用CUDA,但是大部分開發者不會做那么底層的開發,他們是在一個比較高的框架,比如說在PyTorch、TensorFlow上面去創新。”
Habana Labs首席運營官Eitan Medina進一步向21世紀經濟報道記者指出:“在Gaudi2之前,我們已經有一代產品,在軟件上也做了好幾年的積累,底層的軟件庫都已經開發好了,我們希望讓開發者能夠在最上層的20%的比例能夠做他的開發,這里的開發和CUDA并沒有那么直接的關聯。”
Gaudi系列作為英特爾AI的一艘旗艦,外界也拭目以待Gaudi 2在實際應用中的性能表現、算力實力。從硬件迭代到軟件生態,AI芯片的競爭故事還將繼續。
近日,中國科學院院士、西安電子科技大學教授郝躍團隊打破了20年的半導體材料技術瓶頸,讓芯片散熱效率與綜合性能得到了飛躍性提升,為解決各類半導體材料高質量集成提供了可復制的中國范式。相關成果已發表在《自......
2026年1月12日,全球市值最高的科技巨頭英偉達(NVIDIA)與全球制藥龍頭禮來(EliLilly)在摩根大通醫療健康大會(JPM26)上宣布,將在五年內共同投資10億美元建立AI聯合創新實驗室,......
美國政府23日宣布,將在2027年對中國芯片加征關稅,結束了上屆拜登政府發起的針對中國芯片的貿易調查。美媒分析稱,盡管美國政府稱中國在芯片產業中的做法“損害美國利益”,但最終決定至少在18個月內不對中......
據路透社報道,多位知情人士透露,英偉達已告知中國客戶,計劃于明年2月中旬,即中國農歷春節前向中國客戶交付其性能排名第二的人工智能(AI)芯片H200。其中兩位消息人士稱,英偉達計劃動用庫存履行首批訂單......
據路透社報道,多位知情人士透露,英偉達已告知中國客戶,計劃于明年2月中旬,即中國農歷春節前向中國客戶交付其性能排名第二的人工智能(AI)芯片H200。其中兩位消息人士稱,英偉達計劃動用庫存履行首批訂單......
中國光計算芯片領域取得重大突破。據最新消息,上海交通大學科研人員近日在新一代光計算芯片領域取得重大突破,首次實現支持大規模語義媒體生成模型的全光計算芯片LightGen,相關成果12月19日發表于《科......
據路透社、彭博社等媒體報道,美國總統特朗普當地時間8日在社交媒體上發文宣布,美國政府將允許英偉達向中國出售其H200人工智能芯片,但對每顆芯片收取一定費用。《紐約時報》稱,H200芯片為英偉達“性能第......
據路透社、彭博社等媒體報道,美國總統特朗普當地時間8日在社交媒體上發文宣布,美國政府將允許英偉達向中國出售其H200人工智能芯片,但對每顆芯片收取一定費用。《紐約時報》稱,H200芯片為英偉達“性能第......
低壓差線性穩壓器(LDO)是芯片內部的“穩壓心臟”,可為不同功能模塊提供干凈、穩定的電源。韓國蔚山科學技術院的研究團隊研發出一種超小型混合LDO,有望顯著提升先進半導體器件的電源管理效率。它不僅能更穩......
隨著芯片制造商不斷縮小其產品的尺寸,他們正面臨將大量計算能力塞進一塊芯片的極限。一款打破紀錄的芯片巧妙地避開了這個問題,這可能會促使電子設備的制造更加可持續。自20世紀60年代以來,要讓電子產品性能更......