| 中心項目”,引業界擔憂 |
近期,一條話題圍繞“7個月涌現140個智算中心項目”的消息在計算圈內不斷流傳,引起行業關注,并引發學者對其潛在的“算力閑置”等擔憂。
在9月24日的中國高性能計算學術年會(HPC China 2024)上,計算領域專家也不約而同地關注到這個問題。《中國科學報》了解到,大家擔憂的問題主要集中于一點:中國智算應該如何健康發展,從而更高效支撐人工智能(AI)應用大潮?
“其實我更擔心的是,一些地方以攀比心態上馬的智算中心項目,能否保障為真實用戶提供優質可靠的智能計算服務?”中國計算機學會(CCF)副理事長、北京并行科技股份有限公司董事長陳健在接受《中國科學報》專訪時說,若只有資源盲目擴張卻不能發揮其應有效能、讓需求端便捷獲取優質算力服務,無疑意味著資源和資金的無謂浪費。
陳健在受訪中。并行科技 供圖
現狀:國內已建和在建智算中心已超250個
《中國科學報》了解到,該消息最早出自IT行業媒體“數智前線”。報道顯示,數智前線通過對中國政府采購網、中國招投標公共服務平臺、天眼查、企查查、尋標寶等渠道的梳理和不完全統計,僅2024年前7個月,圍繞土建基礎設施和IT基礎架構等方方面面的建設內容,智算中心相關項目中標公告已發布超140個。
記者隨即取得了與“數智前線”的聯系,并獲得了其梳理編制的《2024年前7個月智算中心項目》詳細信息。
信息顯示,這140多個項目中,分布于至少23個省市的諸多市、區、縣內,其中尤以安徽、江蘇、北京、山東、浙江等省市出單最多。這些項目的中標金額從數萬元到超億元不等,其中尤以數百萬元、數千萬元的項目居多;超過1億元的項目有25個,占比約18%。有分析認為,智算中心單個項目過億元,或代表著一些單體智算中心建設正在逐漸向更大規模演進。
而據賽迪顧問人工智能與大數據研究中心高級分析師白潤軒提供的數據顯示:截至2024年上半年,國內已經建設和正在建設的智算中心已超過250個。參照當前市場算力服務器價格,一個千卡規模(約須128臺算力服務器)的智算中心僅硬件設備的投資額就達約4億元。
智算中心資源會不會過剩、閑置?
看到上述智算中心建設數量的數字,上海交通大學網絡信息中心副主任林新華不無擔憂地發問:“現有的和許多正在規劃中的智算中心,將會對電網產生多大的壓力?如果未來5年生成式人工智能或大模型不能維持高熱度,這數百億的投資該如何處理?”
顧名思義,智算中心以處理人工智能計算任務為主,目前主要承接人工智能(AI)大模型的訓練和推理任務。一般而言,大模型訓練要求單體算力集群規模越大越好,而推理任務則一般不會有此要求。現階段在生成式AI熱潮之下,市場上呈現出對智能計算(尤其是大規模訓練集群)較高的需求態勢,但能否長期維持這種高需求狀態,市場態度并不完全一致。
另外一件值得探討的事情是,國內已有智算中心的利用率有多高?
“這可能是個謎。”林新華說:“這也許是商業機密,但如果是政府投資,就應該信息公開。”他表示,他所負責的上海交通大學校級計算公共服務平臺“交我算”,在國內高校中第一個踐行開放運維理念,堅持把實時利用率公開到網上,“接受用戶和社會監督”。
“交我算”系統2024年某時段利用率情況。截圖自上海交通大學交我算平臺
關于智算中心是否過剩,在一線從事算力服務工作近20年的陳健認為,應該認真地從供需視角來分析。
“如果市場對智算中心的需求是300、500個,那么現在建設250個,一點都不多;問題是需求量真的有這么大嗎?大家喊的‘缺算力’到底是缺哪一類算力?這需要弄清楚。”陳健從他在一線觀察向《中國科學報》分析說,其實市場上真正稀缺的是單集群規模超2000卡的訓練算力;當然,“萬卡以上集群更加珍稀”。
他言下之意,除了相對稀缺的單體大規模算力集群之外,其他諸如用于AI推理的算力供應相對而言是能滿足需求或夠用的,問題是如何開發好、利用好;投建新的智算中心也要算好“供需賬”,因為一旦算力供過于求,新建乃至一些已建智算中心恐有可能從“全村希望”變成“閑棋冷子”。
建好、用好都有挑戰,人才是關鍵
事實上,要建好一個智算集群并非易事。中國工程院資深院士倪光南指出,智算集群不是簡單的軟硬件的堆砌,它是一個復雜工程系統,要求“3+1”算力體系(即算、存、運和服務)的緊密協同。
“就好比構建一個足球冠軍團隊,不僅需要有各個優秀球員,還需要球員之間的協同和配合以達到最高效能。”倪光南說,也正是基于復雜工程系統思維,智算集群在算力規模、算力利用率、集群可靠性等關鍵指標上,可以持續“挑戰”和“對抗”源于單模塊、單機、單系統的各種物理極限和失效問題。
但是復雜系統有其脆弱性。陳健告訴記者,智算集群和超算類似,本質上都是并行計算程序,其特點是所有計算單元要同步運行,如果其中一個計算節點或通信模塊出現故障,整個程序就會失靈,訓練任務就中斷了。
“這就要求在系統搭建之初不能有任何軟件或技術上的問題。換句話說,必須把每一件事都做到極致,才有可能做到盡可能高的系統穩定性。”陳健說。
林新華告訴《中國科學報》,字節跳動和DeepSeek近期都發表了介紹關于萬卡GPU集群如何建設與運維的論文,就主要從性能優化和可靠性兩方面展開。
“如果沒有解決甚至沒有意識到這些問題,那么這些智算中心中的一部分很有可能是在非常低效運轉。”林新華說,而且規模越大,問題越多:“我相信在實際運維和管理中遇到的問題會遠比字節跳動論文中指出的要多得多。”
這些技術細節決定了,算力集群的建設、運維和應用等環節,都非常依賴專業運維和技術隊伍。然而,熱火朝天部署智算中心的另一面,恰是專業人才的短缺。
“如果數字準確的話,國內已建和在建的智算中心超250座,但我不認為國內有250支專業的隊伍來維護它們。”陳健直言不諱。在他看來,全國范圍內能稱得上頂尖的一站式計算服務團隊的數量,“兩只手數得過來”。
林新華也提出,算力服務器等軟硬件可以“說買就買”,但好的技術人員不是能馬上就批量培養出來的,“這么多智算中心,真的都能找到那么多專業的算力技術人員嗎?”
記者了解到,國外的智算中心更偏向于公有云部署或在已有超算中心建設AI算力提供服務,因為有現成的專業運維團隊和技術人員保障。比如美國國家科學基金會就在德州大學高級計算中心的基礎上,建設了相應的智算集群。
建議:讓有形的手和無形的手共同作用
“無論是質疑超建還是擔憂水平,大家本質關心的,是一個面向需求、如何最優匹配供給的問題。”陳健對《中國科學報》表示,厘清這一點至關重要。
與水電不同,算力并不均質化,各行各業所需的算力模式亦不盡相同,各類用戶會根據其需求尋找市場上最匹配的算力。“如果市場上有當然好,沒有,那就新建。”陳健說,其實新建算力中心并不可怕,關鍵要看是不是有“真金白銀的需求”。
陳健認為,面對需求,寄望于國家沿用“計劃經濟”方式、統籌各地方建設規劃的做法,顯然已經過時且難度極大,極有可能由于規劃周期太長造成“建完發現需求變了”的尷尬。他建議,國家可適度調控政策這只“有形的手”,讓市場這只“無形的手”發揮作用。
“比如,地方上如果有建設智算中心的計劃,初期可以通過調研粗略估計需求規模,之后可以根據需求變化來決定是否繼續‘加碼’和決定‘加碼’力度的大小,需求增長快就多加、增長慢就不加或少加。”他說,這種“動態持續增長式建設”方法,并行科技已有具體實踐,OpenAI訓練GPT系列大模型的算力規模也是慢慢加上去的,事實證明,隨著需求變化來調整算力資源建設規模“基本上不會出大問題”。
另外,陳健也想到,從頂層設計的角度,政策上還可以考慮從補貼需求側入手、驅動供給側以自我進化的方式打造智算產業。例如,國家政策層面可以要求地方政府拿出規劃智算中心建設所需財政支出的30%或50%(非指定具體數字,僅為參考),貼補給大模型企業等需求方,監督他們在市場上自由購買算力服務。他認為,市場會“用腳投票”遴選出有競爭力的算力供給者,優勝劣汰,讓“盲目上馬智算中心”沒有生存土壤。
“但這樣做的話,其中也會涉及許多具體問題,比如如何做到公平分配、相關決策要做到合理合法合規等。”陳健說,如何破題,對于還處在智能時代初期的我們,未來還需要更多的研究和探索。
化學是一門研究物質組成、結構、性質與變化規律的學科,其發展史是人類突破自然表象、揭示物質本質的歷史。從古代煉金術士對“點石成金”的癡迷,到現代科學家操控原子合成新物質,在好奇心的驅動下,人類正不斷向著......
一、文件制訂背景近年來,黨中央、國務院高度重視人工智能發展,2025年8月國務院印發《關于深入實施“人工智能+”行動的意見》(國發〔2025〕11號),要求探索推廣人人可享的高水平居民健康助手,有序推......
國家衛生健康委辦公廳、國家發展改革委辦公廳等五部門發布關于促進和規范“人工智能+醫療衛生”應用發展的實施意見通知。國衛辦規劃發〔2025〕30號各省、自治區、直轄市及新疆生產建設兵團衛生健康委、發展改......
10月31日,中國科學院第四屆職工技能大賽人工智能領域比賽決賽在中國科學院自動化研究所成功舉辦。院直屬機關黨委常務副書記、院工會主席房自正,院直屬機關黨委副書記、院工會常務副主席楊旭,自動化研究所所長......
工業和信息化部黨組書記、部長李樂成在《黨建》雜志發表署名文章《加快推進人工智能賦能新型工業化》。文章指出,“面對新一代人工智能技術快速演進的新形勢,要充分發揮新型舉國體制優勢,堅持自立自強,突出應用導......
2025年世界科技與發展論壇雖已落下帷幕,“人工智能促進科技與發展”的主題仍在全球科技界激蕩回響。在業界看來,這場論壇不僅展現了中國智造的技術硬實力,更清晰傳遞出一個核心信號:“開放合作”的包容姿態與......
近日,由中國科學技術協會主辦的2025年世界科技與發展論壇在北京舉行。作為中國科協“開放合作月”重要活動之一,本屆論壇以“人工智能促進科技與發展”為主題,圍繞人工智能與未來產業、開放科學與全球合作等四......
近日,記者從清華大學丘成桐數學科學中心獲悉,該中心副教授周源與清華大學智能產業研究院、電子工程系副教授馬劍竹合作,提出了一個可從觀測數據中自動推導出空間物理規律的神經符號模型——PhyE2E(Phys......
關于發布新一代人工智能國家科技重大專項2025年度第一批項目申報指南的通知各有關單位:為加快實施新一代人工智能國家科技重大專項(以下簡稱“重大專項”),根據重大專項階段性實施計劃部署,現將2025年度......
近日,一項公布于預印本平臺arXiv的研究發現,人工智能(AI)模型的諂媚程度比人類高50%。該研究測試了11個廣泛使用的大型語言模型對1.15多萬個咨詢請求的響應情況,其中不乏涉及不當行為或有害行為......