剛剛結束的COMPUTEX電腦展上,英偉達CEO黃仁勛笑著對聽眾說,“你(芯片)買得越多,賺得越多。”引來一陣笑聲。
這句話的背景是,全球科技廠商在AI熱潮下繼續重金投入建設數據中心或算力中心。黃仁勛在演示文檔上寫著,英偉達正在驅動全球萬億美元級別的企業AI IT投資。
數據中心建設熱潮下,現在看來,AI算力需求的變化與年初一些業內人士預計的不太一樣。DeepSeek對訓練算力資源的節約,并未讓整體算力需求減少。
不過,還有一個變化發生了,隨著DeepSeek推動AI走向應用,用于推理的AI芯片占比正在升高。
市場研究機構IDC中國副總裁周震剛告訴第一財經記者,2024年中國數據中心加速卡中已有半數以上是推理卡,DeepSeek出現后,今年推理芯片占比預計還會增加。
這種芯片結構變化,可能會對AI芯片市場造成深遠影響,特別是在中國市場。推理環節對AI芯片性能等的要求較低,國產AI芯片也可以使用,在英偉達出口受到限制的情況下,可能促成國內AI芯片的組成發生變化。
周震剛透露,去年國內數據中心加速卡市場中,國產算力占比大約三成,預計今年上半年占比應該會超四成。
第一財經記者了解到,這波數據中心或算力中心建設潮中,需求方來自高校、企業等,AI應用十分多元。而面向算力需求的變化,已有算力中心在計劃調整芯片,使芯片組成更加多元、向模型推理傾斜。
算力需求來自哪里
數據中心或算力中心建設還在進行。IDC數據顯示,中國加速計算服務器市場出貨量2024年同比增長97.3%,預計2025年增長52.9%。
在中國招標投標公共服務平臺,第一財經記者以智算中心為關鍵詞搜索中標信息發現,截至今年5月26日,今年國內智算中心中標信息123條,是去年前5個月的2.2倍。這些信息圍繞智算服務器設備采購、運維服務、電力模塊采購、勘探、基建供配電工程施工等。
從中標信息數量看,國內智算中心建設提速是持續的過程。2023年國內智算中心中標信息53條,2024年猛增至213條。2024年上半年中標信息71條,下半年增加至142條,顯示當年建設項目也在增多。
記者了解到,一些企業和高校有了更多算力需求,部分高校自購算力卡,部分購買云算力或超算中心算力。
香港科技大學馮諾依曼研究院院長賈佳亞告訴第一財經記者,學校此前購買了一批英偉達H800計算卡,香港只有香港科技大學有相對較多的H800,這是能將該研究院做成較大規模的背景。即便如此,有算力提供方告訴記者,該校在訓練大模型,需求比較大,自己的算力不夠,也需要其他算力來源。
近日華東理工大學則與騰訊云合作,推動AI與學科融合及科學研究降本增效等。該校副校長王慧鋒告訴記者,高校科研對AI算力的需求增長是必然,該校也在探索AI 科學研究,例如有化學老師將AI算法用于鋰電池催化設計,并將設計理念提煉出來做成智能體知識庫,用于實踐教學。目前學校采用混合云架構,部分算力本地化部署,另有大量計算放到云上,上云而不是完全自建機房的做法成本更優。王慧鋒告訴記者,考慮到需求和數據安全等,目前高校采用私有和混合架構的模式是主流。
去年12月,香港規模最大的數碼港人工智能超算中心投入服務,香港為申請使用者提供資助。記者了解到,申請使用該超算中心首階段算力的主體就包括大學和科研機構。
數碼港行政總裁鄭松巖告訴記者,該超算中心目前有1300PFLOPS算力,第二階段規劃算力是1700PFLOPS,今年10月該超算中心算力將提升到3000PFLOPS。目前已審批通過10個申請,這些申請來自大學、科研機構、企業,用途包括學術研究、生物醫療、材料分析、大模型應用等,到本月底,第一階段的算力使用率將超95%,預計接下來的申請會越來越多。
“一些大學在做教學相關項目,一些在研究可商業化的項目。有的大學在研究生物科學相關領域,也需要比較大的算力。目前不少大學是以開發項目為主來申請,個別大學會捆綁幾個小項目一起申請,讓學生做一些研究。現在有算力基本是先到先得。” 鄭松巖表示。
企業也需要算力。鄭松巖告訴記者,企業應用處于剛開始嘗試的階段,可以感受到很多企業還沒有下很大決心要完成整個機構的轉型,或為此擬定非常嚴格的時間節點。“前段時間處于一種想用AI,但很多企業還沒啟動的階段。很多企業都想用AI來提高效率、降低成本,但AI要直接嵌入企業日常流程中,企業實際上缺乏相應人才配套。”鄭松巖表示,香港的人工智能應用爆發期還沒到來,隨著業界對AI越來越熟悉,接下來預計應用會越來越多。
算力向推理傾斜
DeepSeek帶來的算力需求增長,是大模型推理對大模型訓練的一場“勝利”。過去兩年,大模型業界最受關注的一直是訓練環節。但開源且性能出眾的DeepSeek-R1面世后,更多人開始真正將大模型用起來,促使推理需求增長。
這讓一些適合推理的芯片用了起來。周震剛向記者表示,去年國內互聯網公司、電信運營商采購了大量國產算力卡,但去年采購方發現,國產算力資源不是很好出售。而隨著今年上半年DeepSeek應用推開,尤其是國產算力適配DeepSeek后,此前它們采購的國產算力在今年第一季度已經被DeepSeek占有了。目前電信運營商已在建設新的大規模算力中心,包括基于國產算力的萬卡集群。
騰訊是國內最早接入DeepSeek的互聯網廠商之一。該公司在5月的業績交流會上釋放過推理需求增長的信號。
騰訊管理層表示,騰訊有足夠的高端芯片來繼續訓練模型,公司看到對GPU更大的需求是在推理側。用戶推理需求逐漸增長,推理token(詞元)的需求比之前預計的更多,AI需求已經超過了GPU資源(所能提供的算力)。
周震剛也發現,DeepSeek出現確實讓算力需求改變了,主要是改變了算力需求的結構。他告訴記者,2024年,中國數據中心加速卡有57.6%是推理卡,33%是訓練卡。而在DeepSeek出現后,一些小型公司的算力從訓練轉到推理。騰訊、百度這類平臺接入DeepSeek也大大推動了推理芯片的增長,因此預計2025年推理芯片占比還會進一步大幅增加。
鄭松巖告訴記者,數碼港的人工智能超算中心也在考慮改變算力組成。
“一開始我們主要面向模型訓練需求,包括很多大學那時候要做模型訓練,但實際上,近一年來模型變化很大。” 鄭松巖告訴記者,此前很多機構在做基礎大語言模型,但在DeepSeek出來后放棄了這一路線,轉向使用DeepSeek等基礎大模型,“我們認為未來做基礎大模型的團隊會逐漸減少,轉向以推理為主,人工智能超算中心的第二階段正在建構中,接下來做安裝、配置、設計時會更多考慮這部分需求。”
鄭松巖告訴記者,推理環節對芯片算力的要求相對沒那么大,因此,算力不及英偉達H100、H800的芯片都有可能引進。
芯片組成變了
推理需求增長讓國產算力站上競技的舞臺了。
周震剛告訴記者,2022年和2023年,英偉達占中國數據中心加速卡市場的85%~90%,國產算力沒有太大空間,但在美國政策、國內市場變化等因素影響下,國產算力占比已有大幅提升。
具體而言,2024年中國數據中心加速卡市場中,有65.2%是英偉達,34.6%是國產算力。“我們現在看到,今年上半年國產算力占比應該會超四成,很可能在很短的時間內,國產算力會成為主流,占比超50%。這個比例在兩年前是無法想象的。”周震剛表示。
在大模型算力需求以訓練為主的時候,之所以國產芯片還難以挑戰英偉達的地位,既有英偉達芯片算力高、生態好、集群大等原因,也有訓練難以兼容異構芯片的原因。周震剛向記者解釋,訓練時難以同時用英偉達 國產芯片組成的資源池,只能將訓練分成兩部分,一部分用英偉達卡,一部分用國產卡,但這種訓練的效率較低,因此大部分訓練現在仍跑在英偉達卡上,只有少數AI廠商基于國產卡算力平臺,更多廠商還是在用國產芯片做測試性工作,作為備用方案。但推理可以跑在國產芯片上,“可以根據需求,把面向某個應用的推理或面向某個區域用戶的推理放到國產芯片上,可以這么分解。”
“過去別人會問(國產芯片廠商),你跟英偉達H100相比優勢在哪里、性價比如何、生態能否兼容?現在這些問題已經沒有太大影響了。”有業界分析人士向記者形容,云廠商或AI廠商現在需要英偉達之外的更多國產芯片方案。除了華為與運營商合作,其他國內芯片廠商也基本都有芯片出來了,云廠商也在推進自研。周震剛表示,今年一季度需求火熱的DeepSeek一體機中,英偉達芯片占比還是較大,但已有不少基于寒武紀、沐曦等國產芯片。
需求也反映在國產AI芯片廠商業績上。此前陷于虧損的寒武紀,2024年第四季度開始盈利。今年第一季度,寒武紀營收11.11億元,接近去年全年營收,凈利潤3.55億元,實現同比扭虧。
還有算力中心正在考慮國產芯片方案,鄭松巖告訴記者,推理不需要用到太“高級”的芯片。數碼港有一個人工智能實驗室,正在測試不同的芯片,除了英偉達,還測試國產的華為、沐曦、壁仞、昆侖芯等。同時,實驗室也在測試異構算力調度平臺,希望能通過一個平臺統一調度不同芯片算力。
騰訊高管則在5月的業績交流會上表示,公司會同時看進口芯片和國內市面上可用的芯片,在某些情況下,其中一些芯片能做較小模型的推理。
作為AI芯片巨頭,英偉達近期感到緊張不是沒有道理的。今年4月,英偉達公告稱,美國政府已告知,對于H20芯片及達到H20內存帶寬等的其他芯片,若出口至中國等國家和地區需獲得許可證。H20是英偉達針對中國市場推出的“特供”版本。
黃仁勛近日表態稱,這種人工智能芯片出口管制是失敗的,“事實證明,最初制定人工智能擴散規則的那些基本假設存在根本性缺陷”。他表示,英偉達在中國市場的份額已從美國前總統拜登執政初期的95%降至目前的50%。中國人工智能市場規模可能在未來兩到三年內達到約500億美元,對一家美國公司來說,無法進入這一市場將是巨大的損失。
英偉達還在嘗試應對中國市場上的競爭。近日有消息稱,英偉達擬新推出一款面向中國市場的AI芯片,采用最新的Blackwell架構,定價低于H20,最早于今年6月量產,英偉達官方尚未證實該消息。
鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時間聯系我們修改或刪除,多謝。