-
馬斯克搶先一步后,國產(chǎn)大模型紛紛發(fā)力十萬卡集群
-
張廣凱13764468101
國內(nèi)大模型企業(yè)的十萬卡時(shí)代,真的要來了嗎?
9月25日,百度發(fā)布了全面升級(jí)的百舸AI異構(gòu)計(jì)算平臺(tái)4.0,百度智能云事業(yè)群總裁沈抖直言,百舸4.0就是部署十萬卡大規(guī)模集群而設(shè)計(jì)的。
百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖觀察者網(wǎng)
而就在幾天前,阿里云宣布其靈駿單網(wǎng)絡(luò)集群已拓展至10萬卡級(jí)別。此前,騰訊也發(fā)布了支持十萬卡集群的星脈網(wǎng)絡(luò)2.0。
一度還停留在設(shè)想層面的十萬卡集群,突然成為輿論焦點(diǎn)是在9月初。馬斯克突然宣布在短短122天內(nèi)建成10萬張英偉達(dá)H100顯卡的Colossus集群,意味著其算力可能已經(jīng)超過OpenAI。
由顯卡規(guī)模撐起的算力水平,是決定大模型性能的最重要指標(biāo)之一。一般認(rèn)為,1萬枚英偉達(dá)A100芯片,是做好AI大模型的算力門檻。
建一個(gè)萬卡集群,單是GPU的采購成本就高達(dá)幾十億,因此國內(nèi)能夠部署萬卡規(guī)模集群的,原本就只有阿里、百度等寥寥幾家大廠。而想要部署十萬卡集群,其“燒錢”程度可想而知。
除了資金成本,十萬卡集群同樣面臨巨大的技術(shù)挑戰(zhàn)。沈抖指出,GPU是一種很敏感的硬件,連一天之內(nèi)氣溫的波動(dòng),都會(huì)影響到GPU的故障率,而且規(guī)模越大,出故障的概率就越高?!癕eta訓(xùn)練llama3的時(shí)候,用了1.6萬張GPU卡的集群,平均每3小時(shí)就會(huì)出一次故障。”
此外,區(qū)別于傳統(tǒng)CPU集群的串行特點(diǎn),大模型訓(xùn)練過程需要全部顯卡同時(shí)參與并行計(jì)算,對(duì)網(wǎng)絡(luò)傳輸能力也提出了更大的挑戰(zhàn)。
相比于美國同行,中國大模型企業(yè)還面臨一重特殊的困難,無法像馬斯克那樣全部采用英偉達(dá)方案,而是需要使用包括國產(chǎn)GPU在內(nèi)的異構(gòu)芯片。這也意味著,即使同樣十萬張顯卡,國內(nèi)企業(yè)在算力規(guī)模上也很難同美國企業(yè)匹敵。
在上述三重挑戰(zhàn)之下,國內(nèi)大模型企業(yè)的進(jìn)步速度也有目共睹。
據(jù)沈抖介紹,百舸4.0在萬卡集群上實(shí)現(xiàn)了有效訓(xùn)練時(shí)長(zhǎng)占比99.5%以上,業(yè)界領(lǐng)先,并通過在集群設(shè)計(jì)、任務(wù)調(diào)度、并行策略、顯存優(yōu)化等一系列創(chuàng)新,大幅提升了集群的模型訓(xùn)練效率,整體性能相比業(yè)界平均水平提升高達(dá)30%。
而阿里云CTO周靖人此前也透露,目前阿里云的萬卡算力集群可以實(shí)現(xiàn)大于99%以上連續(xù)訓(xùn)練有效時(shí)長(zhǎng),模型算力利用率可提升20%以上。
但隨著性能提升,大模型成本問題只會(huì)越來越引人注目。單從能耗來看,沈抖透露,十萬卡集群每天就要消耗大約300萬千瓦時(shí)的電力,相當(dāng)于北京市東城區(qū)一天的居民用電量。
一位開發(fā)者向觀察者網(wǎng)直言,盡管在過去一年中大模型廠商的降價(jià)幅度確實(shí)可觀,但這更多是平臺(tái)補(bǔ)貼開發(fā)者的結(jié)果,并非根本解決之道。
對(duì)此,阿里云方面強(qiáng)調(diào),AI發(fā)展仍然處在一個(gè)非常早期的階段,必須要靠降價(jià)帶動(dòng)應(yīng)用爆發(fā),而阿里云搞AI大基建,并不會(huì)只算眼前賬。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
|舉報(bào)-
違反法律法規(guī) -
垃圾信息、廣告 -
色情、淫穢信息 -
人身攻擊 -
謠言、不實(shí)信息 -
冒充,冒用信息 -
破壞社區(qū)秩序 -
其他 -
涉未成年人有害信息
標(biāo)簽 大模型- 責(zé)任編輯: 張廣凱 
-
-
小米要求印度撤回反壟斷報(bào)告:包含商業(yè)機(jī)密
2024-09-25 15:33 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
上證指數(shù)收復(fù)2900點(diǎn)
2024-09-25 13:15 觀網(wǎng)財(cái)經(jīng)-金融 -
三星18億美元投資越南,加工OLED面板模組
2024-09-25 12:06 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
-
在美中概股昨夜集體大漲,華爾街稱漲勢(shì)將持續(xù)
2024-09-25 11:20 觀網(wǎng)財(cái)經(jīng)-金融 -
讀懂央行新政:為居民減負(fù)才是精準(zhǔn)藥方
2024-09-25 08:52 觀網(wǎng)財(cái)經(jīng)-宏觀 -
離岸人民幣兌美元收復(fù)7.0關(guān)口
2024-09-25 08:15 觀網(wǎng)財(cái)經(jīng)-海外 -
金融資產(chǎn)投資公司股權(quán)投資試點(diǎn)范圍擴(kuò)大至18個(gè)城市
2024-09-24 21:25 金融觀察 -
證監(jiān)會(huì)發(fā)布《關(guān)于深化上市公司并購重組市場(chǎng)改革的意見》
2024-09-24 20:30 政策風(fēng)向標(biāo) -
中國糧食75年增產(chǎn)5倍,海外友人:中國大米比日本和泰國米更好吃
2024-09-24 20:10 -
-
“純血鴻蒙”即將公測(cè),鴻蒙PC可能也快來了
2024-09-24 18:22 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
3年超越西方30年?
2024-09-24 17:35 觀察者頭條 -
商務(wù)部:對(duì)美國PVH集團(tuán)啟動(dòng)不可靠實(shí)體清單調(diào)查
2024-09-24 16:30 -
專家解讀:房?jī)r(jià)觸底、緩解提前償債壓力、刺激內(nèi)需、對(duì)沖通縮
2024-09-24 16:19 -
滬指創(chuàng)4年多最大單日漲幅,兩市成交額超9700億
2024-09-24 15:34 -
印度電信巨頭簽36億美元大單,提升4G覆蓋、引入5G
2024-09-24 14:22 觀網(wǎng)財(cái)經(jīng)-海外 -
大促免傭、店播免傭、解綁運(yùn)費(fèi)險(xiǎn)!今年雙11淘寶商家獲“大紅包”!
2024-09-24 13:50 雙11節(jié)
相關(guān)推薦 -
-
硬搬新加坡組屋抹黑中國,美使館大翻車 評(píng)論 49“美國和剛果(金)這么談,會(huì)觸怒中國” 評(píng)論 171馬斯克:中國發(fā)電量就像火箭升空,美國卻躺平了… 評(píng)論 127“特朗普將‘抵制’南非主辦的G20峰會(huì)” 評(píng)論 184日本這回要對(duì)美國咬緊牙關(guān)不松口了 評(píng)論 123最新聞 Hot
-
硬搬新加坡組屋抹黑中國,美使館大翻車
-
“九成來自中國”,歐盟也要?jiǎng)邮?/a>
-
“美國和剛果(金)這么談,會(huì)觸怒中國”
-
馬斯克:中國發(fā)電量就像火箭升空,美國卻躺平了…
-
黃仁勛:他們希望我們永遠(yuǎn)不要回中國
-
“美式腐敗,可比特朗普更早”
-
“沒有中國,我們真造不出來”
-
報(bào)告:韓國制造業(yè)GDP高度依賴美中等海外市場(chǎng)需求
-
“大民”悼念“云芳”
-
C919航線已覆蓋中國16城,“海外都在盯著”
-
印媒還在“贏贏贏”,《紐約時(shí)報(bào)》忍不住了
-
“美國情報(bào)顯示以色列計(jì)劃襲擊伊朗核設(shè)施”
-
突發(fā)!巴基斯坦一校車爆炸,4死38傷
-
特朗普:教皇的兄弟是MAGA大粉
-
退群,匈牙利國會(huì)批準(zhǔn)了
-
海軍第三艘“大白船”亮相,加裝PCR實(shí)驗(yàn)室
-