-
馬斯克搶先一步后,國產(chǎn)大模型紛紛發(fā)力十萬卡集群
-
張廣凱13764468101
國內(nèi)大模型企業(yè)的十萬卡時代,真的要來了嗎?
9月25日,百度發(fā)布了全面升級的百舸AI異構(gòu)計算平臺4.0,百度智能云事業(yè)群總裁沈抖直言,百舸4.0就是部署十萬卡大規(guī)模集群而設(shè)計的。
百度集團(tuán)執(zhí)行副總裁、百度智能云事業(yè)群總裁沈抖觀察者網(wǎng)
而就在幾天前,阿里云宣布其靈駿單網(wǎng)絡(luò)集群已拓展至10萬卡級別。此前,騰訊也發(fā)布了支持十萬卡集群的星脈網(wǎng)絡(luò)2.0。
一度還停留在設(shè)想層面的十萬卡集群,突然成為輿論焦點(diǎn)是在9月初。馬斯克突然宣布在短短122天內(nèi)建成10萬張英偉達(dá)H100顯卡的Colossus集群,意味著其算力可能已經(jīng)超過OpenAI。
由顯卡規(guī)模撐起的算力水平,是決定大模型性能的最重要指標(biāo)之一。一般認(rèn)為,1萬枚英偉達(dá)A100芯片,是做好AI大模型的算力門檻。
建一個萬卡集群,單是GPU的采購成本就高達(dá)幾十億,因此國內(nèi)能夠部署萬卡規(guī)模集群的,原本就只有阿里、百度等寥寥幾家大廠。而想要部署十萬卡集群,其“燒錢”程度可想而知。
除了資金成本,十萬卡集群同樣面臨巨大的技術(shù)挑戰(zhàn)。沈抖指出,GPU是一種很敏感的硬件,連一天之內(nèi)氣溫的波動,都會影響到GPU的故障率,而且規(guī)模越大,出故障的概率就越高?!癕eta訓(xùn)練llama3的時候,用了1.6萬張GPU卡的集群,平均每3小時就會出一次故障?!?
此外,區(qū)別于傳統(tǒng)CPU集群的串行特點(diǎn),大模型訓(xùn)練過程需要全部顯卡同時參與并行計算,對網(wǎng)絡(luò)傳輸能力也提出了更大的挑戰(zhàn)。
相比于美國同行,中國大模型企業(yè)還面臨一重特殊的困難,無法像馬斯克那樣全部采用英偉達(dá)方案,而是需要使用包括國產(chǎn)GPU在內(nèi)的異構(gòu)芯片。這也意味著,即使同樣十萬張顯卡,國內(nèi)企業(yè)在算力規(guī)模上也很難同美國企業(yè)匹敵。
在上述三重挑戰(zhàn)之下,國內(nèi)大模型企業(yè)的進(jìn)步速度也有目共睹。
據(jù)沈抖介紹,百舸4.0在萬卡集群上實(shí)現(xiàn)了有效訓(xùn)練時長占比99.5%以上,業(yè)界領(lǐng)先,并通過在集群設(shè)計、任務(wù)調(diào)度、并行策略、顯存優(yōu)化等一系列創(chuàng)新,大幅提升了集群的模型訓(xùn)練效率,整體性能相比業(yè)界平均水平提升高達(dá)30%。
而阿里云CTO周靖人此前也透露,目前阿里云的萬卡算力集群可以實(shí)現(xiàn)大于99%以上連續(xù)訓(xùn)練有效時長,模型算力利用率可提升20%以上。
但隨著性能提升,大模型成本問題只會越來越引人注目。單從能耗來看,沈抖透露,十萬卡集群每天就要消耗大約300萬千瓦時的電力,相當(dāng)于北京市東城區(qū)一天的居民用電量。
一位開發(fā)者向觀察者網(wǎng)直言,盡管在過去一年中大模型廠商的降價幅度確實(shí)可觀,但這更多是平臺補(bǔ)貼開發(fā)者的結(jié)果,并非根本解決之道。
對此,阿里云方面強(qiáng)調(diào),AI發(fā)展仍然處在一個非常早期的階段,必須要靠降價帶動應(yīng)用爆發(fā),而阿里云搞AI大基建,并不會只算眼前賬。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
標(biāo)簽 大模型- 責(zé)任編輯: 張廣凱 
-
上海投入5億元發(fā)消費(fèi)券!首批本周六申領(lǐng),涵蓋餐飲、住宿、電影等
2024-09-25 16:39 觀網(wǎng)財經(jīng)-消費(fèi) -
小米要求印度撤回反壟斷報告:包含商業(yè)機(jī)密
2024-09-25 15:33 觀網(wǎng)財經(jīng)-科創(chuàng) -
上證指數(shù)收復(fù)2900點(diǎn)
2024-09-25 13:15 觀網(wǎng)財經(jīng)-金融 -
三星18億美元投資越南,加工OLED面板模組
2024-09-25 12:06 觀網(wǎng)財經(jīng)-科創(chuàng) -
亞行預(yù)計亞太地區(qū)今年經(jīng)濟(jì)增長5%,中國4.8%
2024-09-25 11:33 觀網(wǎng)財經(jīng)-宏觀 -
OpenAI全面發(fā)布類人ChatGPT語音助手,支持中文等50多種語言
2024-09-25 11:29 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
在美中概股昨夜集體大漲,華爾街稱漲勢將持續(xù)
2024-09-25 11:20 觀網(wǎng)財經(jīng)-金融 -
讀懂央行新政:為居民減負(fù)才是精準(zhǔn)藥方
2024-09-25 08:52 觀網(wǎng)財經(jīng)-宏觀 -
離岸人民幣兌美元收復(fù)7.0關(guān)口
2024-09-25 08:15 觀網(wǎng)財經(jīng)-海外 -
金融資產(chǎn)投資公司股權(quán)投資試點(diǎn)范圍擴(kuò)大至18個城市
2024-09-24 21:25 金融觀察 -
證監(jiān)會發(fā)布《關(guān)于深化上市公司并購重組市場改革的意見》
2024-09-24 20:30 政策風(fēng)向標(biāo) -
中國糧食75年增產(chǎn)5倍,海外友人:中國大米比日本和泰國米更好吃
2024-09-24 20:10 -
“純血鴻蒙”即將公測,鴻蒙PC可能也快來了
2024-09-24 18:22 觀網(wǎng)財經(jīng)-科創(chuàng) -
3年超越西方30年?
2024-09-24 17:35 觀察者頭條 -
商務(wù)部:對美國PVH集團(tuán)啟動不可靠實(shí)體清單調(diào)查
2024-09-24 16:30 -
專家解讀:房價觸底、緩解提前償債壓力、刺激內(nèi)需、對沖通縮
2024-09-24 16:19 -
滬指創(chuàng)4年多最大單日漲幅,兩市成交額超9700億
2024-09-24 15:34 -
印度電信巨頭簽36億美元大單,提升4G覆蓋、引入5G
2024-09-24 14:22 觀網(wǎng)財經(jīng)-海外 -
大促免傭、店播免傭、解綁運(yùn)費(fèi)險!今年雙11淘寶商家獲“大紅包”!
2024-09-24 13:50 雙11節(jié)
相關(guān)推薦 -
-
被當(dāng)面打臉,日鐵急了 評論 65最新聞 Hot
-
“沙特曾多次警告德國提防嫌疑人”
-
特朗普最新任命!這次包括火箭隊老板、真人秀制作人
-
巴勒斯坦三個政治派別發(fā)表聯(lián)合聲明
-
“中國在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團(tuán)是絕望之舉,中國工廠效率質(zhì)量都是第一”
-
“中國有能力讓夢想照進(jìn)現(xiàn)實(shí),將贏得史詩般競爭”
-
被災(zāi)民暴罵到當(dāng)場破防,馬克龍發(fā)飆:你該慶幸你在法國!
-
美高校敦促國際學(xué)生抓緊回來:萬一把中印拉黑名單呢
-
美國政府“逃過一劫”
-
“澤連斯基要求歐盟新外長:對華批評要降調(diào)”
-
澳大利亞來了,中國就得走人?澳總理這么回應(yīng)
-
美媒感慨:基建狂魔發(fā)力,我們又要被超越了
-
英國剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國的老大哥能確保我們…”
-
俄羅斯的報復(fù)來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-