-
正對(duì)著DeepSeek狂抄?Meta被曝整個(gè)AI部門(mén)深陷恐慌
-
連政guanchazhewanxgun
最后更新: 2025-01-24 16:07:15中國(guó)人工智能公司深度求索(DeepSeek)在大模型上取得的成功,目前已經(jīng)深深撼動(dòng)了硅谷同行們的信心。
1月23日,在美國(guó)匿名職場(chǎng)論壇TeamBlind上,一名Meta公司員工發(fā)布涉深度求索的帖子“Meta生成式人工智能部門(mén)陷入恐慌”,引起廣泛討論。該員工在文中稱(chēng),從深度求索發(fā)布DeepSeek-V3開(kāi)始,就已經(jīng)讓Meta的Llama 4在各項(xiàng)測(cè)試中處于落后,“更糟糕的是,這家不知名中國(guó)公司僅為此花費(fèi)了550萬(wàn)美元?!?
550萬(wàn)美元是什么概念呢?“Meta生成式AI部門(mén)里的每位‘領(lǐng)導(dǎo)’的薪資都超過(guò)了這個(gè)數(shù)字”,該Meta員工稱(chēng),“而我們卻有幾十位這樣的領(lǐng)導(dǎo),我根本無(wú)法想象該如何向公司高層證明部門(mén)目前高額成本的合理性?!?
該員工透露,目前Meta的工程師們正在瘋狂研究分析DeepSeek的成功,并試圖從中復(fù)制任何能復(fù)制到的東西,這不是夸張。“然而,當(dāng)DeepSeek-R1發(fā)布時(shí),事情變得更加可怕了”,該員工表示雖然不能透露太具體,但有些事情很快將會(huì)公開(kāi)。
1月20日,深度求索發(fā)布DeepSeek-R1開(kāi)源大模型,對(duì)標(biāo)OpenAI o1正式版。南華早報(bào)
最后,該員工反思稱(chēng),Meta的生成式AI部門(mén)本應(yīng)該是一個(gè)以工程為重點(diǎn)的小型組織,但因?yàn)楹芏嗳硕枷脒M(jìn)來(lái)分一杯羹,人為膨脹了組織的規(guī)模,到最后人人都是輸家。
目前不清楚該員工所指具體為何,是否暗示該公司生成式AI部門(mén)面臨的調(diào)整或者其他情況的可能性,這還需要進(jìn)一步觀察,不過(guò)Meta在大模型中競(jìng)爭(zhēng)中腳步放緩已是事實(shí)。
公開(kāi)信息顯示,帖子中提及的DeepSeek-V3于去年12月26日對(duì)外發(fā)布,該模型一經(jīng)發(fā)布就站上了開(kāi)源模型No.1的位置。根據(jù)當(dāng)時(shí)深度求索公布的技術(shù)報(bào)告數(shù)據(jù),Meta公司的Llama 3.1-405B僅在大規(guī)模多任務(wù)理解數(shù)據(jù)集MMLU-Pro一項(xiàng),接近DeepSeek-V3水平,其余多項(xiàng)幾乎都不及八成,甚至在算法類(lèi)代碼場(chǎng)景和工程類(lèi)代碼場(chǎng)景下,Llama 3.1-405B只有DeepSeek-V3的一半水平。
而4天前(1月20日),深度求索對(duì)外正式發(fā)布DeepSeek-R1,官方技術(shù)報(bào)告的測(cè)試所對(duì)照模型中,僅有OpenAI公司閉源的OpenAI o1 模型,以及DeepSeek-v3等自家模型。而在上一輪DeepSeek-V3測(cè)試中所對(duì)照的Meta、Anthropic等公司模型,此時(shí)早已不見(jiàn)蹤影。
最重要的是,DeepSeek-R1以及深度求索同期提及的DeepSeek-R1-Zero模型,首次讓整個(gè)行業(yè)清楚看到,大模型如何僅靠大規(guī)模強(qiáng)化學(xué)習(xí)(RL)驅(qū)動(dòng)、在沒(méi)有人類(lèi)標(biāo)注數(shù)據(jù)冷啟動(dòng)(SFT)的情況下,實(shí)現(xiàn)持續(xù)自我成長(zhǎng)。簡(jiǎn)單說(shuō),DeepSeek-R1的意義就相當(dāng)于讓谷歌的圍棋軟件AlphaGo(阿法狗)從零開(kāi)始自己與自己下棋,并通過(guò)試錯(cuò)自學(xué)達(dá)成如今的水平,但期間卻不向AlphaGo提供任何人類(lèi)大師的下棋思路信息。
而在成本方面,深度求索雖然未透露DeepSeek-R1 的訓(xùn)練花費(fèi),但DeepSeek-v3的總訓(xùn)練時(shí)長(zhǎng)則為278.8萬(wàn)GPU小時(shí)(其中預(yù)訓(xùn)練占266.4萬(wàn)小時(shí)),使用2048塊英偉達(dá)H800 GPU,耗時(shí)約兩個(gè)月完成。與之相比,同樣開(kāi)源的Llama 3.1-405B卻消耗了3080萬(wàn)GPU小時(shí),成本是DeepSeek-V3的11倍。甚至OpenAI公司的 GPT-4o的模型訓(xùn)練成本也達(dá)到1億美元,這與DeepSeek-V3訓(xùn)練花費(fèi)的557萬(wàn)美元相差巨大,也讓“花小錢(qián)辦大事”成為深度求索的重要標(biāo)簽。
對(duì)此,在該Meta員工的帖子下邊有一名三星員工評(píng)論稱(chēng),特朗普日前宣布的“星球之門(mén)計(jì)劃”預(yù)計(jì)投入總規(guī)模達(dá)到5000億美元,“但如果當(dāng)這些AI基礎(chǔ)設(shè)施僅能與深度求索極小的成本相匹配時(shí),投資人還能有多少耐心?這個(gè)5000億美元的計(jì)劃還沒(méi)開(kāi)始就將夭折?!?
而谷歌公司的一名員工也評(píng)論稱(chēng),深度求索很瘋狂,不僅僅是Meta,面對(duì)這家中國(guó)公司時(shí),OpenAI以及谷歌/Anthropic目前同樣是“火燒屁股”。
不過(guò)這名谷歌員工也承認(rèn),對(duì)于行業(yè)來(lái)說(shuō)是一件好事,“我們可以實(shí)時(shí)看到公開(kāi)競(jìng)爭(zhēng)對(duì)創(chuàng)新的推動(dòng)作用”。
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 連政 
-
多只場(chǎng)內(nèi)貨幣基金午后突然暴漲,離岸人民幣漲400點(diǎn)
2025-01-24 15:07 金融觀察 -
日本央行加息25個(gè)基點(diǎn),18年來(lái)最大幅度加息
2025-01-24 14:28 金融觀察 -
用友去年預(yù)虧超17億,離職補(bǔ)償金同比增加1.4億
2025-01-23 22:05 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
4G主力芯片打入vivo小米,紫光展銳今年能扭虧嗎?
2025-01-23 17:35 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
基金季報(bào)揭示神秘資金力挺A股:耗資千億增持,至今一股未賣(mài)
2025-01-23 16:43 觀網(wǎng)財(cái)經(jīng)-金融 -
國(guó)產(chǎn)“足球巨星”機(jī)器人來(lái)了
2025-01-23 16:27 人工智能 -
一箭18星!長(zhǎng)六改火箭成功發(fā)射千帆極軌06組衛(wèi)星
2025-01-23 16:00 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
對(duì)話|應(yīng)對(duì)卡脖子,開(kāi)源是中國(guó)大模型安全的最優(yōu)解?
2025-01-23 15:30 -
1月136款游戲獲批,王者榮耀衍生作品拿下版號(hào)
2025-01-23 11:15 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
高端餐飲年度觀察|西餐日料承壓,中餐持續(xù)走強(qiáng),高處不勝寒
2025-01-23 11:04 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
吳清:力爭(zhēng)大型國(guó)有險(xiǎn)企,每年新增保費(fèi)的30%用于投資A股
2025-01-23 09:20 金融觀察 -
對(duì)抗OpenAI,谷歌向Anthropic追投10億美元
2025-01-22 17:17 人工智能 -
出售與輝同行后東方甄選虧近億元,新東方股價(jià)暴跌24%
2025-01-22 16:19 大公司 -
?12306重申加價(jià)搶票是忽悠,購(gòu)票平臺(tái)為何還在賣(mài)“加速包”?
2025-01-22 15:22 -
華為數(shù)字能源多位高層變更,年?duì)I收超500億
2025-01-22 15:12 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
相關(guān)推薦 -
-
馬斯克靠這6張娃娃臉發(fā)動(dòng)“閃電戰(zhàn)”,美國(guó)嘩然 評(píng)論 255特朗普拋出震撼發(fā)言:美國(guó)將接管加沙 評(píng)論 442這時(shí)候,她對(duì)華態(tài)度“軟”了 評(píng)論 192“中方反擊較為克制,留了余地” 評(píng)論 1882月10日起,對(duì)原產(chǎn)于美國(guó)的部分進(jìn)口商品加征關(guān)稅 評(píng)論 295最新聞 Hot
-
“中方反擊較為克制,留了余地”
-
“反美聯(lián)盟正在形成!他拔槍就射,極其危險(xiǎn)”
-
要起訴DeepSeek?他回應(yīng)了
-
賬對(duì)不上了…
-
普京:要不了多久,歐洲會(huì)繼續(xù)對(duì)特朗普“搖尾巴”
-
墜毀“黑鷹”女飛行員曾任拜登軍事社交助理,飛行時(shí)長(zhǎng)450小時(shí)
-
特朗普承認(rèn):關(guān)稅也許會(huì)讓美國(guó)人“痛苦”
-
“史上最愚蠢的貿(mào)易戰(zhàn)!”
-
加拿大群情激奮:報(bào)復(fù)紅州,報(bào)復(fù)特斯拉!
-
美國(guó)一客機(jī)發(fā)動(dòng)機(jī)起火,乘客被緊急疏散
-
要被特朗普關(guān)稅大棒掄到,歐盟這時(shí)候想到中國(guó)了?
-
“霸榜全球140個(gè)市場(chǎng)”,拉新最多的是…
-
他罕見(jiàn)“認(rèn)錯(cuò)”:在這方面,我們一直站在歷史錯(cuò)誤一邊
-
“政治清洗”?數(shù)千名FBI特工被“拉清單”
-
他寫(xiě)的這篇小作文,竟是英偉達(dá)市值蒸發(fā)6000億美元的重要催化劑
-
他倆首會(huì)面,“談了DeepSeek和AI芯片出口”
-