-
心智觀察所:DeepSeek“破圈”背后,“回聲一代”刷新中國(guó)科創(chuàng)范式
【文/觀察者網(wǎng) 心智觀察所】
請(qǐng)思考,以下兩家公司,哪一家更值得投資:
1.全息電視制造商,宣稱(chēng)將徹底顛覆電視機(jī)乃至內(nèi)容生產(chǎn)業(yè)態(tài);
2.傳統(tǒng)電視制造商,計(jì)劃依托新技術(shù)提升現(xiàn)有產(chǎn)品性?xún)r(jià)比;
這道商業(yè)思維例題,出自肯尼斯·斯坦利(Kenneth Stanley)和喬·雷曼(Joel Lehman)合著的暢銷(xiāo)書(shū)《為什么偉大不能被計(jì)劃》。書(shū)中,兩位前OpenAI技術(shù)專(zhuān)家反復(fù)強(qiáng)調(diào)這樣一個(gè)反直覺(jué)的論點(diǎn):過(guò)于宏偉的目標(biāo)往往是成功的絆腳石,利用現(xiàn)實(shí)技術(shù)機(jī)會(huì)自由探索,反而可能開(kāi)啟偉大創(chuàng)新之路。
他們恐怕不會(huì)想到,啟發(fā)其新思維的OpenAI,有朝一日卻會(huì)擺足架勢(shì)“計(jì)劃偉大”。
1月21日,OpenAI正式官宣星際之門(mén)(Stargate)項(xiàng)目,計(jì)劃未來(lái)四年內(nèi)斥資5000億美元,在美國(guó)本土建設(shè)新的人工智能基礎(chǔ)設(shè)施,該基礎(chǔ)設(shè)施將“確保美國(guó)在人工智能領(lǐng)域的領(lǐng)導(dǎo)地位,創(chuàng)造數(shù)十萬(wàn)個(gè)美國(guó)就業(yè)機(jī)會(huì),并為全世界帶來(lái)巨大的經(jīng)濟(jì)效益……這一新舉措是這條道路(實(shí)現(xiàn)AGI)上的關(guān)鍵一步,將使富有創(chuàng)造力的人能夠弄清楚如何利用人工智能來(lái)提升人類(lèi)”。
諷刺的是,OpenAI造勢(shì)已久的萬(wàn)億大計(jì),全然沒(méi)有激起預(yù)計(jì)的熱烈反響。
過(guò)去一周,在美國(guó)力壓OpenAI熱度的,赫然是一家來(lái)自中國(guó)的小公司—深度求索(DeepSeek)。
任務(wù)表現(xiàn)一步追平4o/o1、訓(xùn)推效率斷崖式領(lǐng)先、沒(méi)有千奇百怪的DEI禁忌“對(duì)齊”……一個(gè)又一個(gè)“絕活”,令楊立昆(Yann LeCun)、卡帕西(Andrej Karpathy)等業(yè)界領(lǐng)軍人物紛紛變身迷弟,對(duì)DeepSeek V3\R1不吝肉麻吹捧,“OpenAI原本該成為的樣子”(Mistral AI曾享有的評(píng)價(jià))、“開(kāi)源大模型全球創(chuàng)新中心已轉(zhuǎn)移至中國(guó)”、“重構(gòu)大模型商業(yè)模式”,更有甚者,在硅谷創(chuàng)投教父馬克·安德森(Marc Andreessen)看來(lái),DeepSeek-R1已堪與特朗普入主白宮并列,成為本世紀(jì)20年代最重要一周的兩大里程碑事件。
的確,無(wú)論從中國(guó)產(chǎn)業(yè)界“奮起直追OpenAI”的主體視角,還是從美國(guó)產(chǎn)業(yè)高地開(kāi)源閉源之爭(zhēng)的他者視角,橫空出世的DeepSeek,都已被引為終結(jié)議題、開(kāi)啟新章的標(biāo)志,注定將在波瀾壯闊的人工智能新浪潮里,留下自己不可磨滅的印記。
當(dāng)OpenAI已躊躇滿(mǎn)志開(kāi)始大手筆塑造產(chǎn)業(yè)生態(tài)終局,當(dāng)谷歌、Anthropic、xAI、Meta等硅谷巨頭還在為坐穩(wěn)老二的位置苦苦廝殺,當(dāng)國(guó)內(nèi)大廠在“比OpenAI落后多久”的問(wèn)題上繼續(xù)打磨著阿基里斯悖論式的話術(shù),DeepSeek為什么能夠成為締造這場(chǎng)開(kāi)年“技術(shù)驚奇”的主角?
過(guò)硬的原始創(chuàng)新能力,當(dāng)然是最直接的答案。
如果說(shuō)DeepSeekMoE、FP8數(shù)據(jù)格式和RL后訓(xùn)練范式尚且還有著一目了然的借鑒脈絡(luò),那么MLA和GRPO,則無(wú)疑已展現(xiàn)出獨(dú)到精妙的洞察,足以成為新范式的開(kāi)創(chuàng)者。
以創(chuàng)造大模型成本奇跡的MLA(Multi-head Latent Attention)技術(shù)為例,其核心靈感可以歸結(jié)為有意用更多的計(jì)算量換取更小的KV Cache,進(jìn)而緩解模型訓(xùn)練中更為根本的訪存瓶頸。這種對(duì)多頭注意力機(jī)制大刀闊斧的深度改造,足以證明DeepSeek團(tuán)隊(duì)算法與工程基因的深度交融,從而大有別于對(duì)TensorFlow或PyTorch底層技術(shù)實(shí)現(xiàn)機(jī)制毫無(wú)興趣的所謂“算法工程師”,獲得全局優(yōu)化的新視角。
然而與某種或許會(huì)順理成章被喚起的想象不同,DeepSeek這支團(tuán)隊(duì)相比其他國(guó)內(nèi)大廠和“小龍”,用“寒酸”和“土氣”來(lái)形容也不為過(guò)。論資金投入,母公司幻方量化的研發(fā)預(yù)算加上“每年幾個(gè)億”可供機(jī)動(dòng)的捐款,與某幾家國(guó)內(nèi)頭部大廠相比有著一到兩個(gè)數(shù)量級(jí)的懸殊差距;論人才儲(chǔ)備,與動(dòng)輒清北博士打底,硅谷回國(guó)專(zhuān)家領(lǐng)銜的豪華陣容相比,DeepSeek團(tuán)隊(duì)在V2模型之前甚至沒(méi)有一個(gè)“海歸”,創(chuàng)始人梁文鋒坦言,團(tuán)隊(duì)“并沒(méi)有什么高深莫測(cè)的奇才,都是一些Top高校的應(yīng)屆畢業(yè)生、沒(méi)畢業(yè)的博四、博五實(shí)習(xí)生,還有一些畢業(yè)才幾年的年輕人”。
以MLA核心貢獻(xiàn)者高華佐為例,其最高學(xué)歷“僅僅”是北大本科,2017年畢業(yè)后輾轉(zhuǎn)曠視科技等多家國(guó)內(nèi)“中小廠”,如果沒(méi)有DeepSeek橫空出世,這樣的人才畫(huà)像在中國(guó)可以說(shuō)成千上萬(wàn)。
因此,在產(chǎn)品與技術(shù)之上,一個(gè)更有意義的追問(wèn)或許是,為什么DeepSeek能夠憑借算不上出挑的資金和人才儲(chǔ)備,迸發(fā)如此強(qiáng)烈的“化學(xué)反應(yīng)”?
創(chuàng)始人梁文鋒所注入的“企業(yè)家精神”,無(wú)疑是一個(gè)至關(guān)重要的變量。
梁文峰參加總理座談會(huì)
以幻方投資所切入的基本面量化策略研究為起點(diǎn),從2015年的百卡集群、2019年的千卡集群,到當(dāng)下的萬(wàn)卡集群,梁文鋒的自我驅(qū)動(dòng)力并非來(lái)自商業(yè)上的理由,正如其在有限的兩次專(zhuān)訪中所坦言:“幻方的主要班底里,很多人是做人工智能的。當(dāng)時(shí)我們嘗試了很多場(chǎng)景,最終切入了足夠復(fù)雜的金融,而通用人工智能可能是下一個(gè)最難的事之一,所以對(duì)我們來(lái)說(shuō),這是一個(gè)怎么做的問(wèn)題,而不是為什么做的問(wèn)題……如果一定要找一個(gè)商業(yè)上的理由,它可能是找不到的,因?yàn)閯澆粊?lái)。從商業(yè)角度來(lái)講,基礎(chǔ)研究就是投入回報(bào)比很低的。OpenAI早期投資人投錢(qián)時(shí),想的一定不是我要拿回多少回報(bào),而是真的想做這個(gè)事……很多人會(huì)以為這里邊有一個(gè)不為人知的商業(yè)邏輯,但其實(shí),主要是好奇心驅(qū)動(dòng)……對(duì)AI能力邊界的好奇”。
這種超脫于商業(yè)結(jié)果的熱情或者說(shuō)品味,也體現(xiàn)在他對(duì)DeepSeek技術(shù)團(tuán)隊(duì)的招募和管理,梁文鋒談到,自己選人的標(biāo)準(zhǔn)“一直都是熱愛(ài)和好奇心……很多人對(duì)做研究的渴望,遠(yuǎn)超對(duì)錢(qián)的在意”,對(duì)這些氣味相投的“技術(shù)宅”,梁文鋒也給予了充分的信任,以身作則塑造了一整套獨(dú)特的組織文化,“DeepSeek也全是自下而上。而且我們一般不前置分工,而是自然分工。每個(gè)人有自己獨(dú)特的成長(zhǎng)經(jīng)歷,都是自帶想法的,不需要push他。探索過(guò)程中,他遇到問(wèn)題,自己就會(huì)拉人討論。不過(guò)當(dāng)一個(gè)idea顯示出潛力,我們也會(huì)自上而下地去調(diào)配資源……我們每個(gè)人對(duì)于卡和人的調(diào)動(dòng)是不設(shè)上限的。如果有想法,每個(gè)人隨時(shí)可以調(diào)用訓(xùn)練集群的卡無(wú)需審批。同時(shí)因?yàn)椴淮嬖趯蛹?jí)和跨部門(mén),也可以靈活調(diào)用所有人,只要對(duì)方也有興趣……交給他重要的事,并且不干預(yù)他。讓他自己想辦法,自己發(fā)揮……我們的總結(jié)是,創(chuàng)新需要盡可能少的干預(yù)和管理,讓每個(gè)人有自由發(fā)揮的空間和試錯(cuò)機(jī)會(huì)。創(chuàng)新往往都是自己產(chǎn)生的,不是刻意安排的,更不是教出來(lái)的”。
相比之下,絕大多數(shù)中國(guó)大模型從業(yè)者,在這一輪人工智能新浪潮里的“姿勢(shì)”,還或多或少帶著舊日的慣性,在短期商業(yè)目標(biāo)和組織內(nèi)不同層級(jí)利益取向的交互下,往往殊途同歸收斂為同一種行為模式:基于開(kāi)源模型和公開(kāi)文獻(xiàn)快速?gòu)?fù)刻歐美原始創(chuàng)新,在底層技術(shù)拿來(lái)主義的基礎(chǔ)上,將主要精力聚焦于應(yīng)用端盡快取得商業(yè)結(jié)果。恰如梁文鋒所辛辣點(diǎn)評(píng)的:“過(guò)去很多年,中國(guó)公司習(xí)慣了別人做技術(shù)創(chuàng)新,我們拿過(guò)來(lái)做應(yīng)用變現(xiàn),但這并非是一種理所當(dāng)然……我們認(rèn)為隨著經(jīng)濟(jì)發(fā)展,中國(guó)也要逐步成為貢獻(xiàn)者,而不是一直搭便車(chē)。過(guò)去三十多年IT浪潮里,我們基本沒(méi)有參與到真正的技術(shù)創(chuàng)新里。我們已經(jīng)習(xí)慣摩爾定律從天而降,躺在家里18個(gè)月就會(huì)出來(lái)更好的硬件和軟件。Scaling Law也在被如此對(duì)待?!?
好在,后浪奔涌。
梁文鋒的徹底與純粹,以及這種新聲音在輿論場(chǎng)上更強(qiáng)的反響,正是80后“回聲一代”企業(yè)家崛起的縮影。
如果讀者稍加回想,不難發(fā)現(xiàn)這樣一個(gè)顯見(jiàn)的趨勢(shì):梁文鋒、馮驥等新一代創(chuàng)業(yè)者,在思維與表達(dá)上,都有著與上一代“92派”企業(yè)家截然不同的格調(diào),而有趣的是,他們也都是出生于1981到1990年的新中國(guó)第三次人口增長(zhǎng)高峰,或者說(shuō),屬于“回聲嬰兒潮”世代。
細(xì)看這一代企業(yè)家,如果說(shuō)黃崢、張一鳴、許仰天等先行者還自覺(jué)或不自覺(jué)的因循著上一代企業(yè)家對(duì)中國(guó)與世界的觀念,那么梁文鋒、馮驥等后來(lái)者,則表現(xiàn)出明顯更強(qiáng)的表達(dá)欲,這背后,是對(duì)外部世界從仰視到平視的深刻變化。
馬克安德森的評(píng)語(yǔ),恰是與美國(guó)贏學(xué)敘事的兩次沖擊,正如拜登團(tuán)隊(duì)所營(yíng)造的自由主義國(guó)際同盟勢(shì)頭,已如同一張畫(huà)紙般被特朗普輕易戳破,讓美國(guó)再次偉大所需要的是形似還是神似,特朗普顯然已摩拳擦掌選擇后者,而作為美利堅(jiān)贏學(xué)在過(guò)去數(shù)年著力經(jīng)營(yíng)的標(biāo)志,美國(guó)朝野為呵護(hù)其原始創(chuàng)新能力道成肉身的OpenAI可謂不遺余力,但DeepSeek同樣讓這重重高墻一夜之間變得形同雞肋。
為興趣而活,“不務(wù)正業(yè)”,脫離了肉體生存焦慮的回聲一代后來(lái)者們,在中國(guó)商界的地平線上正批量涌現(xiàn),機(jī)器人、跑車(chē)、超音速飛機(jī),他們正重寫(xiě)中國(guó)創(chuàng)新范式,這一億多在各行各業(yè)走向社會(huì)中堅(jiān)的人群里,一定還會(huì)涌現(xiàn)更多、更精彩的創(chuàng)新故事。
最后,梁文鋒的一句展望恰可作結(jié):“以后硬核創(chuàng)新會(huì)越來(lái)越多?,F(xiàn)在可能還不容易被理解,是因?yàn)檎麄€(gè)社會(huì)群體需要被事實(shí)教育。當(dāng)這個(gè)社會(huì)讓硬核創(chuàng)新的人功成名就,群體性想法就會(huì)改變。我們只是還需要一堆事實(shí)和一個(gè)過(guò)程”。
這一堆事實(shí)的展現(xiàn),已在加速。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 小婷 
-
理解DeepSeek的中國(guó)式創(chuàng)新,要先回顧深度學(xué)習(xí)的歷史
2025-01-27 08:03 心智觀察所 -
探索宇宙線起源之謎再添“觀天”利器
2025-01-21 20:09 天文 -
最大載重1.9噸,國(guó)產(chǎn)大型無(wú)人機(jī)首次實(shí)現(xiàn)量產(chǎn)交付
2025-01-20 22:12 中國(guó)精造 -
我國(guó)成功發(fā)射云遙一號(hào)37~40星等5顆衛(wèi)星
2025-01-20 21:59 航空航天 -
新跨越!中國(guó)“人造太陽(yáng)”創(chuàng)造“億度千秒”世界紀(jì)錄
2025-01-20 21:26 能源戰(zhàn)略 -
“畫(huà)地為牢,作繭自縛”,這八個(gè)字將在美國(guó)身上應(yīng)驗(yàn)
2025-01-20 08:24 心智觀察所 -
英偉達(dá),只是時(shí)代的偶然?
2025-01-16 09:36 人工智能 -
全球唯一!中國(guó)率先將美國(guó)學(xué)者設(shè)想變?yōu)楝F(xiàn)實(shí)
2025-01-16 09:28 科技前沿 -
全國(guó)首例!跨市自動(dòng)駕駛公交來(lái)了
2025-01-14 19:49 -
我國(guó)建立世界第一套微波亮溫度國(guó)家計(jì)量基準(zhǔn)
2025-01-13 15:38 科技前沿 -
2025開(kāi)年大戲:馬斯克揚(yáng)言?shī)^不顧身一戰(zhàn)的背后
2025-01-09 08:13 心智觀察所 -
國(guó)內(nèi)首次!這一技術(shù)應(yīng)用于管道研究,測(cè)試完成
2025-01-06 17:40 科技前沿 -
公眾對(duì)低空經(jīng)濟(jì)的認(rèn)知度仍不高,如何解決?
2025-01-06 08:42 心智觀察所 -
我國(guó)腦機(jī)接口技術(shù)實(shí)現(xiàn)漢語(yǔ)實(shí)時(shí)編解碼重大突破
2025-01-06 07:57 科技前沿 -
研制成功!我國(guó)這一關(guān)鍵技術(shù)實(shí)現(xiàn)重大突破
2024-12-30 14:59 中國(guó)精造 -
華為:懸賞300萬(wàn)元
2024-12-30 10:08 華為 -
我國(guó)新一代智能高鐵有望2027年落地
2024-12-30 09:02 高鐵世紀(jì) -
“量子”狼不再?lài)槺辣忍貛?/a>
2024-12-30 08:24 心智觀察所 -
又添一大國(guó)利器!“探索三號(hào)”正式入列
2024-12-29 10:44 中國(guó)精造
相關(guān)推薦 -
馬斯克靠這6張娃娃臉發(fā)動(dòng)“閃電戰(zhàn)”,美國(guó)嘩然 評(píng)論 255特朗普拋出震撼發(fā)言:美國(guó)將接管加沙 評(píng)論 442這時(shí)候,她對(duì)華態(tài)度“軟”了 評(píng)論 192“中方反擊較為克制,留了余地” 評(píng)論 1882月10日起,對(duì)原產(chǎn)于美國(guó)的部分進(jìn)口商品加征關(guān)稅 評(píng)論 295最新聞 Hot
-
“中方反擊較為克制,留了余地”
-
“反美聯(lián)盟正在形成!他拔槍就射,極其危險(xiǎn)”
-
要起訴DeepSeek?他回應(yīng)了
-
賬對(duì)不上了…
-
普京:要不了多久,歐洲會(huì)繼續(xù)對(duì)特朗普“搖尾巴”
-
墜毀“黑鷹”女飛行員曾任拜登軍事社交助理,飛行時(shí)長(zhǎng)450小時(shí)
-
特朗普承認(rèn):關(guān)稅也許會(huì)讓美國(guó)人“痛苦”
-
“史上最愚蠢的貿(mào)易戰(zhàn)!”
-
加拿大群情激奮:報(bào)復(fù)紅州,報(bào)復(fù)特斯拉!
-
美國(guó)一客機(jī)發(fā)動(dòng)機(jī)起火,乘客被緊急疏散
-
要被特朗普關(guān)稅大棒掄到,歐盟這時(shí)候想到中國(guó)了?
-
“霸榜全球140個(gè)市場(chǎng)”,拉新最多的是…
-
他罕見(jiàn)“認(rèn)錯(cuò)”:在這方面,我們一直站在歷史錯(cuò)誤一邊
-
“政治清洗”?數(shù)千名FBI特工被“拉清單”
-
他寫(xiě)的這篇小作文,竟是英偉達(dá)市值蒸發(fā)6000億美元的重要催化劑
-
他倆首會(huì)面,“談了DeepSeek和AI芯片出口”
-