-
對話|應(yīng)對卡脖子,開源是中國大模型安全的最優(yōu)解?
-
張廣凱13764468101
最后更新: 2025-01-23 16:49:09文/觀察者網(wǎng) 張廣凱
2025開年伊始,國內(nèi)大模型行業(yè)似乎正醞釀著一場劇烈的格局變動。
一邊是零一萬物與阿里云達(dá)成合作,不再獨立追求超大模型的預(yù)訓(xùn)練;另一邊,以豆包為代表的大廠模型仍在快速進(jìn)化,“不差錢”的DeepSeek更是以創(chuàng)新架構(gòu),讓人看到超越OpenAI的可能性。
這似乎印證了一段時間以來的流言:國內(nèi)大模型企業(yè)將進(jìn)一步收斂,一些過去的頭部玩家也開始掉隊?
另一個有趣的現(xiàn)象是,此前一直走閉源路線的MiniMax,最近突然發(fā)布了自己的開源模型。開源是弱勢方爭奪市場的捷徑,還是本身就具備比閉源更好的商業(yè)邏輯閉環(huán)?
當(dāng)然,美國對中國愈加嚴(yán)厲的政策限制,一直都是不容忽視的巨大風(fēng)險。國產(chǎn)大模型行業(yè)準(zhǔn)備好迎接進(jìn)一步脫鉤了嗎?
圍繞上述話題,我們邀請AI生態(tài)專家、曾任零一萬物開源及開發(fā)者生態(tài)負(fù)責(zé)人的林旅強,以及Hugging Face工程師王鐵震進(jìn)行對話,收獲了不少新穎的觀點。
林旅強
王鐵震
摘要如下:
·中國大模型行業(yè)的研發(fā)能力與OpenAI沒有明顯差距,即使放棄預(yù)訓(xùn)練的團(tuán)隊,也并非因為訓(xùn)練效果不佳,只是更好的商業(yè)選擇。
·隨著主流模型能力基本夠用,一味追求模型能力最強或許是個誤區(qū)。以操作系統(tǒng)為例,性價比才是大規(guī)模應(yīng)用的決定性因素。
·當(dāng)算力成本進(jìn)一步降低,開源模型的性價比將更加突出。
·開源的優(yōu)勢還在于更容易成為行業(yè)標(biāo)準(zhǔn)。
·開源的AI開發(fā)工具鏈,對大模型的國產(chǎn)化替代意義巨大。
以下為對話全文:
放棄預(yù)訓(xùn)練,不是能力不夠
觀察者網(wǎng):可以聊聊最近零一萬物預(yù)訓(xùn)練團(tuán)隊并入阿里的事嗎?這是不是意味著,國內(nèi)頭部大模型公司之間的能力已經(jīng)在分化,零一發(fā)現(xiàn)自己預(yù)訓(xùn)練的效果不夠好?
林旅強:完全不是這樣的。零一的團(tuán)隊很強,預(yù)訓(xùn)練出來的東西也很強,去年5月發(fā)布的Yi-Large,10月發(fā)布的Yi-Lightning都很好,尤其是Yi-Lightning,可以說是當(dāng)時時間點上最強的之一。
但是模型強不強,跟商業(yè)上能不能走通是兩回事。零一絕對不是沒能力做預(yù)訓(xùn)練,而是作為一個小公司,必須面對現(xiàn)實——你投入巨大的資源去做預(yù)訓(xùn)練,能不能做到self sustainable?是不是對投資人負(fù)責(zé)?
所以一個公司最終還是要去找到符合商業(yè)規(guī)律的生存之道。
王鐵震:對,我非常同意。我要補充一下,其實中國的research非常強,這兩年中國的大模型追得非??欤ㄗ罱腄eepSeek,甚至讓OpenAI都感到一些危機。
如果說中國跟美國的頭部模型存在一些差距,我覺得不能說是人的問題,主要還是因為資金的分配、公司的政策方向等等。像零一這樣的中國公司,有最優(yōu)秀的團(tuán)隊,有開復(fù)老師的領(lǐng)導(dǎo),那么如果給它像OpenAI一樣的資金,它絕對也能做出同樣好的產(chǎn)品。但是這樣的條件在中國是很稀缺的。
大部分中國公司,不可能把無止境的資金投入到一個非常燒錢的項目里。在“六小虎”中,所有人一開始都是to b也要做,to c也要做,to developer也要做,foundamental research也要做,但是很快大家就會發(fā)現(xiàn),我不可能每一件事情都做得好,每一件事情的競爭都是非常激烈的,我需要把所有的精力放到某一個自己很擅長的事情上面,才能做出最好的效果。
可能零一也經(jīng)歷了這樣一波周期,發(fā)現(xiàn)必須把全部精力集中在做APP,或者專注做to b。我覺得這完全沒有問題,因為很少有公司能夠像DeepSeek或者阿里巴巴一樣,有另外賺錢的業(yè)務(wù)去養(yǎng)活不賺錢的foundamental research。
所以我覺得國內(nèi)做預(yù)訓(xùn)練的公司會越來越少,其實是一個好事,是更好的資源調(diào)配。想做預(yù)訓(xùn)練的人也可以更集中,資金也可以更集中,可能最后只有四五家模型,但每家都可以得到非常多的資金支持,可以走得更遠(yuǎn)更好。
中國很多行業(yè)都走過了類似的路,比如說電動汽車、光伏,都經(jīng)歷了自然淘汰的過程,從無序競爭到有序收斂,這是一個市場比較理想的狀態(tài)。
觀察者網(wǎng):也就是說國內(nèi)的大廠也好,“六小虎”也好,在大模型能力上還沒有顯著差距。
王鐵震:我認(rèn)為還在牌桌上的玩家,水平都沒有太大的差距,有差距的自己已經(jīng)放棄了,所以牌桌上的玩家確實在減少。
林旅強:很多行業(yè)應(yīng)用,也未必非要去做預(yù)訓(xùn)練。例如百川很早就宣布把重點放在醫(yī)療,那么醫(yī)療大模型是不是一定需要做預(yù)訓(xùn)練?基于別人的基座大模型,拿行業(yè)數(shù)據(jù)去做后訓(xùn)練是不是足夠了?
所以退出牌桌的人,也不一定是失敗,而是調(diào)整。所有公司都要找到適合自己的路。
觀察者網(wǎng):那么當(dāng)初為什么大家一擁而上都去做預(yù)訓(xùn)練?是戰(zhàn)略選擇錯誤,還是擔(dān)心使用別人的模型,不是好的商業(yè)模式?
林旅強:首先,你要向資本市場講一個故事。2023年上半年,資本市場會覺得一個團(tuán)隊能做預(yù)訓(xùn)練,代表團(tuán)隊的能力是很扎實的。
另一個原因是當(dāng)時的基座模型還不夠強,后續(xù)去做fine-tune的效果也不好,所以只能自己去做基座。
現(xiàn)在,很多大模型效果已經(jīng)好到一定的程度,甚至10B以下的小模型都比當(dāng)時強很多了,對很多場景來說完全夠用了。所以大家不會再盲目追求超大模型。
王鐵震:對,剛開始的時候,你必須向資本市場證明自己的團(tuán)隊實力。只做fine-tune的團(tuán)隊,估值不會很高,后續(xù)做很多事情就會非常受限。而且最開始的那段時間,市場上資金是最充裕的,越往后融資越難,如果開始拿不到足夠資金,后面可能很快就死了。
還有很重要的一點,是對人才的爭奪。那個時候大模型人才是相當(dāng)稀缺的,很多公司都需要開出非常高的薪水挖人。
做預(yù)訓(xùn)練更有利于去培養(yǎng)自己的團(tuán)隊。如果只是做微調(diào),你只能看到世界的一小部分,只有懂預(yù)訓(xùn)練的人才能告訴你,一個問題到底應(yīng)該用預(yù)訓(xùn)練解決,還是后訓(xùn)練解決。
但在今天這個時間點,基于很多開源模型去做后訓(xùn)練,已經(jīng)能達(dá)到比較好的效果,預(yù)訓(xùn)練可能就更多是一種情懷了。
最好的大模型,未必要最強
觀察者網(wǎng):那么在今天這個時間點上,開源模型跟閉源模型的能力還有差距嗎?
林旅強:我想先correct一下這個問題本身。模型就是模型,不會因為它是開源或者閉源就更強或更弱,模型強弱跟是否開源是完全兩個維度的事情。
觀察者網(wǎng):但是最早Llama之所以選擇做開源,可能是因為它不夠強,要通過開源來搶市場。
林旅強:開源確實有利于搶占市場,但是它想搶市場,跟它夠不夠強,不能建立直接關(guān)系。現(xiàn)在DeepSeek也是開源,難道是因為它不夠強?所以我個人覺得Llama只是開源中一種情況,并不代表開源的本質(zhì)。
開源和閉源的參與者也是動態(tài)變化的,比如之前一直閉源的MiniMax,最近突然也做開源了,這并不只是取決于模型強弱。
王鐵震:這是一個經(jīng)常被問到的問題,最近我剛好也有一些新的想法。
首先就像前面提到的,沒有開源強的閉源模型已經(jīng)死掉了,所以結(jié)果就變成,閉源模型永遠(yuǎn)是大于等于開源模型。
之前我也覺得,開源模型跟最頭部的閉源模型相比,還是有非常大的差距。但是最近DeepSeek發(fā)布的成果,以及國內(nèi)在推理模型上面的進(jìn)展,都讓我覺得差距沒有那么大了,反而是OpenAI更應(yīng)該感到焦慮。
視頻生成模型也是一個很好的觀察角度。Sora是一個閉源模型,它剛出來的時候大家都驚嘆,中國跟它的差距非常大。但是現(xiàn)在大家驚嘆的反而是,Sora怎么一直都像個期貨,好像還不如中國的開源模型給力。
所以開源模型是可以很強的。但這個問題仍然很有價值,我會想問,如果開源模型廠商真的做出了比OpenAI更好的模型,它們還會不會繼續(xù)開源?整個開源生態(tài)本身已經(jīng)在收斂,如果再有更多廠商放棄開源預(yù)訓(xùn)練,對行業(yè)將是巨大損失,因為沒有市場競爭的話,很難保證大家都還愿意在這個牌桌上玩。
觀察者網(wǎng):所以仍然可以說,閉源模型大于等于開源模型?究竟有沒有哪家開源模型,能夠達(dá)到跟OpenAI差不多的能力?
林旅強:其實對于開發(fā)者跟行業(yè)來說,很多開源模型的能力是足夠的。那么在同等能力情況下,如果有開源的選擇,我一定選開源,因為性價比就是開源強。
所以你怎么去評判強不強?論性價比開源超強。你的問題其實暗含了一個假設(shè),認(rèn)為模型能力一定要達(dá)到最強,這件事情是很重要的。如果從科研角度或者公司估值的角度,追求最強確實是有意義的,但是從我們開發(fā)者角度,性價比高才能普及。
我舉個例子,PC端操作系統(tǒng),最強的肯定是Windows或者macOS,但是Linux對于全球行業(yè)的影響力或許更大。你看得到的機器上跑的都是Windows或者macOS,你看不到的機器上跑的基本都是Linux,后者的數(shù)量可能更多。
Linux甚至根本不需要一家公司去推動,它成立一個基金會,IBM、谷歌都會捐錢。每家捐幾百萬美元,就能換來持續(xù)可用的操作系統(tǒng),而且不會被人卡脖子。
所以究竟是Linux最強,還是macOS比較強,現(xiàn)在已經(jīng)沒有人care這一點了。
觀察者網(wǎng):有支持閉源的人,說開源模型是“智商稅”,認(rèn)為即使從成本來看,閉源也比開源要低。
林旅強:我尊重他們的選擇,但我不認(rèn)同這個結(jié)論,開源相比閉源成本一定是低的。因為購買一個閉源模型本身就是很大的支出,在此之外,開源不會比閉源增加任何成本。
王鐵震:一些現(xiàn)在做閉源的公司,其實在過去的時代也在做開源,對NLP、OCR等領(lǐng)域都有很大幫助。后來在大模型領(lǐng)域轉(zhuǎn)向閉源,雖然很可惜,但是一定是經(jīng)過了深思熟慮,甚至可能也有激烈的內(nèi)部討論。那么一旦選定了技術(shù)路線,對外也只能這樣說。
- 責(zé)任編輯: 張廣凱 
-
基金季報揭示神秘資金力挺A股:耗資千億增持,至今一股未賣
2025-01-23 16:43 觀網(wǎng)財經(jīng)-金融 -
國產(chǎn)“足球巨星”機器人來了
2025-01-23 16:27 人工智能 -
一箭18星!長六改火箭成功發(fā)射千帆極軌06組衛(wèi)星
2025-01-23 16:00 觀網(wǎng)財經(jīng)-科創(chuàng) -
字節(jié)啟動AGI長期研究計劃,代號Seed Edge
2025-01-23 11:34 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
1月136款游戲獲批,王者榮耀衍生作品拿下版號
2025-01-23 11:15 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
高端餐飲年度觀察|西餐日料承壓,中餐持續(xù)走強,高處不勝寒
2025-01-23 11:04 觀網(wǎng)財經(jīng)-消費 -
B站上線“小店”業(yè)務(wù),謀求商業(yè)化新機會
2025-01-23 10:01 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
吳清:力爭大型國有險企,每年新增保費的30%用于投資A股
2025-01-23 09:20 金融觀察 -
對抗OpenAI,谷歌向Anthropic追投10億美元
2025-01-22 17:17 人工智能 -
上線小程序,廣告反內(nèi)卷,?B站找到了商業(yè)化新藍(lán)海
2025-01-22 16:50 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
出售與輝同行后東方甄選虧近億元,新東方股價暴跌24%
2025-01-22 16:19 大公司 -
?12306重申加價搶票是忽悠,購票平臺為何還在賣“加速包”?
2025-01-22 15:22 -
華為數(shù)字能源多位高層變更,年營收超500億
2025-01-22 15:12 觀網(wǎng)財經(jīng)-科創(chuàng) -
特朗普都提名了哪些人來管理五角大樓?
2025-01-22 14:42 特朗普 -
超越協(xié)和,國產(chǎn)的超音速客機要來了?
2025-01-22 10:10 觀網(wǎng)財經(jīng)-科創(chuàng) -
國補后蘋果手機跌破3000元,iPhone16價格成全球最低
2025-01-22 09:44 觀網(wǎng)財經(jīng)-科創(chuàng) -
寒武紀(jì)遭前CTO訴訟索賠42.87億
2025-01-21 22:35 觀網(wǎng)財經(jīng)-科創(chuàng) -
萬億券商合并新進(jìn)展:海通證券、國泰君安宣布2月6日起停牌
2025-01-21 21:14 金融觀察 -
DeepSeek又有重大突破?一款未公開大模型展現(xiàn)驚人能力
2025-01-21 18:13 人工智能 -
餓了么推出九項舉措:讓“算法”成為騎手的“辦法”
2025-01-21 18:04 大公司
相關(guān)推薦 -
-
最新聞 Hot
-
“中國和墨西哥的堅實聯(lián)系,超越美國總統(tǒng)任期”
-
美國郵政:即日起,暫停接受中國內(nèi)地和香港的入境包裹
-
臺軍突然改革:臺北海軍陸戰(zhàn)隊轉(zhuǎn)型“御林軍”
-
谷歌遭反壟斷調(diào)查:在華還有哪些業(yè)務(wù)?因為啥?
-
馬斯克靠這6張娃娃臉發(fā)動“閃電戰(zhàn)”,美國嘩然
-
“特朗普幣”吸金近1億美元,近20萬散戶遭“收割”
-
CIA打頭陣,向全員提出“買斷”
-
“中方反擊較為克制,留了余地”
-
“反美聯(lián)盟正在形成!他拔槍就射,極其危險”
-
要起訴DeepSeek?他回應(yīng)了
-
賬對不上了…
-
普京:要不了多久,歐洲會繼續(xù)對特朗普“搖尾巴”
-
墜毀“黑鷹”女飛行員曾任拜登軍事社交助理,飛行時長450小時
-
特朗普承認(rèn):關(guān)稅也許會讓美國人“痛苦”
-
“史上最愚蠢的貿(mào)易戰(zhàn)!”
-
加拿大群情激奮:報復(fù)紅州,報復(fù)特斯拉!
-