-
對(duì)話|應(yīng)對(duì)卡脖子,開源是中國大模型安全的最優(yōu)解?
-
張廣凱13764468101
最后更新: 2025-01-23 16:49:09文/觀察者網(wǎng) 張廣凱
2025開年伊始,國內(nèi)大模型行業(yè)似乎正醞釀著一場劇烈的格局變動(dòng)。
一邊是零一萬物與阿里云達(dá)成合作,不再獨(dú)立追求超大模型的預(yù)訓(xùn)練;另一邊,以豆包為代表的大廠模型仍在快速進(jìn)化,“不差錢”的DeepSeek更是以創(chuàng)新架構(gòu),讓人看到超越OpenAI的可能性。
這似乎印證了一段時(shí)間以來的流言:國內(nèi)大模型企業(yè)將進(jìn)一步收斂,一些過去的頭部玩家也開始掉隊(duì)?
另一個(gè)有趣的現(xiàn)象是,此前一直走閉源路線的MiniMax,最近突然發(fā)布了自己的開源模型。開源是弱勢方爭奪市場的捷徑,還是本身就具備比閉源更好的商業(yè)邏輯閉環(huán)?
當(dāng)然,美國對(duì)中國愈加嚴(yán)厲的政策限制,一直都是不容忽視的巨大風(fēng)險(xiǎn)。國產(chǎn)大模型行業(yè)準(zhǔn)備好迎接進(jìn)一步脫鉤了嗎?
圍繞上述話題,我們邀請(qǐng)AI生態(tài)專家、曾任零一萬物開源及開發(fā)者生態(tài)負(fù)責(zé)人的林旅強(qiáng),以及Hugging Face工程師王鐵震進(jìn)行對(duì)話,收獲了不少新穎的觀點(diǎn)。
林旅強(qiáng)
王鐵震
摘要如下:
·中國大模型行業(yè)的研發(fā)能力與OpenAI沒有明顯差距,即使放棄預(yù)訓(xùn)練的團(tuán)隊(duì),也并非因?yàn)橛?xùn)練效果不佳,只是更好的商業(yè)選擇。
·隨著主流模型能力基本夠用,一味追求模型能力最強(qiáng)或許是個(gè)誤區(qū)。以操作系統(tǒng)為例,性價(jià)比才是大規(guī)模應(yīng)用的決定性因素。
·當(dāng)算力成本進(jìn)一步降低,開源模型的性價(jià)比將更加突出。
·開源的優(yōu)勢還在于更容易成為行業(yè)標(biāo)準(zhǔn)。
·開源的AI開發(fā)工具鏈,對(duì)大模型的國產(chǎn)化替代意義巨大。
以下為對(duì)話全文:
放棄預(yù)訓(xùn)練,不是能力不夠
觀察者網(wǎng):可以聊聊最近零一萬物預(yù)訓(xùn)練團(tuán)隊(duì)并入阿里的事嗎?這是不是意味著,國內(nèi)頭部大模型公司之間的能力已經(jīng)在分化,零一發(fā)現(xiàn)自己預(yù)訓(xùn)練的效果不夠好?
林旅強(qiáng):完全不是這樣的。零一的團(tuán)隊(duì)很強(qiáng),預(yù)訓(xùn)練出來的東西也很強(qiáng),去年5月發(fā)布的Yi-Large,10月發(fā)布的Yi-Lightning都很好,尤其是Yi-Lightning,可以說是當(dāng)時(shí)時(shí)間點(diǎn)上最強(qiáng)的之一。
但是模型強(qiáng)不強(qiáng),跟商業(yè)上能不能走通是兩回事。零一絕對(duì)不是沒能力做預(yù)訓(xùn)練,而是作為一個(gè)小公司,必須面對(duì)現(xiàn)實(shí)——你投入巨大的資源去做預(yù)訓(xùn)練,能不能做到self sustainable?是不是對(duì)投資人負(fù)責(zé)?
所以一個(gè)公司最終還是要去找到符合商業(yè)規(guī)律的生存之道。
王鐵震:對(duì),我非常同意。我要補(bǔ)充一下,其實(shí)中國的research非常強(qiáng),這兩年中國的大模型追得非??欤ㄗ罱腄eepSeek,甚至讓OpenAI都感到一些危機(jī)。
如果說中國跟美國的頭部模型存在一些差距,我覺得不能說是人的問題,主要還是因?yàn)橘Y金的分配、公司的政策方向等等。像零一這樣的中國公司,有最優(yōu)秀的團(tuán)隊(duì),有開復(fù)老師的領(lǐng)導(dǎo),那么如果給它像OpenAI一樣的資金,它絕對(duì)也能做出同樣好的產(chǎn)品。但是這樣的條件在中國是很稀缺的。
大部分中國公司,不可能把無止境的資金投入到一個(gè)非常燒錢的項(xiàng)目里。在“六小虎”中,所有人一開始都是to b也要做,to c也要做,to developer也要做,foundamental research也要做,但是很快大家就會(huì)發(fā)現(xiàn),我不可能每一件事情都做得好,每一件事情的競爭都是非常激烈的,我需要把所有的精力放到某一個(gè)自己很擅長的事情上面,才能做出最好的效果。
可能零一也經(jīng)歷了這樣一波周期,發(fā)現(xiàn)必須把全部精力集中在做APP,或者專注做to b。我覺得這完全沒有問題,因?yàn)楹苌儆泄灸軌蛳馜eepSeek或者阿里巴巴一樣,有另外賺錢的業(yè)務(wù)去養(yǎng)活不賺錢的foundamental research。
所以我覺得國內(nèi)做預(yù)訓(xùn)練的公司會(huì)越來越少,其實(shí)是一個(gè)好事,是更好的資源調(diào)配。想做預(yù)訓(xùn)練的人也可以更集中,資金也可以更集中,可能最后只有四五家模型,但每家都可以得到非常多的資金支持,可以走得更遠(yuǎn)更好。
中國很多行業(yè)都走過了類似的路,比如說電動(dòng)汽車、光伏,都經(jīng)歷了自然淘汰的過程,從無序競爭到有序收斂,這是一個(gè)市場比較理想的狀態(tài)。
觀察者網(wǎng):也就是說國內(nèi)的大廠也好,“六小虎”也好,在大模型能力上還沒有顯著差距。
王鐵震:我認(rèn)為還在牌桌上的玩家,水平都沒有太大的差距,有差距的自己已經(jīng)放棄了,所以牌桌上的玩家確實(shí)在減少。
林旅強(qiáng):很多行業(yè)應(yīng)用,也未必非要去做預(yù)訓(xùn)練。例如百川很早就宣布把重點(diǎn)放在醫(yī)療,那么醫(yī)療大模型是不是一定需要做預(yù)訓(xùn)練?基于別人的基座大模型,拿行業(yè)數(shù)據(jù)去做后訓(xùn)練是不是足夠了?
所以退出牌桌的人,也不一定是失敗,而是調(diào)整。所有公司都要找到適合自己的路。
觀察者網(wǎng):那么當(dāng)初為什么大家一擁而上都去做預(yù)訓(xùn)練?是戰(zhàn)略選擇錯(cuò)誤,還是擔(dān)心使用別人的模型,不是好的商業(yè)模式?
林旅強(qiáng):首先,你要向資本市場講一個(gè)故事。2023年上半年,資本市場會(huì)覺得一個(gè)團(tuán)隊(duì)能做預(yù)訓(xùn)練,代表團(tuán)隊(duì)的能力是很扎實(shí)的。
另一個(gè)原因是當(dāng)時(shí)的基座模型還不夠強(qiáng),后續(xù)去做fine-tune的效果也不好,所以只能自己去做基座。
現(xiàn)在,很多大模型效果已經(jīng)好到一定的程度,甚至10B以下的小模型都比當(dāng)時(shí)強(qiáng)很多了,對(duì)很多場景來說完全夠用了。所以大家不會(huì)再盲目追求超大模型。
王鐵震:對(duì),剛開始的時(shí)候,你必須向資本市場證明自己的團(tuán)隊(duì)實(shí)力。只做fine-tune的團(tuán)隊(duì),估值不會(huì)很高,后續(xù)做很多事情就會(huì)非常受限。而且最開始的那段時(shí)間,市場上資金是最充裕的,越往后融資越難,如果開始拿不到足夠資金,后面可能很快就死了。
還有很重要的一點(diǎn),是對(duì)人才的爭奪。那個(gè)時(shí)候大模型人才是相當(dāng)稀缺的,很多公司都需要開出非常高的薪水挖人。
做預(yù)訓(xùn)練更有利于去培養(yǎng)自己的團(tuán)隊(duì)。如果只是做微調(diào),你只能看到世界的一小部分,只有懂預(yù)訓(xùn)練的人才能告訴你,一個(gè)問題到底應(yīng)該用預(yù)訓(xùn)練解決,還是后訓(xùn)練解決。
但在今天這個(gè)時(shí)間點(diǎn),基于很多開源模型去做后訓(xùn)練,已經(jīng)能達(dá)到比較好的效果,預(yù)訓(xùn)練可能就更多是一種情懷了。
最好的大模型,未必要最強(qiáng)
觀察者網(wǎng):那么在今天這個(gè)時(shí)間點(diǎn)上,開源模型跟閉源模型的能力還有差距嗎?
林旅強(qiáng):我想先correct一下這個(gè)問題本身。模型就是模型,不會(huì)因?yàn)樗情_源或者閉源就更強(qiáng)或更弱,模型強(qiáng)弱跟是否開源是完全兩個(gè)維度的事情。
觀察者網(wǎng):但是最早Llama之所以選擇做開源,可能是因?yàn)樗粔驈?qiáng),要通過開源來搶市場。
林旅強(qiáng):開源確實(shí)有利于搶占市場,但是它想搶市場,跟它夠不夠強(qiáng),不能建立直接關(guān)系?,F(xiàn)在DeepSeek也是開源,難道是因?yàn)樗粔驈?qiáng)?所以我個(gè)人覺得Llama只是開源中一種情況,并不代表開源的本質(zhì)。
開源和閉源的參與者也是動(dòng)態(tài)變化的,比如之前一直閉源的MiniMax,最近突然也做開源了,這并不只是取決于模型強(qiáng)弱。
王鐵震:這是一個(gè)經(jīng)常被問到的問題,最近我剛好也有一些新的想法。
首先就像前面提到的,沒有開源強(qiáng)的閉源模型已經(jīng)死掉了,所以結(jié)果就變成,閉源模型永遠(yuǎn)是大于等于開源模型。
之前我也覺得,開源模型跟最頭部的閉源模型相比,還是有非常大的差距。但是最近DeepSeek發(fā)布的成果,以及國內(nèi)在推理模型上面的進(jìn)展,都讓我覺得差距沒有那么大了,反而是OpenAI更應(yīng)該感到焦慮。
視頻生成模型也是一個(gè)很好的觀察角度。Sora是一個(gè)閉源模型,它剛出來的時(shí)候大家都驚嘆,中國跟它的差距非常大。但是現(xiàn)在大家驚嘆的反而是,Sora怎么一直都像個(gè)期貨,好像還不如中國的開源模型給力。
所以開源模型是可以很強(qiáng)的。但這個(gè)問題仍然很有價(jià)值,我會(huì)想問,如果開源模型廠商真的做出了比OpenAI更好的模型,它們還會(huì)不會(huì)繼續(xù)開源?整個(gè)開源生態(tài)本身已經(jīng)在收斂,如果再有更多廠商放棄開源預(yù)訓(xùn)練,對(duì)行業(yè)將是巨大損失,因?yàn)闆]有市場競爭的話,很難保證大家都還愿意在這個(gè)牌桌上玩。
觀察者網(wǎng):所以仍然可以說,閉源模型大于等于開源模型?究竟有沒有哪家開源模型,能夠達(dá)到跟OpenAI差不多的能力?
林旅強(qiáng):其實(shí)對(duì)于開發(fā)者跟行業(yè)來說,很多開源模型的能力是足夠的。那么在同等能力情況下,如果有開源的選擇,我一定選開源,因?yàn)樾詢r(jià)比就是開源強(qiáng)。
所以你怎么去評(píng)判強(qiáng)不強(qiáng)?論性價(jià)比開源超強(qiáng)。你的問題其實(shí)暗含了一個(gè)假設(shè),認(rèn)為模型能力一定要達(dá)到最強(qiáng),這件事情是很重要的。如果從科研角度或者公司估值的角度,追求最強(qiáng)確實(shí)是有意義的,但是從我們開發(fā)者角度,性價(jià)比高才能普及。
我舉個(gè)例子,PC端操作系統(tǒng),最強(qiáng)的肯定是Windows或者macOS,但是Linux對(duì)于全球行業(yè)的影響力或許更大。你看得到的機(jī)器上跑的都是Windows或者macOS,你看不到的機(jī)器上跑的基本都是Linux,后者的數(shù)量可能更多。
Linux甚至根本不需要一家公司去推動(dòng),它成立一個(gè)基金會(huì),IBM、谷歌都會(huì)捐錢。每家捐幾百萬美元,就能換來持續(xù)可用的操作系統(tǒng),而且不會(huì)被人卡脖子。
所以究竟是Linux最強(qiáng),還是macOS比較強(qiáng),現(xiàn)在已經(jīng)沒有人care這一點(diǎn)了。
觀察者網(wǎng):有支持閉源的人,說開源模型是“智商稅”,認(rèn)為即使從成本來看,閉源也比開源要低。
林旅強(qiáng):我尊重他們的選擇,但我不認(rèn)同這個(gè)結(jié)論,開源相比閉源成本一定是低的。因?yàn)橘徺I一個(gè)閉源模型本身就是很大的支出,在此之外,開源不會(huì)比閉源增加任何成本。
王鐵震:一些現(xiàn)在做閉源的公司,其實(shí)在過去的時(shí)代也在做開源,對(duì)NLP、OCR等領(lǐng)域都有很大幫助。后來在大模型領(lǐng)域轉(zhuǎn)向閉源,雖然很可惜,但是一定是經(jīng)過了深思熟慮,甚至可能也有激烈的內(nèi)部討論。那么一旦選定了技術(shù)路線,對(duì)外也只能這樣說。
開源的好時(shí)代還在后面
觀察者網(wǎng):大模型的開源方式,跟Linux這樣的傳統(tǒng)開源方式也有很大區(qū)別。
林旅強(qiáng):完全不一樣,現(xiàn)在的開源大模型并沒有把關(guān)鍵素材開放出來。
Open Source的基本邏輯,第一是透明,第二是可復(fù)現(xiàn)。但大部分開源模型的tech report都不夠透明,比如用了什么樣的數(shù)據(jù)集,這是各家的秘方,是不可能拿出來的。
傳統(tǒng)的開源軟件,所有代碼都會(huì)公開在GitHub上,你能夠完全去復(fù)現(xiàn)這套軟件,并且做出進(jìn)一步貢獻(xiàn)。比如你發(fā)現(xiàn)一個(gè)bug,可以去提交修復(fù)。但所謂的開源大模型,仍然是一個(gè)黑盒子,我無法去修改這個(gè)黑盒子,無法改善它,只能夠基于它去做后訓(xùn)練。所以它更像是開源和閉源之間的一個(gè)中間態(tài)。
真正開源的大模型,其實(shí)Hugging Face上也是有的,比如BigScience項(xiàng)目,可以給出完全開源的數(shù)據(jù)集和訓(xùn)練代碼,但是大部分開源模型做不到這一點(diǎn),我認(rèn)為把它們叫做開放模型更合適。
觀察者網(wǎng):真正意義上Open Source的開源模型團(tuán)隊(duì)有哪些,主要在國外嗎?
王鐵震:這是一個(gè)很有意思的現(xiàn)象,國內(nèi)做開源的主要是大公司,或者能拿到國家資助的學(xué)術(shù)機(jī)構(gòu),而在海外有很多自發(fā)的組織,他們可能只是依靠一些捐贈(zèng),或者就是幾個(gè)學(xué)生做著玩,然后得到一些企業(yè)幫助。
據(jù)我了解,國內(nèi)真正滿足開源標(biāo)準(zhǔn)的團(tuán)隊(duì),主要有兩個(gè)。一個(gè)是RWKV(元始智能),他們最早用Stable Diffusion的幾百張卡一直在默默做預(yù)訓(xùn)練,現(xiàn)在也逐漸開始尋求商業(yè)轉(zhuǎn)化。另一個(gè)是MAP,他們是一個(gè)虛擬的在線組織,成員主要是國內(nèi)大廠的研發(fā)人員,會(huì)進(jìn)行一些跨機(jī)構(gòu)的合作,發(fā)布過真開源的模型MAP-NEO,以及春運(yùn)數(shù)據(jù)集等等。
海外的開源大模型團(tuán)隊(duì)大家可能更熟悉,除了Hugging Face的項(xiàng)目,還有艾倫AI研究院(Allen Institute for AI),后者得到了蓋茨基金會(huì)的支持。
觀察者網(wǎng):真開源項(xiàng)目少,是不是大模型的訓(xùn)練成本過高造成的?因?yàn)榧词归_放出來也很少有人能去復(fù)現(xiàn)。大模型領(lǐng)域不太可能產(chǎn)生類似開源軟件的生態(tài)?
林旅強(qiáng):對(duì),我們回過頭看Linux生態(tài)是怎么長出來的,一個(gè)重要原因是個(gè)人電腦很便宜。
最早發(fā)起自由軟件運(yùn)動(dòng)的人,理查德·斯托曼,當(dāng)時(shí)在MIT的人工智能實(shí)驗(yàn)室任職。他認(rèn)為軟件應(yīng)該是自由開源的,可是當(dāng)時(shí)的電腦太貴,他在實(shí)驗(yàn)室里想要做軟件編譯,都得排隊(duì)去申請(qǐng)使用電腦,就像今天的大模型研究者排隊(duì)求分配顯卡,這種資源稀缺的情況是無法做開源的。
到Linux出來的時(shí)候,PC已經(jīng)便宜到讓野生開發(fā)者都能夠在自己家里面寫代碼,這是摩爾定律帶來的算力民主化。
所以我認(rèn)為當(dāng)下的 AI大模型,還處在當(dāng)年的實(shí)驗(yàn)室階段。等到算力成本繼續(xù)降低,AIPC能夠讓每一個(gè)人在自己家里就能跑得起大模型,或者訓(xùn)練一些小模型,開源的百花齊放就會(huì)來臨。
觀察者網(wǎng):摩爾定律在GPU領(lǐng)域還能繼續(xù)有效嗎?
王鐵震:討論摩爾定律,一方面我們可以期待下一個(gè)世代的硬件進(jìn)步,甚至量子計(jì)算有怎樣的前景。另一方面,軟件或許也有一些辦法能夠讓摩爾定律延續(xù),比如MiniMax、RWKV嘗試的Linear Attention(線性注意力機(jī)制),就是降低算力成本的另一條途徑。
其實(shí)芯片領(lǐng)域的摩爾定律之所以一直能延續(xù),不是因?yàn)樽钤绲募夹g(shù)能一直延續(xù),而是行業(yè)在不停地變換技術(shù)棧,尋找摩爾定律的新的解釋方式。我覺得AI行業(yè)肯定也能做到這一點(diǎn),比如用更小的模型就能獲得現(xiàn)在很大模型的效果,或者用超越傳統(tǒng)Transformer的架構(gòu)來取得對(duì)算力需求的數(shù)量級(jí)下降。甚至未來是不是可能專門為大模型設(shè)計(jì)一種ASIC,效率遠(yuǎn)遠(yuǎn)超越通用GPU。
所以我們不用太悲觀,至少現(xiàn)在英偉達(dá)的GPU還在快速進(jìn)步,未來也有很多替代路線可以探索。
開源是一場標(biāo)準(zhǔn)之爭
觀察者網(wǎng):即使解決了成本問題,做開源模型的回報(bào)在哪里?一些大廠,比如阿里云、字節(jié),可以用其他業(yè)務(wù)變現(xiàn)。但是像“六小虎”這樣的企業(yè),為什么要開源?
林旅強(qiáng):每一個(gè)企業(yè)做開源,一定是符合商業(yè)理性的,一定要能促成他的商業(yè)邏輯閉環(huán)。我不認(rèn)為開源只是靠情懷。
扎克伯格當(dāng)初寫了一篇文章,解釋為什么要把Llama開源。文章標(biāo)題是Open Source AI Is the Path Forward,開源是未來之道。
扎克伯格表達(dá)了兩個(gè)觀點(diǎn):一是開源能夠避免重復(fù)造輪子,把自己的一些成功拿出來給大家用,能夠降低整個(gè)行業(yè)的研發(fā)成本;二是開源也有助于形成行業(yè)標(biāo)準(zhǔn)。
我想大企業(yè)做開源,真正的動(dòng)機(jī)肯定不只是第一點(diǎn),幫別人省錢。而是這個(gè)錢省了之后,他就會(huì)落入到我的生態(tài)系統(tǒng),他的根就在我這邊,我在這個(gè)生態(tài)系統(tǒng)里擁有絕對(duì)影響力。那么以后這個(gè)行業(yè)的基礎(chǔ)設(shè)施和技術(shù)路線,都是要跟我掛鉤的。
從商業(yè)的角度來講,標(biāo)準(zhǔn)等于壟斷,制定標(biāo)準(zhǔn)的人賺最多錢。
我曾經(jīng)在華為從事開源項(xiàng)目,華為為什么做那么多開源?第一他不想被卡脖子,第二他也希望能定出標(biāo)準(zhǔn)。華為的開源項(xiàng)目是放在產(chǎn)業(yè)與標(biāo)準(zhǔn)部門里的。過去在通信領(lǐng)域,像3G、4G、5G,或者藍(lán)牙這樣的通信協(xié)議,是有行業(yè)聯(lián)盟來制定標(biāo)準(zhǔn)的。但是到了軟件領(lǐng)域,華為發(fā)現(xiàn)沒辦法做聯(lián)盟,開源形成的事實(shí)上的標(biāo)準(zhǔn),把聯(lián)盟壟斷的路子都給斷了,搞標(biāo)準(zhǔn)只能從開源切入。
觀察者網(wǎng):零一為什么要做開源?
林旅強(qiáng):對(duì)一些企業(yè)來說,做開源也有秀肌肉的作用。通過一個(gè)很厲害的產(chǎn)品,讓市場認(rèn)識(shí)一家公司,這是后進(jìn)者能夠讓自己傳播的一種方式。
還有很多企業(yè),會(huì)同時(shí)做開源免費(fèi)版和商業(yè)收費(fèi)版兩種產(chǎn)品。通過開源的方式,能更快得到客戶,然后只要開源免費(fèi)版的基礎(chǔ)夠大,我也可以通過一些產(chǎn)品設(shè)計(jì),滿足更多的商業(yè)訴求,變成付費(fèi)版本。
在國內(nèi)主流的大模型公司里,零一已經(jīng)算是入局比較晚的,所以必須開源。但我加入零一,首先是因?yàn)樗麄兊哪P妥銐驈?qiáng),因?yàn)殚_源生態(tài)非常依賴于產(chǎn)品強(qiáng)不強(qiáng)。
零一選擇了開源閉源并進(jìn)的策略,認(rèn)為最強(qiáng)的模型必須是閉源的,同時(shí)也去建設(shè)開源生態(tài)。但這未必是大模型開源的唯一解,有時(shí)也會(huì)讓客戶感到矛盾。通義千問全部做開源,其實(shí)也是很好的思路。
觀察者網(wǎng):對(duì)客戶來說,開源的安全性會(huì)是個(gè)問題嗎?
林旅強(qiáng):包括央國企在內(nèi)的大模型招標(biāo),通常不會(huì)在標(biāo)書上要求是開源還是閉源。開源完全能夠滿足安全性的要求。因?yàn)榘踩灾饕蝗Q于開源閉源,它們都是黑盒子,沒有區(qū)別。安全性主要靠大量的測試,比如做各種滲透測試,或者紅軍藍(lán)軍對(duì)抗。
王鐵震:其實(shí)從安全的角度上來講,開源模型反而能允許你做更多的測試,而且這些攻擊行為不會(huì)被泄露到第三方。從這個(gè)角度上來講,開源模型實(shí)際上更安全。
林旅強(qiáng):沒錯(cuò),很多白帽黑客可以自己去拿開源模型做攻擊測試,把結(jié)果在行業(yè)中交流,讓大家知道如何防范。但是你不能去攻擊一個(gè)閉源模型,這是違法的。
開源圈內(nèi)有句話,只要眼球足夠多,所有bug都現(xiàn)形,對(duì)大模型也是適用的。
應(yīng)對(duì)卡脖子,開源工具鏈也很重要
觀察者網(wǎng):還有另一個(gè)維度的安全性,人們會(huì)擔(dān)心一家商業(yè)公司控制的大模型未必符合公共利益,提出了“對(duì)齊”的概念。開源模型有助于“對(duì)齊”嗎?
林旅強(qiáng):所有模型都會(huì)承載一些價(jià)值觀,會(huì)對(duì)用戶產(chǎn)生特定的影響,這是一定會(huì)發(fā)生的事情。開源模型會(huì)成為整個(gè)價(jià)值觀光譜中很好的補(bǔ)充,但未必一定要靠開源。在一個(gè)好的市場中,社會(huì)價(jià)值觀本身就是相互沖突和平衡的,市場的力量自然也會(huì)讓大模型取得平衡。
政治因素也會(huì)產(chǎn)生影響,李開復(fù)老師也說過一個(gè)概念,叫做一國一模型,每個(gè)國家的法律不同,道德觀念不同,大模型也是要經(jīng)過一些調(diào)整的。
王鐵震:開源能給大家更多的選擇,每個(gè)國家、每一個(gè)人都可以根據(jù)自己的需求去做定制模型,那么實(shí)際上是一種技術(shù)普惠。
其實(shí)大家選擇模型的時(shí)候會(huì)有很多不同考慮。前段時(shí)間國外網(wǎng)友有個(gè)帖子,說通義千問很好,但是我不能用。因?yàn)閲夤疽矔?huì)有一些policy,不允許使用中國模型。
觀察者網(wǎng):地緣政治正在成為更大的威脅。如果美國加強(qiáng)對(duì)中國的GPU和大模型制裁,開源對(duì)國產(chǎn)化有什么幫助?
林旅強(qiáng):我不是地緣政治專家,但我覺得“卡脖子”是必然要發(fā)生的事,因?yàn)槊绹鵁o論哪個(gè)黨執(zhí)政,對(duì)中國的政策都沒有太大區(qū)別了。既然他要搞,我們就要因應(yīng),國產(chǎn)化芯片能夠接得住的地方,就要全面導(dǎo)向國產(chǎn)化,接不住的地方也要尋找迂回的方式。
當(dāng)然美國也是一個(gè)很多力量在拉扯的的國家,像英偉達(dá)這樣的大企業(yè)也有動(dòng)機(jī)去阻止禁令,也會(huì)對(duì)結(jié)果產(chǎn)生影響。
王鐵震:如果說大模型層面,其實(shí)得益于開源工具鏈的發(fā)展,現(xiàn)在模型之間的切換是比較容易的。如果你要換用一個(gè)新模型,只要把prompt調(diào)整一下,把模型ID換一下就好了。除非一些架構(gòu)比較獨(dú)特的模型,比如DeepSeek,因?yàn)樗ぞ哝溕系募嫒莶煌陚洌蠹蚁胍阉咝阅艿嘏芷饋磉€是有一些困難。
在AI基礎(chǔ)框架上,百度做過一些很好的工作,比如開源的PaddlePaddle(飛槳)是國內(nèi)最好的AI框架之一。只可惜百度在大模型時(shí)代沒有繼續(xù)走開源路線,否則在大模型的加持下,PaddlePaddle生態(tài)會(huì)有更加巨大的發(fā)展。
林旅強(qiáng):我認(rèn)為PaddlePaddle就是中國第一的AI框架,但華為的開源框架MindSpore(昇思)現(xiàn)在有很好的機(jī)會(huì),因?yàn)槿A為只要決定做,哪怕慢一點(diǎn),也會(huì)堅(jiān)持下去。
AI從硬件到軟件,大致可以分為4層,華為都有布局。芯片層面的昇騰,對(duì)標(biāo)英偉達(dá)CUDA的CANN計(jì)算架構(gòu),然后就是MindSpore,以及最后的模型層。
華為目前的模型能力不是最好的,但是如果能把從下到上的整個(gè)stack做起來,還是會(huì)非常厲害。
不過雖然華為有開源框架,但它整個(gè)生態(tài)可能還是封閉的,有利于獨(dú)占商業(yè)化回報(bào),別人是不愿意加入的。
觀察者網(wǎng):華為能夠從哪些方面更好地幫助國內(nèi)開源生態(tài)嗎?
林旅強(qiáng):舉個(gè)例子,零一萬物跟昇騰就有過合作。其實(shí)在很早之前,昇騰的朋友就來問過我們,能不能把零一的開源模型拿到昇騰上。我們不反對(duì)別人把模型拿過去,但問題在于,我們本來就是開源的,沒有收入,如果還要來自己花人力去適配昇騰,最后昇騰大賣,我們能夠得到什么回報(bào)?
這其實(shí)不是華為一家的問題。熟悉海外開源生態(tài)的人都知道,做開源不能只讓開發(fā)者去奉獻(xiàn),他們一定需要得到某種回報(bào)。國內(nèi)的開源生態(tài)建設(shè),還有很多需要提升的地方。
- 責(zé)任編輯: 張廣凱 
-
基金季報(bào)揭示神秘資金力挺A股:耗資千億增持,至今一股未賣
2025-01-23 16:43 觀網(wǎng)財(cái)經(jīng)-金融 -
國產(chǎn)“足球巨星”機(jī)器人來了
2025-01-23 16:27 人工智能 -
一箭18星!長六改火箭成功發(fā)射千帆極軌06組衛(wèi)星
2025-01-23 16:00 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
1月136款游戲獲批,王者榮耀衍生作品拿下版號(hào)
2025-01-23 11:15 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
高端餐飲年度觀察|西餐日料承壓,中餐持續(xù)走強(qiáng),高處不勝寒
2025-01-23 11:04 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
吳清:力爭大型國有險(xiǎn)企,每年新增保費(fèi)的30%用于投資A股
2025-01-23 09:20 金融觀察 -
對(duì)抗OpenAI,谷歌向Anthropic追投10億美元
2025-01-22 17:17 人工智能 -
-
出售與輝同行后東方甄選虧近億元,新東方股價(jià)暴跌24%
2025-01-22 16:19 大公司 -
?12306重申加價(jià)搶票是忽悠,購票平臺(tái)為何還在賣“加速包”?
2025-01-22 15:22 -
華為數(shù)字能源多位高層變更,年?duì)I收超500億
2025-01-22 15:12 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
特朗普都提名了哪些人來管理五角大樓?
2025-01-22 14:42 特朗普 -
超越協(xié)和,國產(chǎn)的超音速客機(jī)要來了?
2025-01-22 10:10 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
寒武紀(jì)遭前CTO訴訟索賠42.87億
2025-01-21 22:35 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
萬億券商合并新進(jìn)展:海通證券、國泰君安宣布2月6日起停牌
2025-01-21 21:14 金融觀察 -
DeepSeek又有重大突破?一款未公開大模型展現(xiàn)驚人能力
2025-01-21 18:13 人工智能 -
餓了么推出九項(xiàng)舉措:讓“算法”成為騎手的“辦法”
2025-01-21 18:04 大公司
相關(guān)推薦 -
-
“中方清單上的每一項(xiàng),都瞄準(zhǔn)要害” 評(píng)論 26“特朗普不代表所有美國人,請(qǐng)別報(bào)復(fù)我們州” 評(píng)論 252中柬云壤港聯(lián)合保障和訓(xùn)練中心正式掛牌運(yùn)行 評(píng)論 157美股蒸發(fā)超5萬億美元,“95年來最大政策失誤” 評(píng)論 360美國人瘋狂囤貨,“中國電視被買空” 評(píng)論 232最新聞 Hot
-
“中方清單上的每一項(xiàng),都瞄準(zhǔn)要害”
-
罕見!黨內(nèi)盟友與特朗普唱反調(diào):明年我們可能面臨“血洗”
-
“崇拜了美國這么多年,我們還能信什么?”
-
“特朗普不代表所有美國人,請(qǐng)別報(bào)復(fù)我們州”
-
中柬掛牌,洪瑪奈感謝中國
-
特朗普轉(zhuǎn)發(fā)“巴菲特支持特朗普經(jīng)濟(jì)政策”,巴菲特回應(yīng)了
-
演都不演了,特朗普顧問直說:阿根廷得結(jié)束這份中國協(xié)議,不然…
-
中柬云壤港聯(lián)合保障和訓(xùn)練中心正式掛牌運(yùn)行
-
這一重大科研裝置,成功部署!
-
美媒關(guān)注:辛辣回?fù)籼乩势贞P(guān)稅,中國媒體用上AI歌曲和短片
-
特朗普再要求降息,鮑威爾:關(guān)稅遠(yuǎn)超預(yù)期,再等等
-
美股蒸發(fā)超5萬億美元,“95年來最大政策失誤”
-
萬斯:歐洲最大威脅不是中俄
-
魯比奧辯解:美國需要回到制造業(yè)時(shí)代
-
在美烏克蘭人限期7日離境?美官方:發(fā)錯(cuò)了
-
美股“血流成河”,特朗普選擇…去打高爾夫球
-