-
金鐘:OpenAI大內(nèi)斗,對(duì)中國(guó)AI大模型發(fā)展有哪些啟示?
【文/觀察者網(wǎng)專(zhuān)欄作者 金鐘】
相信大家這幾天已經(jīng)吃飽了關(guān)于美國(guó)科技新星企業(yè)OpenAI內(nèi)部人事斗爭(zhēng)的大瓜了。短短幾天內(nèi),公司創(chuàng)始人阿爾特曼被董事會(huì)開(kāi)除,跳槽入職微軟,最后再勝利歸來(lái),驅(qū)逐了其他董事會(huì)成員。劇情一波三折,演員表現(xiàn)自然,臺(tái)詞真情投入,好萊塢大片也不過(guò)如此。
11月23日又有爆料稱(chēng),阿爾特曼被解雇之前,幾名研究人員向公司董事會(huì)發(fā)出了一封信,警告一項(xiàng)被稱(chēng)為“Q*”的人工智能可能威脅到人類(lèi)。這封信件也是促使董事會(huì)罷免Altman的原因之一。對(duì)此,阿爾特曼和OpenAI公司還沒(méi)有回應(yīng),相信未來(lái)我們還會(huì)看到更多的幕后故事。
拋開(kāi)八卦不提,OpenAI內(nèi)部激烈的權(quán)力斗爭(zhēng)背后是今年以來(lái)狂熱的AI市場(chǎng)迅猛發(fā)展,各方都已經(jīng)認(rèn)準(zhǔn)了這個(gè)利益廣闊的投資風(fēng)口,才導(dǎo)致對(duì)行業(yè)當(dāng)前的領(lǐng)頭羊企業(yè)的控制權(quán)進(jìn)行如此激烈的爭(zhēng)奪。
在OpenAI的人事斗爭(zhēng)背景下,AI淘金熱潮中最關(guān)鍵的“賣(mài)鏟子”的芯片企業(yè)英偉達(dá)發(fā)布第三季度財(cái)報(bào),在AI芯片和游戲芯片需求高漲的推動(dòng)下,英偉達(dá)三季度收入達(dá)到去年同期的3倍。但是美國(guó)政府最新的芯片禁運(yùn)命令,將導(dǎo)致相當(dāng)一部分以前可以出售給中國(guó)的芯片將無(wú)法繼續(xù)賣(mài)給國(guó)內(nèi)企業(yè)。
美國(guó)政府從去年開(kāi)始對(duì)國(guó)內(nèi)的芯片禁運(yùn)已經(jīng)升級(jí)過(guò)好幾輪了,雖然每一次英偉達(dá)等歐美芯片企業(yè)都會(huì)研發(fā)出一些針對(duì)中國(guó)需求的特供版芯片,以此繞過(guò)禁運(yùn)措施,但是這些特供版芯片和歐美科技企業(yè)拿到的AI芯片,在性能上有著相當(dāng)大的差距。直觀的說(shuō),AI芯片的性能關(guān)系到運(yùn)行大語(yǔ)言模型時(shí)候的計(jì)算能力,算力的差距直接帶來(lái)的就是運(yùn)算時(shí)間和運(yùn)算所需要的能源消耗之間的差距。這也是美國(guó)芯片禁運(yùn)的主要目的,阻礙國(guó)內(nèi)企業(yè)訓(xùn)練、發(fā)展自己AI大語(yǔ)言模型的速度。
那么美國(guó)禁運(yùn)AI芯片,對(duì)AI大語(yǔ)言模型在國(guó)內(nèi)的應(yīng)用到底影響有多大呢?
根據(jù)當(dāng)前已知的AI大語(yǔ)言模型應(yīng)用情況,我們可以粗略地將大語(yǔ)言模型的應(yīng)用分成兩類(lèi),一類(lèi)是“to B”即企業(yè)應(yīng)用場(chǎng)景,另一類(lèi)則是“to C”即通用消費(fèi)者應(yīng)用場(chǎng)景。
目前大語(yǔ)言模型在企業(yè)應(yīng)用場(chǎng)景中最有前途的用途是什么?我們還是可以從今天最受追捧的“賣(mài)AI鏟子”的企業(yè)英偉達(dá)身上找答案。
在10月底到11月初美國(guó)電子電氣工程師學(xué)會(huì)(Institute of Electrical and Electronics Engineers,IEEE)的一個(gè)國(guó)際會(huì)議上,英偉達(dá)首席科技官在主題演講中詳細(xì)描述了英偉達(dá)是如何開(kāi)發(fā)一個(gè)公司內(nèi)部專(zhuān)用的大語(yǔ)言模型。
英偉達(dá)自用的大語(yǔ)言模型,數(shù)據(jù)來(lái)源于自身過(guò)去30年積累的代碼、程序文檔、芯片設(shè)計(jì)文檔、測(cè)試結(jié)果、糾錯(cuò)報(bào)告以及內(nèi)部技術(shù)討論的通訊記錄等等,而發(fā)展自用AI模型,則是希望通過(guò)訓(xùn)練大語(yǔ)言模型達(dá)到三個(gè)目的:
第一是建立一個(gè)面對(duì)年輕工程師的內(nèi)部機(jī)器人,通過(guò)理解年輕工程師的提問(wèn)并從過(guò)去的資料數(shù)據(jù)中尋找答案,讓年輕工程師可以從內(nèi)部機(jī)器人這里獲得大部分技術(shù)問(wèn)題的正確解答,減輕有經(jīng)驗(yàn)的資深工程師答疑的負(fù)擔(dān),從而讓那些經(jīng)驗(yàn)豐富的工程師可以更多的將工作時(shí)間集中在開(kāi)發(fā)新產(chǎn)品這些更有創(chuàng)造性的工作上。
第二個(gè)目的則是簡(jiǎn)化芯片設(shè)計(jì)流程,減少在芯片設(shè)計(jì)和測(cè)試時(shí)編寫(xiě)復(fù)雜代碼的需要。
第三個(gè)目的則是簡(jiǎn)化在芯片測(cè)試過(guò)程中的報(bào)錯(cuò)和糾錯(cuò)分析報(bào)告,讓以往長(zhǎng)達(dá)幾十頁(yè)的復(fù)雜報(bào)錯(cuò)報(bào)告簡(jiǎn)化成幾個(gè)自然段,并針對(duì)技術(shù)人員和管理人員提供不同的測(cè)試報(bào)告總結(jié)。
英偉達(dá)的AI芯片目前是各家AI模型研發(fā)不可或缺的基建產(chǎn)品,這家公司對(duì)于如何應(yīng)用大語(yǔ)言模型來(lái)提高企業(yè)生產(chǎn)力的決策和選擇,對(duì)于其他企業(yè)思考如何在內(nèi)部工作中應(yīng)用大語(yǔ)言模型有著很大的啟示意義。
簡(jiǎn)單總結(jié)一下,我們可以發(fā)現(xiàn)當(dāng)前水平下,大語(yǔ)言模型對(duì)于提高那些知識(shí)密集型行業(yè)或者企業(yè)的生產(chǎn)力,效果是最好的。這個(gè)提高生產(chǎn)力的關(guān)鍵點(diǎn)就是幫助知識(shí)型企業(yè)內(nèi)部更有效率地分配最重要的資源率,而這個(gè)最重要的資源就是知識(shí)企業(yè)中核心技術(shù)人員的工作時(shí)間,讓這些核心技術(shù)精英們可以花費(fèi)更多的時(shí)間在設(shè)計(jì)新產(chǎn)品架構(gòu)和攻克新技術(shù)難關(guān)這些最有價(jià)值的工作上,那些耗時(shí)過(guò)長(zhǎng)并且回報(bào)較小的工作則交給AI來(lái)完成。
英偉達(dá)不是唯一發(fā)現(xiàn)類(lèi)似的AI“to B”應(yīng)用場(chǎng)景的企業(yè),不少其他美國(guó)大科技企業(yè)也都發(fā)現(xiàn),目前AI大語(yǔ)言模型最有效果的應(yīng)用,就是幫助開(kāi)發(fā)者減輕處理繁雜瑣碎工作的難度和節(jié)省這些時(shí)間。比如說(shuō)在開(kāi)發(fā)一個(gè)新的軟件功能模塊時(shí),通過(guò)公司自用的大語(yǔ)言模型,從過(guò)去浩如煙海的技術(shù)文檔中尋找、總結(jié)相關(guān)的代碼說(shuō)明和需求分析,這樣可以更快更準(zhǔn)確地將新軟件開(kāi)發(fā)需求確定下來(lái),效果好的時(shí)候可以縮短三分之一的項(xiàng)目開(kāi)發(fā)時(shí)間。
當(dāng)然,知識(shí)密集型企業(yè)不僅限于IT科技公司,法律、金融、生物醫(yī)藥甚至現(xiàn)在許多高端制造企業(yè)都可以歸入其中,而大語(yǔ)言模型對(duì)于英偉達(dá)提高生產(chǎn)效率的作用,恐怕也可以同樣作用于這些行業(yè)的企業(yè)身上。
而對(duì)于這些行業(yè)來(lái)說(shuō),他們?cè)趹?yīng)用AI時(shí)很有一些共性。
比如說(shuō)企業(yè)訓(xùn)練AI模型的數(shù)據(jù)往往來(lái)自于企業(yè)內(nèi)部,而且格式和語(yǔ)言類(lèi)型相對(duì)標(biāo)準(zhǔn)固定。律師事務(wù)所日常面對(duì)的法律條款和法律文書(shū),金融企業(yè)面對(duì)的各種財(cái)務(wù)報(bào)表,IT企業(yè)面對(duì)的程序代碼和技術(shù)文檔等等,這些數(shù)據(jù)往往有著相當(dāng)標(biāo)準(zhǔn)的格式和大量反復(fù)使用、定義明確的專(zhuān)業(yè)名詞。因此,單個(gè)企業(yè)自身的業(yè)務(wù)數(shù)據(jù)庫(kù)從數(shù)據(jù)量到語(yǔ)言復(fù)雜程度上,都遠(yuǎn)遠(yuǎn)小于整個(gè)互聯(lián)網(wǎng)上幾十億網(wǎng)民創(chuàng)造出來(lái)的繁雜內(nèi)容。
另一個(gè)應(yīng)用特點(diǎn)則是企業(yè)內(nèi)部用戶向AI模型提問(wèn)的問(wèn)題類(lèi)型也相對(duì)嚴(yán)肅集中,基本局限在技術(shù)和業(yè)務(wù)方面的疑問(wèn),不像廣大網(wǎng)民對(duì)網(wǎng)上已經(jīng)公布的通用型AI大語(yǔ)言模型五花八門(mén)的提問(wèn),天南海北無(wú)所不包,甚至有人專(zhuān)門(mén)選擇偏僻晦澀的知識(shí)點(diǎn)和邏輯復(fù)雜的問(wèn)題來(lái)找樂(lè)子。
以上應(yīng)用場(chǎng)景的差別也帶來(lái)了一個(gè)“to B”和“to C”之間的重要區(qū)別:訓(xùn)練數(shù)據(jù)庫(kù)之間的量級(jí)差距。面向通用場(chǎng)景下的ChatGPT 4大語(yǔ)言模型共有1750億個(gè)參數(shù),訓(xùn)練數(shù)據(jù)庫(kù)據(jù)說(shuō)有13萬(wàn)億個(gè)離散文本單元(token)。而英偉達(dá)的內(nèi)部大語(yǔ)言模型公司訓(xùn)練數(shù)據(jù)則只包含了240億個(gè)token,規(guī)模只有ChatGPT 4的0.2%左右。
據(jù)說(shuō)國(guó)內(nèi)目前幾個(gè)公開(kāi)測(cè)試的大語(yǔ)言模型,訓(xùn)練數(shù)據(jù)庫(kù)規(guī)模也大多在萬(wàn)億token以上,已經(jīng)遠(yuǎn)遠(yuǎn)超越英偉達(dá)這樣的業(yè)界龍頭企業(yè)的需求了。而除了幾個(gè)互聯(lián)網(wǎng)平臺(tái)企業(yè)之外,國(guó)內(nèi)大部分企業(yè)自身產(chǎn)品研發(fā)過(guò)程積累的數(shù)據(jù)量,恐怕沒(méi)有英偉達(dá)這么多。
數(shù)據(jù)規(guī)模和復(fù)雜程度在很大程度上決定了訓(xùn)練模型所需算力的多少,而算力需求又很大程度上決定了對(duì)于硬件設(shè)備尤其是芯片性能的需求。所以,企業(yè)內(nèi)部自用的AI模型所需的算力和芯片性能,也遠(yuǎn)遠(yuǎn)不如類(lèi)似ChatGPT 4這樣的通用型模型那么夸張。
國(guó)內(nèi)的AI芯片雖然因遭到禁運(yùn)而落后于歐美先進(jìn)水平,導(dǎo)致在運(yùn)算成本和時(shí)間上都比國(guó)外訓(xùn)練AI模型花費(fèi)更高,但是國(guó)內(nèi)企業(yè)已經(jīng)進(jìn)口的現(xiàn)有AI芯片,包括國(guó)內(nèi)自主設(shè)計(jì)、制造的AI芯片,已經(jīng)足以完成這些針對(duì)企業(yè)內(nèi)部提高生產(chǎn)效率的專(zhuān)門(mén)AI大語(yǔ)言模型的訓(xùn)練和應(yīng)用。用一個(gè)比喻來(lái)描述這個(gè)現(xiàn)象,游戲玩家們必須要買(mǎi)最新的4090顯卡來(lái)流暢運(yùn)行最新的3A大作,因?yàn)槔巷@卡往往帶不動(dòng)這些游戲。但如果只是玩一些如仙劍奇?zhèn)b傳1這樣的老游戲,顯卡對(duì)于游戲運(yùn)行流暢度的影響就不那么重要了,玩家們也沒(méi)必要一定要去血拼4090。
從英偉達(dá)這樣的龍頭科技企業(yè)的投入方向來(lái)看,目前AI模型對(duì)于生產(chǎn)力刺激最明顯最有效的應(yīng)用方向,依舊是應(yīng)用在企業(yè)內(nèi)部的這些場(chǎng)景項(xiàng)目。而這些方向也恰恰是用國(guó)內(nèi)算力完全可以實(shí)現(xiàn),受到國(guó)外芯片禁運(yùn)影響最小的應(yīng)用場(chǎng)景。
當(dāng)然,這并不是說(shuō)國(guó)內(nèi)和國(guó)外在企業(yè)內(nèi)部AI應(yīng)用上就沒(méi)有差距了,從大語(yǔ)言模型軟件的開(kāi)發(fā)和調(diào)試,以及企業(yè)內(nèi)部數(shù)據(jù)、知識(shí)的整理和將AI模型應(yīng)用與實(shí)際科研結(jié)合這些問(wèn)題上,國(guó)內(nèi)知識(shí)密集型企業(yè)大多還是落后一些距離,但是相比“to C”的通用消費(fèi)者應(yīng)用上,這個(gè)方向受到的硬件制約最少,追上國(guó)際先進(jìn)水平的阻力最小,而產(chǎn)生的潛在經(jīng)濟(jì)回報(bào)卻最大。
與“to B”領(lǐng)域的相對(duì)樂(lè)觀前景不同,由于起步晚、財(cái)力有限,再加上芯片禁運(yùn)的影響,國(guó)內(nèi)在大語(yǔ)言模型“to C”的通用性應(yīng)用上差距更大,短期追趕難度也更高。當(dāng)OpenAI在剛剛結(jié)束的開(kāi)發(fā)者大會(huì)上提出要搞應(yīng)用商店平臺(tái),類(lèi)似十幾年前移動(dòng)互聯(lián)網(wǎng)剛開(kāi)始發(fā)展時(shí)候的蘋(píng)果應(yīng)用商城,在形成產(chǎn)業(yè)生態(tài)和搶占商業(yè)應(yīng)用市場(chǎng)方面占了先河。國(guó)內(nèi)的通用型大語(yǔ)言模型在技術(shù)上還落后OpenAI一至兩代,加上硬件受限嚴(yán)重,短期內(nèi)雖然可以搶占國(guó)內(nèi)市場(chǎng),但是依然無(wú)力在國(guó)際市場(chǎng)上與國(guó)外的廠商進(jìn)行競(jìng)爭(zhēng)。
在“to C”領(lǐng)域,目前最現(xiàn)實(shí)的策略依然是盡量緊緊跟隨,從國(guó)外探索驗(yàn)證過(guò)的通用領(lǐng)域里面選擇商業(yè)最成熟的模式再進(jìn)行投入,這樣可以最好發(fā)揮有限資本的使用效果。
面對(duì)現(xiàn)實(shí),在繼續(xù)推動(dòng)國(guó)內(nèi)自身半導(dǎo)體軟硬件和設(shè)備研發(fā)國(guó)產(chǎn)化的同時(shí),在知識(shí)密集型企業(yè)中推動(dòng)利用專(zhuān)門(mén)的AI模型來(lái)提高研發(fā)效率,是符合中國(guó)經(jīng)濟(jì)挑戰(zhàn)的最有效應(yīng)對(duì)策略。一方面中國(guó)產(chǎn)業(yè)升級(jí)和向高端產(chǎn)品攻關(guān)的重任恰好落在這些知識(shí)密集型企業(yè)身上,如果AI模型的應(yīng)用可以提升企業(yè)研發(fā)和生產(chǎn)效率,這就有助于國(guó)內(nèi)加速突破外部封鎖,完成產(chǎn)業(yè)升級(jí)的主要戰(zhàn)略目標(biāo)。另一方面,這些企業(yè)開(kāi)發(fā)適合自身的AI模型,本身也會(huì)為國(guó)內(nèi)半導(dǎo)體軟硬件廠商提供寶貴的需求和產(chǎn)品驗(yàn)證的機(jī)會(huì),這和美國(guó)各個(gè)科技大廠向英偉達(dá)下單,為英偉達(dá)的產(chǎn)品持續(xù)升級(jí)換代提供了大量資金是一個(gè)道理。
因此,目前在AI產(chǎn)業(yè)化的進(jìn)程上,中國(guó)還處在追趕世界先進(jìn)水平的地位上。面對(duì)外部封堵持續(xù)升級(jí)的現(xiàn)狀,最現(xiàn)實(shí)有效的從AI發(fā)展中獲益的方式,恐怕就是加快推動(dòng)研發(fā)AI模型在企業(yè)層面的應(yīng)用落地,切實(shí)利用AI促進(jìn)實(shí)體經(jīng)濟(jì)的生產(chǎn)力進(jìn)步,為AI大語(yǔ)言模型的應(yīng)用從PPT上落地到實(shí)際生產(chǎn)研發(fā)過(guò)程中尋找突破口,這反過(guò)來(lái)也可以支持AI領(lǐng)域更快更好的發(fā)展。
本文系觀察者網(wǎng)獨(dú)家稿件,文章內(nèi)容純屬作者個(gè)人觀點(diǎn),不代表平臺(tái)觀點(diǎn),未經(jīng)授權(quán),不得轉(zhuǎn)載,否則將追究法律責(zé)任。關(guān)注觀察者網(wǎng)微信guanchacn,每日閱讀趣味文章。
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 小婷 
-
首只全流程國(guó)產(chǎn)克隆貓降生!克隆技術(shù)全流程國(guó)產(chǎn)化意味著什么?
2023-11-24 06:54 -
顏寧回應(yīng)當(dāng)選中科院院士
2023-11-23 15:25 -
名單公布!46人當(dāng)選2023年兩院外籍院士
2023-11-23 13:41 -
2023年兩院院士增選結(jié)果揭曉:顏寧入選中科院院士
2023-11-22 17:19 -
-
可承受幾十萬(wàn)次折疊!我國(guó)首條,正式投產(chǎn)
2023-11-20 22:45 科技前沿 -
世界首創(chuàng)!雄安“地下城”用上了
2023-11-20 14:30 雄安新區(qū) -
我國(guó)首只全流程國(guó)產(chǎn)化培育的克隆貓誕生
2023-11-20 11:50 科技前沿 -
約270萬(wàn)行代碼!我國(guó)自主研發(fā)地球系統(tǒng)模式發(fā)布
2023-11-18 14:50 -
中國(guó)高能同步輻射光源成功升能加速 增強(qiáng)器束流能量達(dá)60億電子伏特
2023-11-17 20:18 能源戰(zhàn)略 -
北斗系統(tǒng)正式加入,今后可全球民航通用
2023-11-16 08:49 航空航天 -
-
0.015毫米!世界最薄,中企成功軋制
2023-11-14 11:35 -
300個(gè)上榜!工信部公示《2023年5G工廠名錄》
2023-11-14 10:37 5G -
中國(guó)“機(jī)器化學(xué)家”成功創(chuàng)制火星產(chǎn)氧電催化劑
2023-11-14 06:49 科技前沿 -
世界互聯(lián)網(wǎng)大會(huì)十周年,商湯科技元蘿卜AI下棋機(jī)器人引圍觀
2023-11-13 15:43 -
全球首條!我國(guó)開(kāi)通1.2T超高速下一代互聯(lián)網(wǎng)主干通路
2023-11-13 11:51 -
痛悼!他走了,享年89歲
2023-11-12 22:11 -
正式揭牌!預(yù)計(jì)明年投用
2023-11-12 20:34 科技前沿 -
又一大國(guó)重器!全球最大18兆瓦直驅(qū)海上風(fēng)電機(jī)組下線
2023-11-11 16:00 中國(guó)精造
相關(guān)推薦 -
馬斯克:中國(guó)發(fā)電量就像火箭升空,美國(guó)卻躺平了… 評(píng)論 64“特朗普將‘抵制’南非主辦的G20峰會(huì)” 評(píng)論 168日本這回要對(duì)美國(guó)咬緊牙關(guān)不松口了 評(píng)論 116“機(jī)智!中方出新招,進(jìn)一步堵住漏洞” 評(píng)論 166“誰(shuí)都不想掛電話” ,美俄元首兩小時(shí)都聊了啥? 評(píng)論 160最新聞 Hot
-
馬斯克:中國(guó)發(fā)電量就像火箭升空,美國(guó)卻躺平了…
-
印媒還在“贏贏贏”,《紐約時(shí)報(bào)》忍不住了
-
特朗普:教皇的兄弟是MAGA大粉
-
美軍高官:中國(guó)都有這能力了,讓我抓狂
-
“特朗普將‘抵制’南非主辦的G20峰會(huì)”
-
黃仁勛:美國(guó)管制對(duì)華出口,失敗
-
梅德韋杰夫督促烏克蘭抓住“最后機(jī)會(huì)”
-
馬斯克將大幅削減政治支出,“死守”特斯拉
-
特朗普說(shuō)霉霉不HOT了是什么意思?白宮回應(yīng)
-
魯比奧急了:美國(guó)沒(méi)有退出世界,也不會(huì)被中國(guó)取代
-
日本這回要對(duì)美國(guó)咬緊牙關(guān)不松口了
-
為對(duì)抗中俄,特朗普砸1750億美元打造“金穹”
-
“俄方將向中國(guó)通報(bào)談判的所有細(xì)節(jié)”
-
光天化日下,墨西哥首都市長(zhǎng)秘書(shū)與顧問(wèn)被槍殺
-
法德喊話歐盟:趕緊取消,不然輸給中美
-
日本農(nóng)相辭職,此前稱(chēng)“從未買(mǎi)過(guò)大米,我家大米多到可以賣(mài)了”
-