-
張維為《這就是中國(guó)》第274期| DeepSeek震撼
最后更新: 2025-03-16 14:11:02“一個(gè)巨大的變化,就是一個(gè)產(chǎn)品出現(xiàn)之后,它帶來的是整個(gè)外部世界對(duì)中國(guó)看法的改變?!?
“到了人工智能時(shí)代,這個(gè)情況發(fā)生了很大的逆轉(zhuǎn),為什么中文在人工智能中存在這樣的一個(gè)技術(shù)優(yōu)勢(shì)呢?”
前段時(shí)間DeepSeek是火爆出圈了,不僅在科技界引起了廣泛的震動(dòng),很多普通人現(xiàn)在也開始在使用DeepSeek,甚至有的政府機(jī)構(gòu)也開始在應(yīng)用上引入了DeepSeek。大家可能很好奇,為什么中國(guó)在人工智能時(shí)代會(huì)不斷地有火爆的產(chǎn)品,中國(guó)的整個(gè)科創(chuàng)生態(tài)到底有什么樣的優(yōu)勢(shì)?
在東方衛(wèi)視3月11日播出的274期的《這就是中國(guó)》節(jié)目中,復(fù)旦大學(xué)中國(guó)研究院院長(zhǎng)張維為教授和復(fù)旦大學(xué)中國(guó)研究院特邀研究員汪濤老師,對(duì)DeepSeek的火爆出圈進(jìn)行了深入觀察和分析。
汪濤:
我今天演講的主題是——中文在人工智能時(shí)代的優(yōu)勢(shì)。DeepSeek之所以爆火,主要并不是它技術(shù)上獲得了突破性的進(jìn)展,而是其效率獲得了數(shù)量級(jí)的提升,從而使得它在相同性能的情況下,成本可以下降將近二十多倍。
不同AI模型的Token輸入/輸出價(jià)格(美元/每百萬Tokens),可以看到DeepSeek的價(jià)格遠(yuǎn)低于其他AI模型Reddit
之所以如此,是因?yàn)檠邪l(fā)團(tuán)隊(duì)幾乎是將各種可能提升效率的技術(shù)都充分地進(jìn)行了挖掘,比如說更多地采用底層編碼的語(yǔ)言PTX。一般來說,越是底層的編程語(yǔ)言,它的效率就會(huì)越高,但是編程的難度也會(huì)越大。
另外,還有適當(dāng)?shù)亟档途?,比如采用一個(gè)字節(jié)的8比特浮點(diǎn)運(yùn)算,而不是32比特,從而能成倍地減少存儲(chǔ)量和運(yùn)算量,這在人工智能里面有一個(gè)專業(yè)的術(shù)語(yǔ)叫量化。
還有蒸餾的方法,同樣可以極大地減少參數(shù)的數(shù)量,除此之外還有混合專家架構(gòu)(MoE)、多頭潛在注意力技術(shù)(MLA)等等。這些技術(shù)本身并不完全是DeepSeek獨(dú)創(chuàng)的,原來在美國(guó)人工智能產(chǎn)業(yè)界的專業(yè)人員都知道這些技術(shù),但為什么DeepSeek把這些技術(shù)充分利用了呢?
今天就談一個(gè)大家比較容易理解,也非常有意思的話題:中文在人工智能時(shí)代的技術(shù)優(yōu)勢(shì)。DeepSeek充分利用了中文的優(yōu)勢(shì),所以在它爆火之后,很多人開始關(guān)注到這個(gè)問題。
如果我們回顧一下兩百多年來的歷史,中文在現(xiàn)代科技中的作用,其實(shí)經(jīng)歷過一個(gè)變化的過程。
在中國(guó)古代的時(shí)期,中國(guó)對(duì)周邊國(guó)家在文化上有壓倒性的優(yōu)勢(shì)。其他地區(qū)對(duì)中國(guó)也有著非常仰慕的心態(tài)。但隨著中國(guó)在近代的落后,尤其是甲午戰(zhàn)爭(zhēng)失敗以后,導(dǎo)致很多中國(guó)知識(shí)階層開始反思自身。首先反思的就是我們的文化,也包括我們自己的語(yǔ)言文字。這種反思很快就發(fā)展到了極端,甚至有人認(rèn)為漢字阻礙了中國(guó)進(jìn)入現(xiàn)代科技文明。也有人認(rèn)為中國(guó)應(yīng)當(dāng)放棄中文這種象形文字形態(tài),應(yīng)該改成像拼音這樣的字母文字。
隨著以電子計(jì)算機(jī)為代表的信息技術(shù)出現(xiàn)以后,中文在計(jì)算機(jī)鍵盤輸入上存在一定的困難。因?yàn)橛?jì)算機(jī)鍵盤來自英文的打字機(jī),所以輸入英文當(dāng)然是最簡(jiǎn)單方便的。因此,過去曾經(jīng)認(rèn)為中文阻礙了中國(guó)進(jìn)入現(xiàn)代科技文明的觀點(diǎn)和思潮,在信息技術(shù)時(shí)代又再一次沉渣泛起。但是, 二十世紀(jì)八十年代,中國(guó)科技界在漢字輸入上做了大量的工作,在當(dāng)時(shí)被稱為叫“萬碼奔騰”。
這些漢字輸入的工作在很大程度上降低了中文電腦輸入的困難。其中比較著名和主流的有五筆字型輸入法,也叫王碼,是王永民先生發(fā)明的。那么另外一個(gè)常用的輸入法是拼音輸入法。雖然客觀上說,直到今天中文還是比英文等字母文字的鍵盤輸入稍微麻煩那么一點(diǎn)點(diǎn)。但是這些中文輸入法,在很大程度上,已經(jīng)有效解決了中文在計(jì)算機(jī)上的輸入問題。在五筆字型輸入法的基礎(chǔ)上,充分采用詞組輸入以后,它的輸入效率甚至還可以超過英文的輸入。
到了人工智能時(shí)代,這個(gè)情況發(fā)生了很大的逆轉(zhuǎn),為什么中文在人工智能中存在技術(shù)優(yōu)勢(shì)呢?主要有以下這些原因:
首先,漢字非常規(guī)整,或者說非常整齊。無論是書寫的大小尺寸還是發(fā)音的長(zhǎng)短尺寸,都是一樣的,非常整齊。這種規(guī)整對(duì)于計(jì)算機(jī)的處理而言,是非常方便的。比如要進(jìn)行語(yǔ)音識(shí)別,中文每個(gè)字的發(fā)音都是聲母加韻母,發(fā)音的長(zhǎng)度一樣,這樣就會(huì)相對(duì)比較容易區(qū)分出一句話中,每一個(gè)字的發(fā)音。
相比之下,英文單詞的長(zhǎng)度,從一個(gè)字母到十幾個(gè)字母的都有,這樣的字母文字,每個(gè)單詞它發(fā)音的長(zhǎng)度可能都是不一樣的。像英文里面的“祝賀”,是“Congratulations”,這就有15個(gè)字母。我們可能會(huì)好奇,那最長(zhǎng)的英文單詞會(huì)有多少個(gè)字母呢?如果我們到網(wǎng)上去搜索的話,可能會(huì)發(fā)現(xiàn)很多不一樣的答案。
還有一個(gè)問題是很多英文的句子,它的發(fā)音會(huì)有連讀的情況,比如說"what’s your name",那么這就更加難以區(qū)分出每個(gè)單詞。雖然現(xiàn)在這些問題在人工智能的語(yǔ)音識(shí)別中都已經(jīng)解決了,但是它解決的技術(shù)難度,確實(shí)要比中文困難很多,需要更大的運(yùn)算量,而且?guī)缀跛械淖帜肝淖侄即嬖谶@個(gè)問題。
第二,漢字的信息密度一般比字母文字要高,這體現(xiàn)在很多方面。漢字是一個(gè)表意文字,內(nèi)涵很豐富,可以用詞組、成語(yǔ)等很少的漢字表達(dá)相當(dāng)豐富的含義。尤其像文言文,它的信息密度就更高了。對(duì)于人工智能來說,最終它體現(xiàn)的是,相同含義的一段語(yǔ)言或文字,在計(jì)算機(jī)中需要有多少存儲(chǔ)量和計(jì)算量。一般來說,中文的存儲(chǔ)量和計(jì)算量都是最少的。如果我們對(duì)比一下相同內(nèi)容的中英文,中文一般頁(yè)數(shù)或者篇幅是最少的。
但我們要注意,這并不是完全絕對(duì)的,因?yàn)橛⑽囊灿凶陨淼膬?yōu)點(diǎn),比如說它相對(duì)比較嚴(yán)謹(jǐn),所以比較嚴(yán)謹(jǐn)?shù)囊恍┱撐幕蚍晌臅锩?,英文的信息密度與中文的差異就沒有那么大了。但是由于絕大多數(shù)情況下,中文的信息密度的確是比較高的,所以在人工智能的訓(xùn)練中,相同內(nèi)容的情況下,中文訓(xùn)練的存儲(chǔ)量和計(jì)算量就會(huì)比較少。這是中文效率優(yōu)勢(shì)的第二個(gè)體現(xiàn)。
第三,是中文的穩(wěn)定性。漢字是相對(duì)比較穩(wěn)定的一種語(yǔ)言,我們今天使用的漢字與幾千年前的甲骨文其實(shí)挺接近的。對(duì)于新出現(xiàn)的事物,漢字是通過常用的一些字去建立新的詞組從而適應(yīng)。并且,這樣的詞組天然地會(huì)存在有規(guī)律的分類特性,比如機(jī)器的“機(jī)”,可以組成拖拉機(jī)、播種機(jī)、飛機(jī)、紡織機(jī)、發(fā)動(dòng)機(jī)、蒸汽機(jī)、計(jì)算機(jī),如此之多的機(jī)器漢字都可以用“機(jī)”這個(gè)形成詞組來表達(dá)。
漢字的穩(wěn)定性對(duì)人工智能帶來的好處是訓(xùn)練參數(shù)可以更少,有效的重復(fù)訓(xùn)練可以更多,那么準(zhǔn)確性就會(huì)更高。
相比之下,英文每年都會(huì)增加大量的新詞,常用的單詞都可能會(huì)發(fā)生變化。當(dāng)然我們提到中文在人工智能時(shí)代的技術(shù)優(yōu)勢(shì),并不是要把它過度地拔高,只是從以上不同技術(shù)時(shí)代,中文技術(shù)優(yōu)劣勢(shì)的變化過程中,希望我們能更客觀地看待我們中國(guó)自己的文化。在進(jìn)入人工智能時(shí)代,我們更應(yīng)該發(fā)揮中文的優(yōu)勢(shì),使得中國(guó)在人工智能時(shí)代可以獲得更快的發(fā)展,并且有更好的經(jīng)濟(jì)效益。
從我們長(zhǎng)久以來對(duì)自己語(yǔ)言的態(tài)度變化中,可以獲得一些啟示:那就是如何用科學(xué)的態(tài)度去看待自己的文化。所謂利弊或優(yōu)劣,它永遠(yuǎn)是相對(duì)特定的要求來說的。我們不能因?yàn)橛龅搅四撤N劣勢(shì)就簡(jiǎn)單地去否定自己的文化,也不能遇到優(yōu)勢(shì)就自我膨脹。
科學(xué)的態(tài)度就是實(shí)事求是,如果它是劣勢(shì),我們就應(yīng)該想辦法改進(jìn),去消除或者減少這種劣勢(shì)。如果是優(yōu)勢(shì),我們就應(yīng)該想辦法去充分地開發(fā)利用它。因?yàn)榧词故菨撛诘膬?yōu)勢(shì),如果不去充分地開發(fā)利用,它也不會(huì)自動(dòng)地體現(xiàn)出來。謝謝大家。
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 責(zé)任編輯: 鄭樂歡 
-
5%恐懼癥:美國(guó)對(duì)華半導(dǎo)體301調(diào)查真正的“故事背景”
2025-03-16 08:40 心智觀察所 -
這一技術(shù)僅五個(gè)國(guó)家掌握!我國(guó)刷新紀(jì)錄
2025-03-14 09:34 科技前沿 -
我國(guó)在三維世界造出二維金屬材料
2025-03-13 10:16 科技前沿 -
-
中國(guó)下一代“人造太陽(yáng)”關(guān)鍵系統(tǒng)驗(yàn)收
2025-03-10 18:55 能源戰(zhàn)略 -
大圓柱電池產(chǎn)業(yè)化再加速,云山動(dòng)力一期量產(chǎn)示范線正式量產(chǎn)
2025-03-10 14:29 -
《紐約時(shí)報(bào)》急問為什么小米可以造電動(dòng)車,蘋果卻不能?
2025-03-10 08:06 心智觀察所 -
全球首個(gè)!我國(guó)團(tuán)隊(duì)成功繪制
2025-03-08 21:44 -
特斯拉FSD入華,深度回顧中美智駕競(jìng)爭(zhēng)的關(guān)鍵變量
2025-03-08 09:30 心智觀察所 -
“下一個(gè)顛覆者,也可能來自中國(guó)”
2025-03-07 21:41 人工智能 -
被90后女生王虹證明的掛谷猜想究竟是什么?
2025-03-07 08:21 -
教育部部長(zhǎng):DeepSeek和機(jī)器人是教育重大機(jī)遇
2025-03-05 11:34 2025兩會(huì) -
政府工作報(bào)告:培育生物制造、量子科技、具身智能、6G等未來產(chǎn)業(yè)
2025-03-05 09:38 2025兩會(huì) -
用不用DeepSeek?婁勤儉:我是計(jì)算機(jī)專業(yè),我對(duì)人工智能有偏愛
2025-03-04 15:16 2025兩會(huì) -
打破紀(jì)錄、最高水準(zhǔn)!中國(guó)成功研制“祖沖之三號(hào)”量子計(jì)算原型機(jī)
2025-03-04 07:13 科技前沿 -
2030年中國(guó)斜爆轟飛機(jī)真能一小時(shí)到全球?專家發(fā)聲
2025-03-03 17:53 航空航天 -
若前方無路,便踏出一條路:中國(guó)數(shù)據(jù)庫(kù)產(chǎn)業(yè)迎來“哪吒時(shí)刻”
2025-03-03 08:02 心智觀察所 -
獨(dú)家對(duì)話|蘋果在中國(guó)的發(fā)展會(huì)繼續(xù)承受壓力
2025-03-01 09:23 心智觀察所 -
“中國(guó)又一個(gè)DeepSeek時(shí)刻?”
2025-02-28 22:27 人工智能 -
“即使我們對(duì)手的產(chǎn)品免費(fèi),我們還是比他們便宜”
2025-02-28 14:06 心智觀察所
相關(guān)推薦 -
“中國(guó)稀土出口審批速度慢,西方急啊” 評(píng)論 123“中美談判后,各國(guó)對(duì)美更硬氣了” 評(píng)論 104星辰大海第二站,天問二號(hào)為何選它? 評(píng)論 63印度人把抵制矛頭對(duì)準(zhǔn)了這兩國(guó) 評(píng)論 249特朗普準(zhǔn)備賣了“美國(guó)之音”總部大樓 評(píng)論 195最新聞 Hot
-
“中國(guó)稀土出口審批速度慢,西方急啊”
-
英國(guó)也盯上了美國(guó)“流亡”科研人才
-
美國(guó)發(fā)生火車撞人事故:2人死亡,至少1人失蹤
-
“蘋果給了印度希望,結(jié)果中美談成了……”
-
“中美談判后,各國(guó)對(duì)美更硬氣了”
-
葡萄牙總理小勝,極右翼抬頭
-
拜登還能活多久?美專家預(yù)測(cè)
-
“飛車黨”緊追小女孩將其嚇哭?當(dāng)?shù)鼐酵▓?bào):兩名初中生認(rèn)錯(cuò)道歉
-
數(shù)學(xué)家贏下羅馬尼亞大選,曾兩次獲得國(guó)際奧數(shù)滿分
-
河中現(xiàn)大量死魚,懷化市委書記現(xiàn)場(chǎng)察看
-
特朗普:將與普京和澤連斯基通話
-
特朗普再次喊話:趕緊降息
-
阿根廷農(nóng)業(yè)重鎮(zhèn)遭嚴(yán)重洪水襲擊,大豆收獲被推遲
-
魯比奧:梵蒂岡或成俄烏會(huì)談地
-
搞真人秀搶美國(guó)公民資格,真人版《饑餓游戲》要來了?
-
捐贈(zèng)儀式舉行,這方金印證實(shí)西晉與高句麗統(tǒng)屬關(guān)系
快訊- 武漢發(fā)生一起故意傷害案件,警方通報(bào):1人死亡,嫌疑人已被抓獲
- 永久基本農(nóng)田被垃圾掩埋,江西萍鄉(xiāng)、湖南湘潭回應(yīng)
- 中國(guó)對(duì)美國(guó)重要工程塑料征收74.9%反傾銷稅
- 證監(jiān)會(huì)副主席李明:目前A股估值水平仍處于相對(duì)低位
- 2025觀察者網(wǎng)招募令:國(guó)際大學(xué)生夏令營(yíng)
- 統(tǒng)計(jì)局:促進(jìn)價(jià)格合理回升
- 美國(guó)發(fā)生火車撞人事故:2人死亡,至少1人失蹤
- 浙江推動(dòng)AI終端消費(fèi):家居機(jī)器人納入以舊換新補(bǔ)貼
-