-
訊飛劉慶峰:今天,中國(guó)的大模型底座能力到底怎么樣?
6月27日,北京,科大訊飛舉行訊飛星火升級(jí)發(fā)布會(huì),星火大模型V4.0亮相。
科大訊飛董事長(zhǎng)劉慶峰全程演講,科大訊飛研究院院長(zhǎng)劉聰真機(jī)實(shí)測(cè),回答兩個(gè)關(guān)鍵問題:
今天,中國(guó)的大模型底座能力到底怎么樣?
今天,風(fēng)起云涌的大模型究竟如何應(yīng)用落地?
以下是劉慶峰演講(節(jié)選):
尊敬的各位領(lǐng)導(dǎo)、各位合作伙伴、各位院士專家、各位媒體朋友、線上的朋友們,大家好!熱烈歡迎大家蒞臨訊飛星火V4.0的發(fā)布會(huì)現(xiàn)場(chǎng)。
科大訊飛董事長(zhǎng)劉慶峰
這一年多來,以大模型為主要帶動(dòng)的通用人工智能浪潮在全球風(fēng)起云涌、高潮迭起。隨著大模型技術(shù)研發(fā)和產(chǎn)業(yè)應(yīng)用的不斷深入,大家越來越關(guān)注兩個(gè)非常關(guān)鍵的核心問題。
第一,今天中國(guó)大模型的底座能力到底怎么樣?在中美科技日益激烈的人工智能領(lǐng)域博弈下,去年10月17日,英偉達(dá)因?yàn)槊绹?guó)商務(wù)部的要求,對(duì)中國(guó)所有能訓(xùn)練大模型的智能算力全面斷供。就在6月25日,OpenAI也正式通知將從7月9日開始終止所有來自中國(guó)的API申請(qǐng)。在這個(gè)背景下,熱熱鬧鬧、風(fēng)起云涌的通用人工智能浪潮,到底有沒有自主可控的國(guó)產(chǎn)底座能力做支撐,這決定了我們?cè)谶@條路上到底能走多遠(yuǎn),決定了通用人工智能這一波浪潮;相當(dāng)于PC和互聯(lián)網(wǎng)的誕生,在人類歷史上有深刻的意義,而我們能不能享受這波紅利,能不能成為美國(guó)之后全球智慧涌現(xiàn)的第二極?
第二,大模型將會(huì)改變信息分發(fā)獲取的方式,改變?nèi)藱C(jī)交互方式,改變內(nèi)容生產(chǎn)方式,也會(huì)改變我們的整個(gè)產(chǎn)業(yè)形態(tài)和競(jìng)爭(zhēng)格局,改變科研范式,這是大家都能看到的大趨勢(shì)和未來。Gartner預(yù)測(cè),到2026年現(xiàn)在80%的企業(yè)都要用到通用人工智能,而今天這個(gè)數(shù)字是5%左右。
大模型在今天風(fēng)起云涌、如此大的投入下,究竟怎么落地?美好的未來擺在這里,當(dāng)前第一步該怎么以科學(xué)合理投入,才能讓大模型真正的剛需價(jià)值能夠落地,能夠看得見、摸得著,能夠用統(tǒng)計(jì)數(shù)據(jù)來證明應(yīng)用成效。我想關(guān)于底座技術(shù)、關(guān)于應(yīng)用落地,是今天所有的關(guān)心大模型、關(guān)心通用人工智能的研究機(jī)構(gòu)、企業(yè)、高校、科研院所以及政府部門共同關(guān)心的話題。今天訊飛星火V4.0的發(fā)布,我特別想跟大家分享我們這兩方面的看法,給出科大訊飛對(duì)這兩個(gè)問題的答案。
訊飛星火APP的使用高峰期不是周末,而是工作日
實(shí)際上,從去年5月6日訊飛星火V1.0發(fā)布之后,大模型的各項(xiàng)能力都在快速提升,我們幾乎每個(gè)月都會(huì)有一次非常重要的升級(jí)。以大家特別關(guān)注的文本寫作為例,今天星火大模型寫出來的東西已經(jīng)不僅僅能讓我們覺得不錯(cuò),很多時(shí)候還會(huì)給我們很大的觸動(dòng),給我們帶來驚喜,甚至是感動(dòng)。
今年6月7日上午,高考語文作文題新鮮出爐,當(dāng)天中午就有很多人,包括機(jī)構(gòu)、老師、投資人等,從各個(gè)角度來測(cè)星火在高考作文中的寫作能力如何。非常自豪的是,大家都給了訊飛星火很高的評(píng)價(jià)。在“重慶日?qǐng)?bào)新重慶客戶端”上發(fā)布這篇文章,是6月7日12:10讓大模型寫的,在人工智能圈一個(gè)大佬云集的微信群里,被大家專門拿出來作為一個(gè)經(jīng)典案例點(diǎn)贊。
大家可以看到,星火寫的內(nèi)容非常專業(yè),很好地運(yùn)用了排比、引用、論證等寫作手法。當(dāng)時(shí)有很多人給了評(píng)分,在滿分是60分的情況下,最低的給了52分。大家讀一下就會(huì)看到,在這中間有思辨的想法,引經(jīng)據(jù)典也都寫得非常好。這是沒有任何人工干預(yù)生成的結(jié)果,是大模型自己寫出來的,它的能力確實(shí)越來越強(qiáng)了。
當(dāng)然,大家還會(huì)關(guān)心說今天大模型寫作、寫詩、作畫能力在不斷提升,而要真正地解決人類剛需的一個(gè)非常重要的標(biāo)志就是科研,究竟大模型在賦能科研方面到底有沒有成效?
以我們和中國(guó)科學(xué)技術(shù)大學(xué)生命學(xué)院劉海燕教授團(tuán)隊(duì)的合作為例,我們用大模型中基于條件擴(kuò)散模型的蛋白質(zhì)主鏈設(shè)計(jì)算法SCUBA-D,能夠從頭生成自然界不存在的蛋白質(zhì)。實(shí)踐證明這種生成的蛋白質(zhì)在我們醫(yī)學(xué)特別需要的領(lǐng)域中,它的結(jié)合親和力與天然的蛋白質(zhì)相當(dāng),甚至更強(qiáng)。最重要的是,我們把設(shè)計(jì)成功率從原來的0.1%提升到64%,提升了640倍,原來需要6個(gè)月做的設(shè)計(jì),現(xiàn)在1天就做完了。這個(gè)已經(jīng)不是在簡(jiǎn)單的科研驗(yàn)證階段了,目前已經(jīng)成功地設(shè)計(jì)了48個(gè)蛋白質(zhì),還在批量生產(chǎn)。這篇文章也在今年5月正式被《Nature》子刊接收,證明了我們?cè)跇I(yè)界的領(lǐng)先地位。
我想說的是,大模型不僅可以寫詩、作畫,在改變工業(yè)、改變科研范式等方面已經(jīng)實(shí)實(shí)在在發(fā)揮作用,包括我們和中國(guó)科學(xué)技術(shù)大學(xué)做的合成類的科學(xué)創(chuàng)新,比如說化學(xué);還有與合肥綜合性國(guó)家科學(xué)中心能源研究院合作,在推進(jìn)大模型賦能核聚變整個(gè)過程中更快地預(yù)測(cè)、更好地應(yīng)對(duì)各種各樣的異常情況,這些都在快速推進(jìn)之中,這是我們?cè)诳蒲猩厦娴母鞣N進(jìn)展。
訊飛星火APP的使用高峰期不是周末,而是工作日;不是晚上,而是工作日的上午9:30和下午3:30。這說明大家真正用星火來解決工作中的剛需問題。我們一直說大模型應(yīng)該是解放生產(chǎn)力、釋放每個(gè)人想象力的,從這些數(shù)據(jù)就可以看到。
基于全國(guó)產(chǎn)算力平臺(tái),全面對(duì)標(biāo)GPT-4 Turbo
從去年5月6日的訊飛星火V1.0一路走到今天的訊飛星火V4.0的發(fā)布,有一點(diǎn)非常令我們自豪——訊飛星火大模型是基于全國(guó)產(chǎn)算力平臺(tái)訓(xùn)練出來的。
去年10月24日,我們與華為聯(lián)合軟硬件一體化,科大訊飛提供了大量的算子庫(kù)和算法資源,聯(lián)合在安徽發(fā)布了中國(guó)首個(gè)國(guó)產(chǎn)萬卡算力集群,這是中國(guó)第一個(gè)能訓(xùn)千億以上浮點(diǎn)參數(shù)大模型的硬件平臺(tái)。在這個(gè)硬件平臺(tái)上,訊飛星火是中國(guó)第一個(gè)基于國(guó)產(chǎn)算力訓(xùn)練出來的全民開放的大模型。
什么叫全民開放大模型?就是國(guó)家網(wǎng)信辦等八個(gè)部委聯(lián)合認(rèn)證,老百姓可以隨即下載使用的大模型。當(dāng)時(shí)是唯一的,今天訊飛星火V4.0發(fā)布還是唯一的,在全國(guó)產(chǎn)算力平臺(tái)上訓(xùn)練的大模型,所有算法都是我們自主可控的,每一行碼、每一個(gè)數(shù)據(jù)都是我們自己編寫、自己清洗出來的大模型。一定程度上,今天星火大模型V4.0的發(fā)布對(duì)完全自主可控的大模型究竟走到了什么樣的發(fā)展階段,具有非常重要的標(biāo)志意義。
那么在這個(gè)基礎(chǔ)上,訊飛星火V4.0到底到了什么水平?
這是基于認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室和中國(guó)科學(xué)院人工智能產(chǎn)學(xué)研創(chuàng)新聯(lián)盟、長(zhǎng)三角人工智能產(chǎn)業(yè)鏈聯(lián)盟,在去年6月份聯(lián)合發(fā)布的國(guó)產(chǎn)通用認(rèn)知智能大模型測(cè)評(píng)體系。這個(gè)體系一共有7個(gè)主要方面,涵蓋了481個(gè)測(cè)試項(xiàng),所有數(shù)據(jù)都是“背靠背”測(cè)試,數(shù)據(jù)都是隨機(jī)動(dòng)態(tài)產(chǎn)生的。非常高興的是,訊飛星火V4.0已經(jīng)實(shí)現(xiàn)了(大家公認(rèn)最好的通用認(rèn)知大模型)GPT-4 Turbo的對(duì)標(biāo),我們?cè)谖谋旧?、語言理解、知識(shí)問答、邏輯推理、數(shù)學(xué)這些能力上都已經(jīng)實(shí)現(xiàn)超越,在代碼和多模態(tài)能力上還有差距。
代碼能力是我們非常關(guān)注的能力之一,因?yàn)樗婕拔磥淼漠a(chǎn)業(yè)信息化和信息產(chǎn)業(yè)化的核心,而ChatGPT去年2月份通過谷歌二級(jí)程序員測(cè)試,當(dāng)時(shí)的GPT-3.5用這個(gè)測(cè)試集只獲得了60多分,GPT-4 Turbo今年1月份測(cè)試大概在80分,現(xiàn)在到86分,也在快速迭代和進(jìn)步。我們預(yù)計(jì)在今年8月份,訊飛星火會(huì)達(dá)到現(xiàn)在86分以上的水平。
多模態(tài)能力還有所差距,是因?yàn)槲覀儺?dāng)前在文生視頻上還沒有算力,也不是下一步的核心重點(diǎn),但是有生態(tài)伙伴一起做。
但在多模態(tài)方面,有一個(gè)非常重要的應(yīng)用,就是圖文識(shí)別。無論是醫(yī)療領(lǐng)域,能不能看懂電子病歷、看懂體檢報(bào)告;還是教育領(lǐng)域,能不能看懂筆記、看懂考卷;以及在司法、金融、科研、辦公等各個(gè)領(lǐng)域的應(yīng)用,圖文識(shí)別能力都是至關(guān)重要的。
科大訊飛的圖文大模型以及星火大模型中的圖文能力,在國(guó)際上現(xiàn)在是先進(jìn)的。我們與GPT-4o做了對(duì)比,因?yàn)镚PT-4o在多模態(tài)方面,特別是圖文上面比GPT-4 Turbo要強(qiáng)。所以,我們與5月14日OpenAI發(fā)布的GPT-4o最新版本相比,各個(gè)專門領(lǐng)域訊飛星火V4.0的效果都比它好,不僅僅在OCR直接識(shí)別上,關(guān)于版面的自動(dòng)理解、更合理的版式認(rèn)知結(jié)構(gòu)等方面,我們都做得更強(qiáng),從而使得今天要給大家看到的很多應(yīng)用,它的落地更能夠解決剛需。
在中文領(lǐng)域,訊飛星火V4.0實(shí)現(xiàn)了對(duì)標(biāo)GPT-4 Turbo,那么在英文領(lǐng)域怎么樣?這是國(guó)際各種主流機(jī)構(gòu)給出來的,最主流的中英文測(cè)試集,絕大部分是英文,中間有理解推理、綜合考試、數(shù)學(xué)科學(xué)和代碼等維度的測(cè)試。大家可以看到,一共12項(xiàng)主流測(cè)試集,絕大部分是英文的,訊飛星火V4.0有8項(xiàng)實(shí)現(xiàn)了超越。這個(gè)數(shù)據(jù)大家可以直接調(diào)用我們的API自己去測(cè),這是很令我們自豪的進(jìn)展。
- 責(zé)任編輯: 沐梵 
-
專稿|任正非說的“鹽堿地”,中國(guó)光伏的希望田野
2024-06-28 09:50 -
OpenAI終止對(duì)中國(guó)提供API服務(wù),周鴻祎發(fā)聲
2024-06-26 13:53 人工智能 -
首次!我國(guó)科學(xué)家實(shí)現(xiàn)獼猴全腦尺度神經(jīng)活動(dòng)監(jiān)測(cè)
2024-06-25 18:20 科技前沿 -
習(xí)近平代表黨中央、國(guó)務(wù)院和中央軍委致電祝賀
2024-06-25 14:50 航空航天 -
專稿|不顧一切的脫鉤:美國(guó)國(guó)會(huì)為何瞄準(zhǔn)這家中國(guó)企業(yè)
2024-06-25 09:54 -
2023年度國(guó)家科學(xué)技術(shù)獎(jiǎng)勵(lì)名單公布
2024-06-24 17:46 -
“NASA和波音早就知道這個(gè)問題,但仍發(fā)射了火箭”
2024-06-24 16:23 -
李德仁、薛其坤獲2023國(guó)家最高科技獎(jiǎng)
2024-06-24 10:32 科技前沿 -
我國(guó)科研人員在月壤樣本中首次發(fā)現(xiàn)天然石墨烯
2024-06-24 09:19 嫦娥奔月 -
我國(guó)重復(fù)使用運(yùn)載火箭首次10公里級(jí)垂直起降飛行試驗(yàn)成功
2024-06-23 14:58 航空航天 -
全球首臺(tái)!這一重要裝備研制成功
2024-06-22 13:09 中國(guó)精造 -
專稿丨鴻蒙與安卓徹底切割,未來勝算幾何?
2024-06-21 19:35 華為 -
“加拿大決定跟,但也怕…”
2024-06-21 18:08 -
中國(guó)科學(xué)家發(fā)現(xiàn)治療免疫性血小板減少癥突破性新療法
2024-06-21 07:27 -
2024世界人工智能大會(huì)7月4日開幕,特色亮點(diǎn)搶先看!
2024-06-20 16:00 2024世界人工智能大會(huì) -
我國(guó)首個(gè)工業(yè)用途核能供汽項(xiàng)目正式建成投產(chǎn)
2024-06-19 15:17 能源戰(zhàn)略 -
“千里眼”最大“角膜”:相當(dāng)于把北京五環(huán)內(nèi)地面平整到高低差小于1毫米
2024-06-19 09:10 中國(guó)精造 -
全球首臺(tái)全高溫超導(dǎo)托卡馬克裝置在上海建成運(yùn)行
2024-06-19 08:15 -
“美國(guó)在核電技術(shù)上落后中國(guó)10-15年”
2024-06-18 16:42
相關(guān)推薦 -
挪用學(xué)生餐補(bǔ)、欠薪欠?!瓕徲?jì)署發(fā)布報(bào)告涉5380多億 評(píng)論 11全國(guó)最大!哈密百萬千瓦“光熱+光伏”項(xiàng)目并網(wǎng)發(fā)電 評(píng)論 47“中國(guó)在非洲真正贏得了民心,就連斯威士蘭…” 評(píng)論 87“日企抱團(tuán)是絕望之舉,中國(guó)工廠效率質(zhì)量都是第一” 評(píng)論 132“她下月訪華,盡管特朗普?qǐng)F(tuán)隊(duì)表達(dá)了擔(dān)憂” 評(píng)論 54最新聞 Hot
-
“沙特曾多次警告德國(guó)提防嫌疑人”
-
特朗普最新任命!這次包括火箭隊(duì)老板、真人秀制作人
-
巴勒斯坦三個(gè)政治派別發(fā)表聯(lián)合聲明
-
“中國(guó)在非洲真正贏得了民心,就連斯威士蘭…”
-
“日企抱團(tuán)是絕望之舉,中國(guó)工廠效率質(zhì)量都是第一”
-
“中國(guó)有能力讓夢(mèng)想照進(jìn)現(xiàn)實(shí),將贏得史詩般競(jìng)爭(zhēng)”
-
被災(zāi)民暴罵到當(dāng)場(chǎng)破防,馬克龍發(fā)飆:你該慶幸你在法國(guó)!
-
美高校敦促國(guó)際學(xué)生抓緊回來:萬一把中印拉黑名單呢
-
美國(guó)政府“逃過一劫”
-
“澤連斯基要求歐盟新外長(zhǎng):對(duì)華批評(píng)要降調(diào)”
-
澳大利亞來了,中國(guó)就得走人?澳總理這么回應(yīng)
-
美媒感慨:基建狂魔發(fā)力,我們又要被超越了
-
英國(guó)剛公布新任大使,特朗普顧問就痛罵:傻X
-
“來自中國(guó)的老大哥能確保我們…”
-
俄羅斯的報(bào)復(fù)來了
-
澤連斯基罵普京“傻子”,俄方怒斥
-