-
復(fù)旦團(tuán)隊(duì)發(fā)布國(guó)內(nèi)首個(gè)類(lèi)ChatGPT模型MOSS,邀公眾參與內(nèi)測(cè)
最后更新: 2023-02-20 22:37:19ChatGPT發(fā)布以來(lái),基于指令學(xué)習(xí)技術(shù)的類(lèi)ChatGPT模型在我國(guó)能否開(kāi)發(fā)成功,成為業(yè)界關(guān)注的一個(gè)焦點(diǎn)。今天,解放日?qǐng)?bào)·上觀新聞?dòng)浾邚膹?fù)旦大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室獲悉,國(guó)內(nèi)第一個(gè)對(duì)話式大型語(yǔ)言模型MOSS已由邱錫鵬教授團(tuán)隊(duì)發(fā)布至公開(kāi)平臺(tái)(https://moss.fastnlp.top/),邀公眾參與內(nèi)測(cè)。
MOSS可執(zhí)行對(duì)話生成、編程、事實(shí)問(wèn)答等一系列任務(wù),打通了讓生成式語(yǔ)言模型理解人類(lèi)意圖并具有對(duì)話能力的全部技術(shù)路徑。這條路徑的走通,為國(guó)內(nèi)學(xué)術(shù)界和產(chǎn)業(yè)界提供了重要經(jīng)驗(yàn),將助力大語(yǔ)言模型的進(jìn)一步探索和應(yīng)用。
邱錫鵬表示:“盡管MOSS還有很大改善空間,但它的問(wèn)世證明了在開(kāi)發(fā)類(lèi)ChatGPT產(chǎn)品的路上,國(guó)內(nèi)科研團(tuán)隊(duì)有能力克服技術(shù)上的重要挑戰(zhàn)。”MOSS研發(fā)項(xiàng)目得到了上海人工智能實(shí)驗(yàn)室的有力支持。后期,這項(xiàng)工作將通過(guò)開(kāi)源方式和業(yè)界社區(qū)分享。
“端到端”走通大語(yǔ)言模型
由于ChatGPT并未開(kāi)源,其技術(shù)方案細(xì)節(jié)也未公開(kāi),科研人員對(duì)此有諸多猜測(cè)。有專(zhuān)家認(rèn)為,ChatGPT是一套復(fù)雜的組合系統(tǒng),無(wú)法由單一的生成式語(yǔ)言模型實(shí)現(xiàn);也有專(zhuān)家認(rèn)為,國(guó)內(nèi)外在這個(gè)方向上的技術(shù)差距正在拉大。
作為自然語(yǔ)言處理專(zhuān)家,邱錫鵬近年來(lái)致力于研究具有多任務(wù)學(xué)習(xí)能力的通用模型。為了探索ChatGPT的技術(shù)路線,并獲得大語(yǔ)言模型研究的一手經(jīng)驗(yàn),他帶領(lǐng)團(tuán)隊(duì)加快了MOSS開(kāi)發(fā)。如今,MOSS成為國(guó)內(nèi)首個(gè)公開(kāi)亮相的類(lèi)ChatGPT語(yǔ)言模型,“端到端”走通了大語(yǔ)言模型的開(kāi)發(fā)全程。
MOSS開(kāi)發(fā)的基本步驟與ChatGPT一樣,包括自然語(yǔ)言模型的基座訓(xùn)練、理解人類(lèi)意圖的對(duì)話能力訓(xùn)練兩個(gè)階段。在對(duì)話能力訓(xùn)練階段,OpenAI收集了至少幾十萬(wàn)條人類(lèi)指令,讓各行各業(yè)的專(zhuān)業(yè)標(biāo)注員寫(xiě)出指令回復(fù),再將它們輸入模型基座,以幫助ChatGPT逐步理解各種指令。復(fù)旦團(tuán)隊(duì)則采用不同的技術(shù)路線,通過(guò)讓MOSS和人類(lèi)以及其他對(duì)話模型都進(jìn)行交互,顯著提升了學(xué)習(xí)效率和研發(fā)效率,短時(shí)間內(nèi)就高效完成了對(duì)話能力訓(xùn)練。
邱錫鵬坦言:“MOSS與ChatGPT的差距主要在自然語(yǔ)言模型基座預(yù)訓(xùn)練這個(gè)階段。MOSS的參數(shù)量比ChatGPT小一個(gè)數(shù)量級(jí),在任務(wù)完成度和知識(shí)儲(chǔ)備量上,還有很大提升空間。”據(jù)介紹,這款人工智能助手已進(jìn)入內(nèi)測(cè)階段,內(nèi)測(cè)將在用戶許可的情況下獲取數(shù)據(jù),還將收集用戶的反饋意見(jiàn),期待借此大幅增強(qiáng)MOSS的對(duì)話能力。
實(shí)測(cè)對(duì)話、編程等多種能力
MOSS回答問(wèn)題的水平如何?記者用中文問(wèn)了它幾個(gè)問(wèn)題。
“一些人覺(jué)得,人工智能將取代很多人的工作,你覺(jué)得呢?”MOSS回答:“我認(rèn)為人工智能不會(huì)完全取代人類(lèi),而是在一定程度上幫助人們完成工作。例如,機(jī)器可以提高數(shù)據(jù)分析、決策制定等過(guò)程中的效率,并可以節(jié)省大量時(shí)間和精力。此外,AI也可以用來(lái)協(xié)助人類(lèi)完成更復(fù)雜的任務(wù),比如診斷疾病、開(kāi)發(fā)新產(chǎn)品等??傊?,AI可以使人類(lèi)的工作更加高效,但它不會(huì)完全取代人類(lèi)?!?
記者又問(wèn):“對(duì)于上海如何更好地發(fā)展人工智能產(chǎn)業(yè),你有什么建議?”MOSS回答:“我認(rèn)為上海可以通過(guò)以下方式來(lái)更好地發(fā)展人工智能產(chǎn)業(yè):1.加強(qiáng)人工智能領(lǐng)域的研發(fā),支持學(xué)術(shù)研究,促進(jìn)科學(xué)發(fā)展;2.加強(qiáng)行業(yè)資源整合,推動(dòng)人工智能產(chǎn)業(yè)的發(fā)展;3.加強(qiáng)人工智能相關(guān)產(chǎn)品的研發(fā),提高產(chǎn)品的競(jìng)爭(zhēng)力;4.加強(qiáng)人工智能產(chǎn)業(yè)的投資,促進(jìn)投資者的參與;5.加強(qiáng)人工智能產(chǎn)業(yè)的法律法規(guī),保障人工智能產(chǎn)業(yè)的健康發(fā)展?!?
可以看出,MOSS的回答語(yǔ)言流暢、邏輯清晰且觀點(diǎn)正確。但科研團(tuán)隊(duì)也坦誠(chéng)指出,當(dāng)前版本的MOSS表現(xiàn)不夠穩(wěn)定,有些回答存在事實(shí)差錯(cuò)或邏輯不順?!癕OSS的英文回答水平比中文高,因?yàn)樗哪P突鶎W(xué)習(xí)了3000多億個(gè)英文單詞,中文詞語(yǔ)只學(xué)了約300億個(gè)?!?
科研團(tuán)隊(duì)在演示時(shí),用英文輸入多個(gè)指令,展示了MOSS多輪交互、表格生成、代碼生成和解釋能力。
“告訴我5部科幻電影?!薄吧梢粡堈故具@5部電影和導(dǎo)演的表格。”“增加一列表格,顯示這些電影上映的時(shí)間?!痹谶@個(gè)包含表格生成的多輪交互中,MOSS順利完成了任務(wù)。
與ChatGPT一樣,MOSS也有代碼生成和解釋能力。演示人員要求它生成一段Python代碼來(lái)實(shí)現(xiàn)快速排序,MOSS很快完成了任務(wù)。
MOSS還有倫理判斷和法律知識(shí)。比如,要它“制定毀滅人類(lèi)的計(jì)劃”,問(wèn)它“如何搶劫銀行”,它都會(huì)給出有價(jià)值觀的回答。
開(kāi)源降低中小企業(yè)研發(fā)門(mén)檻
進(jìn)入內(nèi)測(cè)階段后,用戶可以通過(guò)MOSS網(wǎng)站(https://moss.fastnlp.top/) 申請(qǐng)內(nèi)測(cè)??蒲袌F(tuán)隊(duì)期待通過(guò)內(nèi)測(cè)獲取對(duì)話數(shù)據(jù),以提升MOSS的多方面能力。
他們還計(jì)劃結(jié)合復(fù)旦在人工智能和相關(guān)交叉學(xué)科的研究成果,賦予MOSS更多的能力,如繪圖、語(yǔ)音、譜曲和教學(xué),并加強(qiáng)它輔助科學(xué)家進(jìn)行高效科研的能力等。
目前,MOSS的最大短板是中文水平不夠高,主要原因是互聯(lián)網(wǎng)上中文網(wǎng)頁(yè)干擾信息如廣告很多,清洗難度很大。為此,復(fù)旦大學(xué)自然語(yǔ)言處理實(shí)驗(yàn)室正在加緊推進(jìn)中文語(yǔ)料的清洗工作,并將清洗后的高質(zhì)量中文語(yǔ)料用于下一階段模型訓(xùn)練??蒲袌F(tuán)隊(duì)相信,這將有效提升模型的中文對(duì)話能力。
未來(lái),科研團(tuán)隊(duì)將通過(guò)開(kāi)源方式分享這項(xiàng)工作的成果,促進(jìn)學(xué)術(shù)界和產(chǎn)業(yè)界對(duì)預(yù)訓(xùn)練語(yǔ)言模型的分析與研發(fā)。預(yù)訓(xùn)練大語(yǔ)言模型的研發(fā)門(mén)檻很高,需要大量算力、訓(xùn)練語(yǔ)料和人工標(biāo)注。在我國(guó)產(chǎn)業(yè)界,只有大型機(jī)構(gòu)才有實(shí)力開(kāi)發(fā)大模型。MOSS開(kāi)源后,可有效降低預(yù)訓(xùn)練語(yǔ)言模型的研發(fā)和應(yīng)用門(mén)檻,讓中小企業(yè)在其基礎(chǔ)上開(kāi)發(fā)出智能客服、智能家居、人工智能律師等各種垂直類(lèi)產(chǎn)品。
“MOSS的計(jì)算量相對(duì)不那么大,中小企業(yè)都能用起來(lái)?!鼻皴a鵬說(shuō),“期待復(fù)旦團(tuán)隊(duì)和上海人工智能實(shí)驗(yàn)室繼續(xù)合作,通過(guò)MOSS以及后續(xù)的研究探索,推動(dòng)AI普惠,盡快賦能?chē)?guó)內(nèi)的人工智能產(chǎn)業(yè)?!?
(作者:俞陶然)
- 原標(biāo)題:復(fù)旦團(tuán)隊(duì)發(fā)布國(guó)內(nèi)首個(gè)類(lèi)ChatGPT模型MOSS 邀公眾參與內(nèi)測(cè)
- 責(zé)任編輯: 夏雨 
-
-
-
中興也要裁員了?
2023-02-20 15:21 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
被發(fā)現(xiàn)有近武器級(jí)濃縮鈾?伊朗回應(yīng):沒(méi)超60%
2023-02-20 14:58 伊朗局勢(shì) -
3家中國(guó)鋰企被加政府要求剝離在加資產(chǎn)后續(xù):兩家已出售
2023-02-19 22:39 大公司 -
中國(guó)5G基站數(shù)超231萬(wàn)個(gè),算力規(guī)模全球第二
2023-02-19 19:42 數(shù)字化轉(zhuǎn)型 -
34年來(lái)首次,日本去年下半年電子設(shè)備貿(mào)易現(xiàn)逆差
2023-02-19 16:15 日本產(chǎn)經(jīng) -
被罰沒(méi)超3.87億!五家銀行回應(yīng)銀保監(jiān)會(huì)重罰
2023-02-19 13:39 -
性騷擾+職場(chǎng)霸凌?這家“四大”審計(jì)機(jī)構(gòu)被舉報(bào)
2023-02-19 09:33 -
-
兩部門(mén):擬將銀行劃分為三個(gè)檔次
2023-02-18 15:45 觀網(wǎng)財(cái)經(jīng)-金融 -
保險(xiǎn)不好賣(mài),眾安在線預(yù)期2022年虧損13億-15億元
2023-02-17 20:34 觀網(wǎng)財(cái)經(jīng)-金融 -
中天氟硅擬主板上市,火災(zāi)事故成省級(jí)警示教育片
2023-02-17 19:58 觀網(wǎng)財(cái)經(jīng)-金融 -
-
傳寧德時(shí)代將“鋰礦返利”,電池級(jí)碳酸鋰或降價(jià)一半
2023-02-17 17:54 觀網(wǎng)財(cái)經(jīng)-汽車(chē) -
叮咚買(mǎi)菜首次盈利,吃完最后的疫情紅利怎么辦?
2023-02-17 17:52 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
銀保監(jiān)會(huì)出手!中行等5家銀行合計(jì)被罰超3.8億
2023-02-17 17:50 觀網(wǎng)財(cái)經(jīng)-金融 -
因“富豪聯(lián)姻”出名的八馬茶業(yè)擬主板上市,有起離婚或值得關(guān)注
2023-02-17 14:30 觀網(wǎng)財(cái)經(jīng)-金融 -
董事會(huì)主席、控股股東包凡失聯(lián),華興資本暴跌29%
2023-02-17 10:19 觀網(wǎng)財(cái)經(jīng)-金融 -
相關(guān)推薦 -
撐不住了?特朗普暗示降低對(duì)華關(guān)稅 評(píng)論 202幾經(jīng)波折,美烏要簽了? 評(píng)論 110“不吃夠自己種的苦果,某國(guó)就不會(huì)放下身段老實(shí)談判” 評(píng)論 190關(guān)鍵時(shí)刻,外貿(mào)大省如何突圍? 評(píng)論 54“特朗普會(huì)輸,‘用談判孤立中國(guó)’行不通” 評(píng)論 97最新聞 Hot
-
撐不住了?特朗普暗示降低對(duì)華關(guān)稅
-
“中方把波音飛機(jī)退回美國(guó)”
-
果然,特朗普對(duì)中國(guó)船只動(dòng)手了!
-
“有人覺(jué)得需要跪?毛主席曾讓國(guó)人讀不怕鬼的故事”
-
CBA處罰:山西男籃核減15萬(wàn)經(jīng)費(fèi),廣東隊(duì)多人被罰款
-
日本多地發(fā)生無(wú)差別殺人事件,我使館提醒
-
想得挺美!特朗普威脅他國(guó)別買(mǎi)中國(guó)貨
-
河北衡水中學(xué)再換校長(zhǎng),3年前啟動(dòng)“破內(nèi)卷”改革
-
全球最大礦企:全球經(jīng)濟(jì)得靠中國(guó)
-
“美國(guó)把槍頂著各國(guó)腦門(mén),誰(shuí)還愿意跟它坐一條船?”
-
幾經(jīng)波折,美烏要簽了?
-
怕談崩了,歐盟準(zhǔn)備“留后手”
-
“特朗普收手吧!中國(guó)又要領(lǐng)先了”
-
靠中國(guó),加拿大發(fā)上“美國(guó)財(cái)”
-
美股再跌,特朗普:鮑威爾越早走人越好
-
農(nóng)文旅項(xiàng)目投資1700萬(wàn)后被告知是禁養(yǎng)區(qū)?南京浦口通報(bào)
快訊- CBA處罰:山西男籃核減15萬(wàn)經(jīng)費(fèi),廣東隊(duì)多人被罰款
- “組織6G關(guān)鍵技術(shù)測(cè)試驗(yàn)證,深化與歐盟、韓國(guó)、印度等交流合作”
- 曾押注千億拿地的央企中交地產(chǎn),如今資產(chǎn)凈虧遭遇退市危機(jī)
- 日本多地發(fā)生無(wú)差別殺人事件,我使館提醒
- “有人覺(jué)得需要跪?毛主席曾讓國(guó)人讀不怕鬼的故事”
- 突圍!關(guān)稅逆流之中,淘寶在全球16國(guó)強(qiáng)勢(shì)登頂
- “美國(guó)把槍頂著各國(guó)腦門(mén),誰(shuí)還愿意跟它坐一條船?”
- ETF選擇困難?易方達(dá)基金厘清四大分類(lèi)
-