-
阿里“最強開源模型”,昇騰、海光已適配
最后更新: 2025-04-29 14:30:26(文/楊依婷 編輯/呂棟)
4月29日凌晨,阿里新一代通義千問模型Qwen3發(fā)布并開源,它的參數(shù)量僅為DeepSeek-R1的1/3,但成本大幅下降,性能超越R1、OpenAI-o1等全球頂尖模型,被媒體稱為“全球最強開源模型”。
隨后,華為計算官方發(fā)文稱,此次Qwen3系列一經(jīng)發(fā)布開源,即在MindSpeed和MindIE中開箱即用,實現(xiàn)Qwen3的0Day適配。海光信息方面也表示,海光DCU迅速完成對全部8款模型的無縫適配+調優(yōu)。
根據(jù)阿里云官方信息,此次開源包括兩款MoE模型:Qwen3-235B-A22B(2350多億總參數(shù)、 220多億激活參),以及Qwen3-30B-A3B(300億總參數(shù)、30億激活參數(shù));以及六個Dense模型:Qwen3-32B、Qwen3-14B、Qwen3-8B、Qwen3-4B、Qwen3-1.7B和Qwen3-0.6B。
其中的旗艦模型Qwen3-235B-A22B在代碼、數(shù)學、通用能力等基準測試中,與DeepSeek-R1、o1、o3-mini、Grok-3和Gemini-2.5-Pro等頂級模型相比,表現(xiàn)出極具競爭力的結果。
此外,小型MoE模型Qwen3-30B-A3B的激活參數(shù)數(shù)量是QwQ-32B的10%,表現(xiàn)更勝一籌,甚至像Qwen3-4B這樣的小模型也能匹敵Qwen2.5-72B-Instruct的性能。
Qwen3是國內首個“混合推理模型”,模型支持兩種思考模式:思考模式:在這種模式下,模型會逐步推理,經(jīng)過深思熟慮后給出最終答案。這種方法適合需要深入思考的復雜問題。非思考模式:在此模式中,模型提供快速、近乎即時的響應,適用于那些對速度要求高于深度的簡單問題。
在預訓練方面,Qwen3的數(shù)據(jù)集相比Qwen2.5有了顯著擴展。Qwen2.5是在18萬億個token上進行預訓練的,而Qwen3使用的數(shù)據(jù)量幾乎是其兩倍,達到了約36萬億個token,涵蓋了119種語言和方言。
從官方數(shù)據(jù)來看,在考察代碼能力的LiveCodeBench評測中,Qwen3突破70分大關,表現(xiàn)甚至超過Grok3;在評估模型人類偏好對齊的ArenaHard的測評中,Qwen3分別以95.6分超越了OpenAI-o1及DeepSeek-R1;在評估奧數(shù)水平的AIME25測評中,Qwen3以81.5分刷新開源記錄。
Qwen3發(fā)布后,華為計算方面發(fā)文稱,此前昇騰MindSpeed和MindIE一直同步支持Qwen系列模型,此次Qwen3系列一經(jīng)發(fā)布開源,即在MindSpeed和MindIE中開箱即用,實現(xiàn)Qwen3的0Day適配。
隨后海光信息也表示,在“深算智能”戰(zhàn)略引領下,海光DCU迅速完成對全部8款模型的無縫適配+調優(yōu),覆蓋235B/32B/30B/14B/8B/4B/1.7B/0.6B,實現(xiàn)零報錯、零兼容性問題的秒級部署。
本文系觀察者網(wǎng)獨家稿件,未經(jīng)授權,不得轉載。
- 責任編輯: 楊依婷 
-
美的格力隔空打架,誰是“家用空調線上零售第一”?
2025-04-29 13:58 觀網(wǎng)財經(jīng)-消費 -
特朗普發(fā)動單邊貿易霸凌后,比交易更“藝術”的事情出現(xiàn)了…
2025-04-29 13:18 -
向AI電商領域進軍,ChatGPT搜索上線購物推薦功能
2025-04-29 12:21 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
阿里發(fā)布并開源模型Qwen3,成本僅為DeepSeek-R1的1/3
2025-04-29 11:16 觀網(wǎng)財經(jīng)-科創(chuàng) -
Qwen3性能超越DS-R1;曝馬斯克孩子遠超14個;ChatGPT推出購物功能
2025-04-29 09:02 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
截至3月末,全國地方政府債務余額501650億元
2025-04-29 08:46 -
茶咖日報|滬上阿姨5月8日起在港交所交易
2025-04-28 19:55 觀網(wǎng)財經(jīng)-消費 -
最強“蘋”替?vivo稱備貨幾十萬的新旗艦已缺貨
2025-04-28 18:08 觀網(wǎng)財經(jīng)-科創(chuàng) -
華為獨占近80%份額,折疊屏的戰(zhàn)爭結束了嗎?
2025-04-28 18:05 觀網(wǎng)財經(jīng)-科創(chuàng) -
Switch新機或將面臨高額關稅沖擊,消費者擔憂價格上漲
2025-04-28 17:33 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
加碼多模態(tài)能力,夸克發(fā)布全新“AI相機”
2025-04-28 17:24 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
AIDC建設與國產(chǎn)替代加速,良信股份一季度營利雙增
2025-04-28 17:07 觀網(wǎng)財經(jīng)-科創(chuàng) -
Kimi與財新傳媒達成內容合作 上線權威信源徽章認證
2025-04-28 16:11 觀網(wǎng)財經(jīng)-互聯(lián)網(wǎng) -
美債下跌會否影響中國的美元資產(chǎn)收益?央行回應
2025-04-28 10:59 金融觀察 -
穩(wěn)健領跑,濱江集團首進全國前十
2025-04-28 10:36 觀網(wǎng)財經(jīng)-房產(chǎn) -
歐菲光一季度再虧5895萬:手機汽車都卷,怎么辦?
2025-04-28 09:49 觀網(wǎng)財經(jīng)-科創(chuàng) -
寶馬中國宣布接入DS;美的人形機器人5月進廠;哪吒2獲華表獎特別貢獻影片
2025-04-28 08:41 觀網(wǎng)財經(jīng)-科創(chuàng) -
五糧液2024年營收近900億元,毛利率超82%
2025-04-27 20:53 觀網(wǎng)財經(jīng)-消費 -
超越DeepSeek,中國開源“集團軍”重塑全球AI生態(tài)
2025-04-27 20:47 觀察者頭條 -
“落寞網(wǎng)紅”綠茶,為IPO愛上下沉市場
2025-04-27 18:55 觀網(wǎng)財經(jīng)-消費
相關推薦 -
0人付款!美國人買美國貨還是中國貨?結果扎心了… 評論 248沖突升級?巴防長:印軍“入侵”迫在眉睫 評論 198“這將是美國盟友對特朗普的第一場民意公投” 評論 59沒有中國制造的家可能嗎?美媒畫了張圖… 評論 152最新聞 Hot
-
美國工人造手機?“做大頭夢,最小螺絲都是中國造…”
-
外媒熱議中方這一表態(tài),美農崩了
-
“中國發(fā)貨吧,關稅美國人自己出”
-
卡尼宣布勝選:對美國,決不“跪”
-
董襲瑩本科相當于國內三本?“什么是協(xié)和4+4”沖上熱搜
-
0人付款!美國人買美國貨還是中國貨?結果扎心了…
-
中國取得EUV技術重要突破,阿斯麥CEO還在嘴硬?
-
美學者出新書《日本大屠殺》,日本右翼坐不住了
-
清華“挖”來美國頂尖AI學者
-
“這是逼中國放棄美債,特朗普搬起石頭砸自己的腳”
-
“如果中國垮了,地球上每個國家都會垮,包括美國”
-
沖突升級?巴防長:印軍“入侵”迫在眉睫
-
新增三省兩市,西湖大學將招收浙江外本科學生
-
自民黨高官自夸:中國要“補缺”,日本能幫美國
-
“卡尼領導的自由黨將勝選”
-
澤連斯基承認:我們干的
-