-
中國首個(gè)異構(gòu)計(jì)算處理器IP核在硅上成功實(shí)現(xiàn)
分享到:關(guān)鍵字: 異構(gòu)計(jì)算異構(gòu)計(jì)算處理器IPIP核華夏芯日前,中國華夏芯公司宣布,其異構(gòu)計(jì)算處理器IP核已經(jīng)在硅片上成功實(shí)現(xiàn),并已通過HSA(異構(gòu)系統(tǒng)架構(gòu))一致性測試。公司還宣布了新的機(jī)器學(xué)習(xí)和深層神經(jīng)網(wǎng)絡(luò)的開源項(xiàng)目,旨在進(jìn)一步推動(dòng)HSA異構(gòu)計(jì)算的發(fā)展。本次華夏芯推出的產(chǎn)品則是國內(nèi)企業(yè)在異構(gòu)計(jì)算上的技術(shù)突破,并有望在人工智能、機(jī)器視覺、工業(yè)4.0、移動(dòng)通信、無人機(jī)等領(lǐng)域推廣應(yīng)用。
什么是異構(gòu)計(jì)算
同構(gòu)計(jì)算是使用相同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式。而異構(gòu)計(jì)算主要是指使用不同類型指令集和體系架構(gòu)的計(jì)算單元組成系統(tǒng)的計(jì)算方式,常見的計(jì)算單元類別包括CPU、GPU、DSP、ASIC、FPGA等。異構(gòu)計(jì)算用簡單的公式可以表示為“CPU+XXX”,究其本質(zhì)而言Cpu+本質(zhì)上指的是單核與多核能力的提升。舉例來說,AMD著力發(fā)展的APU就屬于異構(gòu)計(jì)算,用公式表示就是CPU+GPU。
由于術(shù)業(yè)有專攻,CPU、GPU、DSP、ASIC、FPGA各有所長,在一些場景下,引入特定計(jì)算單元,讓計(jì)算系統(tǒng)變成混合結(jié)構(gòu),就能讓CPU、GPU、DSP、FPGA執(zhí)行自己最擅長的任務(wù)。如果能做到無縫地將運(yùn)行于CPU之上的通用計(jì)算、運(yùn)行于GPU之上的并行計(jì)算、運(yùn)行于DSP之上或者ASIC/FPGA之上的優(yōu)化計(jì)算整合在一起,就能獲得更好的應(yīng)用性能,更低的功耗等特性,相對于同構(gòu)計(jì)算而言也可能有一定性能優(yōu)勢。
在超算上已經(jīng)得到廣泛應(yīng)用
其實(shí),異構(gòu)計(jì)算對大家而言并不陌生,在TOP500刷榜的天河2號(hào)和神威太湖之光都采用了異構(gòu)計(jì)算。其原因就在于異構(gòu)計(jì)算能帶來很高的性能和性能功耗比,以天河2號(hào)的一個(gè)計(jì)算節(jié)點(diǎn)為例。
Xeon E5的滿載功耗達(dá)145W,雙精浮點(diǎn)為0.21T Flops,而Xeon PHI功耗300W,雙精浮點(diǎn)達(dá)1T Flops。
天河2號(hào)一個(gè)計(jì)算節(jié)點(diǎn)由2片Xeon E5和3片Xeon PHI,理論雙精浮點(diǎn)性能為3.42T Flops,功耗為1190W,理論雙精浮點(diǎn)性能與功耗的比值為2.87GFlops/W。相同功耗下使用8片Xeon E5只能獲得1696Gflops的理論雙精浮點(diǎn)性能,理論雙精浮點(diǎn)性能與功耗的比值為1.42GFlops/W。從數(shù)據(jù)可以看出,在同等功耗下,在使用Xeon PHI加速后,理論雙精浮點(diǎn)性能與是只使用Xeon E5的2倍。
正是因?yàn)楫悩?gòu)計(jì)算在理論上有著諸多的優(yōu)勢,一些媒體將“CPU+XXX”稱為下一代處理器。
指令集自主開發(fā)
HSA協(xié)會(huì)正在推動(dòng)異構(gòu)計(jì)算向各個(gè)方面普及,而華夏芯則是其中的一份子,共同推動(dòng)異構(gòu)計(jì)算向越來越多的領(lǐng)域普及。
也許很多人從來沒有聽說過華夏芯這樣一家公司,但該公司確實(shí)是中國第一家從事異構(gòu)計(jì)算處理器IP核設(shè)計(jì)的集成電路企業(yè)——華夏芯公司是一個(gè)定位于全球市場的中國公司,研發(fā)團(tuán)隊(duì)的來源也是全球化,但是從技術(shù)到人才都掌握在華夏芯手中,比如華夏芯的3合1“ Unity”體系架構(gòu)是其獨(dú)創(chuàng)技術(shù),在同行業(yè)中也處于領(lǐng)先地位。
更難得的是,華夏芯并沒有像一些商業(yè)公司那樣購買ARM指令集,而是公司自主開發(fā)的指令集、微結(jié)構(gòu)和工具鏈。因此,在自主創(chuàng)新能力上,和一些購買ARM IP授權(quán)開發(fā)所謂“國產(chǎn)”CPU的國內(nèi)廠商有著本質(zhì)上的區(qū)別。
可以對外授權(quán)IP
華夏芯公司最近發(fā)布了一系列新的IP授權(quán)產(chǎn)品,在全球范圍授權(quán)IP,為客戶提供一流的處理器設(shè)計(jì)技術(shù)。所有華夏芯的處理器均支持HSA。對此,華夏芯的董事長李科奕表示,“我們很高興地看到華夏芯的新IP核通過了PRM HSA一致性測試,面向工業(yè)、物聯(lián)網(wǎng)、高級駕駛輔助系統(tǒng)(ADAS)和嵌入式系統(tǒng),該IP核對功耗進(jìn)行了優(yōu)化并向全球提供許可”。
據(jù)了解,華夏芯還是中國唯二的可以對外授權(quán)IP的處理器公司(另一家是龍芯),在中國大多數(shù)CPU公司還處于購買國外IP做集成的時(shí)代,華夏芯能夠自己開發(fā)IP并且能夠?qū)ν馐跈?quán)就顯得尤為難得。目前,華夏芯的CPU核可以通過IP授權(quán)的方式提供給客戶,第一款CPU已經(jīng)在臺(tái)積電使用28nm HPC制成工藝流片,2016年第3季度提供給潛在客戶作為評估或開發(fā)之用。
在技術(shù)創(chuàng)新上可圈可點(diǎn)
本次在硅片上實(shí)現(xiàn)的IP核是華夏芯3合1“ Unity”體系架構(gòu)的首次實(shí)現(xiàn)。Unity具有包括圖像和視頻處理在內(nèi)的多維信號(hào)處理能力。華夏芯美國研發(fā)中心的CTO Mayan Moudgill博士表示,“矢量處理長度可依據(jù)矢量計(jì)算的需求動(dòng)態(tài)設(shè)置,最大配置達(dá)到64KB,滿足各種智能化應(yīng)用和高性能計(jì)算對并行計(jì)算的要求,保證了指令架構(gòu)的穩(wěn)健性和軟件代碼的移植性。變長矢量處理單元(VPU)在進(jìn)行大量數(shù)據(jù)處理的同時(shí),結(jié)合了低功耗、亂序執(zhí)行流水線等多項(xiàng)先進(jìn)技術(shù),從而使多個(gè)控制線程高效地執(zhí)行”。
值得關(guān)注的是,在華夏芯面向全球發(fā)布上述消息2天之后,ARM也發(fā)布了與其類似的V8-A的矢量擴(kuò)展架構(gòu)(SVE),其技術(shù)特征與華夏芯推出的VPU單元極為相似。這說明,真正從事自主創(chuàng)新的國產(chǎn)處理器設(shè)計(jì)公司完全可以在核心技術(shù)上達(dá)到國際領(lǐng)先水平,其創(chuàng)新能力要遠(yuǎn)遠(yuǎn)優(yōu)于那些通過IP授權(quán)設(shè)計(jì)CPU的公司,畢竟后者在自主創(chuàng)新的空間上受到授權(quán)許可方極其嚴(yán)苛的各種限制和制約。
-
本文僅代表作者個(gè)人觀點(diǎn)。
- 請支持獨(dú)立網(wǎng)站,轉(zhuǎn)發(fā)請注明本文鏈接:http://cxkknvh.com/tieliu/2016_08_31_373004.shtml
- 責(zé)任編輯:孫武
-
還想理賠?“保險(xiǎn)公司早就跑完了” 評論 81“美國‘記吃不記打’,再蠢下去中國就要贏了” 評論 177“中國令美國望塵莫及,NASA至少落后四年!” 評論 180“洛杉磯完蛋了”,特朗普怒批:都是他的錯(cuò)! 評論 336最新聞 Hot
-
還想理賠?“保險(xiǎn)公司早就跑完了”
-
美駐華大使叨叨:盡最后努力勸中國,好好想想吧
-
美國六大行后,全球最大資管公司也“跪”了
-
雷蒙多不爽“企業(yè)光想著賺中國錢”,英偉達(dá)反擊
-
特朗普:普京想見我,安排上
-
“讓我們吞并美國三個(gè)州如何?”
-
韓國總統(tǒng)警衛(wèi)處長到案:對總統(tǒng)執(zhí)行拘留令不可行
-
“中國令美國望塵莫及,NASA至少落后四年!”
-
“美國‘記吃不記打’,再蠢下去中國就要贏了”
-
“就像原子彈砸在美國”
-
美眾議院通過決議制裁國際刑事法院
-
“稀土礦遠(yuǎn)低于中企出價(jià)賣給美企”,原來是美國丹麥搗鬼?
-
特朗普立的flag,要倒了
-
雷蒙多放話:下周敲定,不能等到200萬中國車在美國路上了…
-
最高法院5:4,駁回
-
歐爾班挑戰(zhàn)者挑釁:押注中國,錯(cuò)了
-