①中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布,產(chǎn)品主要面向未來(lái)數(shù)據(jù)中心和云原生環(huán)境并進(jìn)行了定制優(yōu)化; ②在算網(wǎng)融合的技術(shù)發(fā)展與應(yīng)用下,DPU等一類用于加速各種數(shù)據(jù)處理的產(chǎn)品重要性凸顯,中科馭數(shù)CEO鄢貴海表示,網(wǎng)中有算這件事情,只有DPU可以干。
《科創(chuàng)板日?qǐng)?bào)》6月20日訊(記者 郭輝) 國(guó)內(nèi)首顆量產(chǎn)全功能DPU算力芯片面市。
昨日(6月19日),中科馭數(shù)第三代DPU芯片K2-Pro正式發(fā)布。K2-Pro是目前國(guó)內(nèi)首顆量產(chǎn)全功能DPU算力芯片,產(chǎn)品主要面向未來(lái)數(shù)據(jù)中心和云原生環(huán)境并進(jìn)行了定制優(yōu)化。
據(jù)了解,在數(shù)據(jù)處理方面,K2-Pro包處理速率可達(dá)80Mpps,復(fù)雜服務(wù)網(wǎng)格性能從400微秒降至30微秒以內(nèi)。通過(guò)PPP、NP內(nèi)核及P4可編程架構(gòu),K2-Pro能夠?qū)崿F(xiàn)業(yè)務(wù)與同構(gòu)算力、異構(gòu)算力靈活擴(kuò)展;在DPU復(fù)雜場(chǎng)景下,能耗較上一代降低30%。
在算網(wǎng)融合的技術(shù)發(fā)展與應(yīng)用下,DPU等一類用于加速各種數(shù)據(jù)處理的產(chǎn)品,重要性凸顯。然而與之伴隨的是,DPU這一產(chǎn)品概念在近幾年發(fā)展中受到不少爭(zhēng)議,比如DPU與智能網(wǎng)卡功能與定位是否重合,英偉達(dá)等廠商對(duì)DPU的公開討論越來(lái)越少是否意味著被戰(zhàn)略性放棄等。
中科馭數(shù)CEO鄢貴海表示:“網(wǎng)中有算這件事情,只有DPU可以干,這樣的負(fù)載類型不是單純靠CPU能夠處理?!睋?jù)介紹,為應(yīng)對(duì)行業(yè)趨勢(shì),中科馭數(shù)對(duì)DPU的定義跟設(shè)計(jì)也有相應(yīng)變化,不再將DPU視為單一芯片,而是從先進(jìn)芯片架構(gòu)、高兼容性的軟件生態(tài)、低成本部署及業(yè)務(wù)驗(yàn)證等三個(gè)維度重新定義其價(jià)值。
關(guān)于DPU在新的發(fā)展階段的新思考,在發(fā)布會(huì)后,中科馭數(shù)CEO鄢貴海、CTO盧文巖、高級(jí)副總裁張宇接受了《科創(chuàng)板日?qǐng)?bào)》在內(nèi)的媒體采訪。
國(guó)產(chǎn)DPU概念需要重新被定義
“DPU是進(jìn)行算網(wǎng)融合的關(guān)鍵組件”。鄢貴海表示,如今DPU應(yīng)用絕對(duì)不僅是卸載部分CPU負(fù)載那么簡(jiǎn)單,“有些任務(wù)——比如處理安全上的業(yè)務(wù)、做分布式安全機(jī)制等,不僅GPU干不了,CPU本身也不太能有效處理,而在DPU上做這件事情就會(huì)非常簡(jiǎn)單”。在中科馭數(shù)看來(lái),DPU功能不僅需要提高算網(wǎng)的計(jì)算集群效率,同時(shí)還要求能夠提高計(jì)算集群運(yùn)維水平、提高集群整體算力規(guī)模。
算網(wǎng)融合是以通信網(wǎng)絡(luò)設(shè)施和計(jì)算設(shè)施的融合發(fā)展為基礎(chǔ),通過(guò)計(jì)算、存儲(chǔ)及網(wǎng)絡(luò)資源統(tǒng)一編排管控,滿足業(yè)務(wù)對(duì)網(wǎng)絡(luò)和算力靈活泛在、彈性敏捷、智能隨機(jī)應(yīng)用需求的一種新型業(yè)務(wù)模式。
從兩年前東數(shù)西算國(guó)家戰(zhàn)略的引入,逐步到去年年底算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)規(guī)劃發(fā)布,到今年各地智算中心全面鋪開,算網(wǎng)一體化模式已深入眾多產(chǎn)業(yè)的技術(shù)迭代和應(yīng)用發(fā)展的大節(jié)奏之中。
其中,DPU也從以前服務(wù)器板卡的產(chǎn)品形態(tài)進(jìn)一步發(fā)展,時(shí)至今日承擔(dān)了越來(lái)越重要的算力來(lái)源支撐。
鄢貴海表示,DPU需要被重新定義,不能單純只搞芯片這一件事情。DPU本身功能,如果還是與原來(lái)狹義理解的DPU負(fù)責(zé)卸載CPU負(fù)載的視角去看待,顯然太過(guò)于局限。就像現(xiàn)在看計(jì)算機(jī)系統(tǒng),應(yīng)該要看整體的分布式集群性系統(tǒng)一樣?!艾F(xiàn)在DPU也要逐步建立起軟件的護(hù)城河,還要做好平臺(tái)上門,用最低的成本讓客戶接入DPU規(guī)?;渴鹋c業(yè)務(wù)驗(yàn)證,讓DPU軟硬件技術(shù)在云里面落地生根?!?/p>
民生證券研究報(bào)告觀點(diǎn)認(rèn)為,得益于智能網(wǎng)卡方案的逐步成熟,疊加全球通用服務(wù)器出貨量的穩(wěn)定增長(zhǎng)、L3以上級(jí)別智能駕駛汽車的技術(shù)落地、工業(yè)控制領(lǐng)域的需求增加等原因,全球、國(guó)內(nèi)DPU產(chǎn)業(yè)均有望實(shí)現(xiàn)快速發(fā)展。
DPU未來(lái)應(yīng)用需進(jìn)一步融入高算力節(jié)點(diǎn)
DPU的技術(shù)和功能價(jià)值過(guò)去也得到了英偉達(dá)這樣的行業(yè)巨頭認(rèn)可。2020年,英偉達(dá)在GTC戰(zhàn)略發(fā)布中將DPU定義為“第三顆主力芯片”?;贕PU、DPU和CPU三種新一代架構(gòu)構(gòu)建的NVIDIA加速計(jì)算平臺(tái),英偉達(dá)目標(biāo)指向重塑AI時(shí)代的數(shù)據(jù)中心。
據(jù)了解,DPU由基礎(chǔ)網(wǎng)卡進(jìn)化而來(lái),具有獨(dú)立計(jì)算單元是DPU相較于普通網(wǎng)卡的主要特征,可通過(guò)ASIC/FPGA/SoC等技術(shù)實(shí)現(xiàn)。從核心功能來(lái)看,DPU主要是從CPU上卸載關(guān)鍵網(wǎng)絡(luò)、存儲(chǔ)、安全任務(wù),以降低CPU的運(yùn)算壓力,從而提升整個(gè)數(shù)據(jù)中心的運(yùn)行效率。
然而近兩年DPU的定位和功能也受到一定挑戰(zhàn)。最直觀的感受是,英偉達(dá)如今已經(jīng)很少公開單獨(dú)談?wù)揇PU了,而且國(guó)內(nèi)涌現(xiàn)出來(lái)的主打DPU產(chǎn)品的廠商,也不如GPU/CPU的項(xiàng)目多。
鄢貴海認(rèn)為,其中的緣由與英偉達(dá)自身的技術(shù)概念營(yíng)銷及產(chǎn)品方案策略有關(guān),國(guó)外芯片巨頭對(duì)其DPU產(chǎn)品形態(tài)和定位的調(diào)整依然值得關(guān)注。與此同時(shí),在“大廠弊病”之下,這些巨頭產(chǎn)品迭代節(jié)奏降緩,對(duì)于國(guó)內(nèi)廠商來(lái)說(shuō)反而是機(jī)會(huì)。
“2021年DPU熱度達(dá)到高峰,到2022年行業(yè)形成聚力,再到2023年、2024年迎來(lái)產(chǎn)品大規(guī)模應(yīng)用的關(guān)鍵階段,其間英偉達(dá)逐步把原來(lái)狹義的DPU剝離了出來(lái),并將DPU概念轉(zhuǎn)移到到NV-Link上,只是不把NV-Link叫DPU,這更多是一種概念的營(yíng)銷。”
鄢貴海表示,英偉達(dá)在推產(chǎn)品時(shí),基本是以集群的形式、以完整的高算力節(jié)點(diǎn)來(lái)作為產(chǎn)品形態(tài)。在DPU產(chǎn)品方面,英偉達(dá)并沒(méi)有加以弱化,DGX里面仍然在部署DPU系統(tǒng)。
端側(cè)加上DPU和已經(jīng)非常完善的CX系列高性能網(wǎng)卡,“可以說(shuō)全都是英偉達(dá)的王牌,但不會(huì)像之前一樣全都亮出來(lái)”。鄢貴海認(rèn)為,英偉達(dá)的一體化技術(shù),重型行業(yè)游戲規(guī)則,對(duì)國(guó)內(nèi)未來(lái)做算力或大規(guī)模芯片相關(guān)的廠商來(lái)說(shuō),是一個(gè)非常好的指向。
除英偉達(dá)外,英特爾與AMD兩家芯片巨頭亦有DPU項(xiàng)目的布局。其中,英特爾基礎(chǔ)設(shè)施處理器(IPU)定位與DPU類似,是一種可編程的網(wǎng)絡(luò)設(shè)備,可以管理存儲(chǔ)流量,減少時(shí)延,同時(shí)通過(guò)無(wú)磁盤服務(wù)器架構(gòu)有效利用存儲(chǔ)容量,能夠使云和通信服務(wù)提供商減少在CPU方面的開銷,充分釋放性能價(jià)值。AMD則在2022年以19億美元收購(gòu)Pensando并正式進(jìn)軍DPU領(lǐng)域,Pensando公司CEO和團(tuán)隊(duì)加入AMD的數(shù)據(jù)中心解決方案部門。
“英特爾IPU從定位上來(lái)看要更高,直接把基礎(chǔ)設(shè)施作為DPU的定義其實(shí)是極其準(zhǔn)確的。但是英特爾作為行業(yè)內(nèi)的‘大象’,專屬權(quán)力就是慢?!臂迟F海表示,雖然IPU定位很好、基礎(chǔ)也不錯(cuò),但是迭代非常慢,而AMD收購(gòu)初創(chuàng)公司也有可能直接減慢其DPU項(xiàng)目發(fā)展?!皩?duì)馭數(shù)來(lái)說(shuō),DPU的定義是集眾家之長(zhǎng),真正還原DPU之于整個(gè)計(jì)算系統(tǒng)的意義。”
DPU的功能和應(yīng)用范圍都要多過(guò)傳統(tǒng)網(wǎng)卡
智算中心的多點(diǎn)全面鋪開也讓智能網(wǎng)卡或以太網(wǎng)物理芯片的需求,成為業(yè)內(nèi)眾多廠商的創(chuàng)新和產(chǎn)業(yè)化競(jìng)爭(zhēng)的焦點(diǎn)。目前浪潮、新華三、博通等廠商均有相關(guān)布局。
DPU的產(chǎn)品概念和技術(shù)特點(diǎn),也被直接拿來(lái)與智能網(wǎng)卡進(jìn)行對(duì)比。究竟孰優(yōu)孰劣、是否會(huì)被取代,受到業(yè)內(nèi)的關(guān)注和討論。
面對(duì)爭(zhēng)議,鄢貴海接受采訪時(shí)認(rèn)為,DPU不會(huì)被取代,其獨(dú)特優(yōu)勢(shì)反而會(huì)在未來(lái)的智算中心建設(shè)中迎來(lái)需求放量。
“所謂的智算中心網(wǎng)卡,其功能來(lái)說(shuō)在智算中心中要解決的核心問(wèn)題是GPU之間、GPU跟存儲(chǔ)之間的通信,但在解決GPU跟CPU路徑中的帶寬和數(shù)據(jù)流量的問(wèn)題時(shí)沒(méi)有那么顯著?!臂迟F海表示,網(wǎng)卡主要解決網(wǎng)絡(luò)數(shù)據(jù)進(jìn)入后通過(guò)PCIe設(shè)備接入主機(jī)的過(guò)程,并不會(huì)對(duì)高帶寬的要求進(jìn)行特殊處理,這種情況下傳統(tǒng)網(wǎng)卡不太適用于未來(lái)智算中心的網(wǎng)絡(luò)接口卡位置。
在鄢貴海看來(lái),DPU要支持類似于GBR、GBS的負(fù)載,其實(shí)就是給GPU之間、GPU和CPU之間的通信找到一條快速通路,這一通路要搭建在全新的網(wǎng)絡(luò)設(shè)備接口上,而全新的網(wǎng)絡(luò)接口就是DPU。因此,DPU的功能和應(yīng)用范圍都要多過(guò)傳統(tǒng)網(wǎng)卡,“未來(lái)智算中心里面DPU用的量不僅不會(huì)少,還會(huì)越來(lái)越多?!?/p>
“當(dāng)然,數(shù)據(jù)中心網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜,通常網(wǎng)絡(luò)不可能只有一套”。鄢貴海也表示,未來(lái)不同網(wǎng)絡(luò)可能要用不同的功能,比如運(yùn)維、管控、監(jiān)控用傳統(tǒng)以太做,智算靠無(wú)損RDMA的網(wǎng)絡(luò)?!斑@種情況下,在智算中心中有用傳統(tǒng)網(wǎng)卡的需求,但是更大的需求、增長(zhǎng)更快的需求,還是在高速網(wǎng)絡(luò)、高速的RDMA及無(wú)損網(wǎng)絡(luò)上?!?/p>