①盤古大模型3.0是一個面向行業(yè)的大模型系列; ②2000P Flops單集群的昇騰AI云服務(wù)在烏蘭察布和貴安同時上線。
《科創(chuàng)板日報(bào)》7月7日訊(記者 黃心怡) 今天,華為開發(fā)者大會2023(Cloud)在中國召開。華為常務(wù)董事、華為云CEO張平安在會上發(fā)布盤古大模型3.0。
華為常務(wù)董事、華為云CEO張平安
“盤古大模型不會寫詩,只會做事?!睆埰桨卜Q。據(jù)介紹,盤古大模型3.0是一個面向行業(yè)的大模型系列,包括“5+N+X”三層架構(gòu):
L0層包括自然語言、視覺、多模態(tài)、預(yù)測、科學(xué)計(jì)算五個基礎(chǔ)大模型。盤古3.0為提供100億參數(shù)、380億參數(shù)、710參數(shù)和1000億參數(shù)的系列化基礎(chǔ)大模型。同時提供能力集,包括NLP大模型的知識問答、文案生成、代碼生成,以及多模態(tài)大模型的圖像生成、圖像理解等能力,這些技能可以供客戶和伙伴直接調(diào)用。
L1層是N個行業(yè)大模型,華為云既提供使用行業(yè)公開數(shù)據(jù)訓(xùn)練的行業(yè)通用大模型,包括政務(wù),金融,制造,礦山,氣象等大模型;也可以基于行業(yè)用戶的自有數(shù)據(jù),在盤古大模型的L0和L1層上,訓(xùn)練自己的專有大模型。
L2層提供了更多細(xì)化場景的模型,更專注于政務(wù)熱線、網(wǎng)點(diǎn)助手、先導(dǎo)藥物篩選、傳送帶異物檢測、臺風(fēng)路徑預(yù)測等具體行業(yè)應(yīng)用或特定業(yè)務(wù)場景,提供“開箱即用”的模型服務(wù)。
張平安表示,盤古大模型采用完全的分層解耦設(shè)計(jì),用戶既可以為自己的大模型加載獨(dú)立的數(shù)據(jù)集,也可以單獨(dú)升級基礎(chǔ)模型,也可以單獨(dú)升級能力集。
在L0和L1大模型的基礎(chǔ)上,華為云還提供了大模型行業(yè)開發(fā)套件,通過對自有數(shù)據(jù)的二次訓(xùn)練,企業(yè)就可以擁有自己的專屬行業(yè)大模型。同時,盤古大模型還提供了公用云、大模型云專區(qū)、混合云的部署形態(tài)。
目前,盤古大模型已在金融、金融、制造、醫(yī)藥研發(fā)、煤礦、鐵路等行業(yè)落地。其中,在煤礦領(lǐng)域,盤古礦山大模型已經(jīng)在全國8個礦井規(guī)模使用,一個大模型可以覆蓋煤礦的采、掘、機(jī)、運(yùn)、通、洗選等業(yè)務(wù)流程下的1000多個細(xì)分場景。
“盤古大模型沒時間聊天?!睆埰桨卜Q,“而是把重點(diǎn)放在解決行業(yè)問題上,要讓每個行業(yè)、每個企業(yè)、每個人都擁有自己的專家助手?!?/p>
除了盤古大模型,華為云還宣布2000P Flops單集群的昇騰AI云服務(wù)在烏蘭察布和貴安同時上線。據(jù)悉,昇騰云服務(wù)除了支持華為的AI框架Mindspore外,還支持Pytorch,Tensorflow等主流AI框架,框架中的90%算子,可以通過華為的遷移工具從GPU平滑遷移到昇騰。
記者從WAIC2023現(xiàn)場了解到,目前華為昇騰擁有30多家硬件伙伴,包括寶德、清華同方、研華科技、安擎、神州鯤泰等。
自ChatGPT掀起大模型熱潮以來,百度、三六零、華為、商湯、阿里、科大訊飛等企業(yè)已陸續(xù)展示了各家大模型,而京東也將于7月13日發(fā)布新一代產(chǎn)業(yè)大模型,定位為產(chǎn)業(yè)版本ChatGPT。有AI業(yè)內(nèi)人士對記者表示,當(dāng)下各家對大模型仍處于前期投入階段,未來真正的商業(yè)化比拼或在于各行各業(yè)的切實(shí)落地上。
張平安也在會后采訪時表示,“華為在AI大模型領(lǐng)域投入非常大,在商業(yè)化落地方面也為客戶提供了多樣化的服務(wù)模式,但現(xiàn)在談AI大模型收益還為時過早?!?/p>
