2025年03月06日 16:32:46
無(wú)問(wèn)芯穹:AI平臺(tái)上線滿血DeepSeek-R1/V3微調(diào)服務(wù)
《科創(chuàng)板日?qǐng)?bào)》6日訊,今日,無(wú)問(wèn)芯穹Infini-AI異構(gòu)云一站式AI平臺(tái)正式上線云端即開(kāi)即用的滿血DeepSeek-R1/V3微調(diào)服務(wù),讓企業(yè)用戶可以在基建零投入的前提下,一鍵式、低成本快速微調(diào)高精度業(yè)務(wù)模型。該服務(wù)在sequence length為4096,global batch size為128的情況下,每秒訓(xùn)練達(dá)14k token,以6000個(gè)樣本的微調(diào)數(shù)據(jù)集為例(如evol-character-entire數(shù)據(jù)集),訓(xùn)完兩個(gè)epoch僅耗時(shí)不到1小時(shí)。數(shù)據(jù)訓(xùn)練過(guò)程數(shù)據(jù)以沙箱隔離存儲(chǔ),訓(xùn)練完成后自動(dòng)銷毀緩存。底層則使用了高性價(jià)比的沐曦C550加速卡,對(duì)比傳統(tǒng)自建集群微調(diào)方案,綜合成本下降高達(dá)99%。
收藏
260.92W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
關(guān)聯(lián)話題
2.07W 人關(guān)注