工信部組織開展算力強基揭榜行動
2025-02-21 10:36 星期五
財聯(lián)社
工信部近日印發(fā)通知,組織開展算力強基揭榜行動。將面向計算、存儲、網(wǎng)絡、應用、綠色、安全等六大重點方向,發(fā)掘一批掌握關鍵核心技術、具備較強創(chuàng)新能力的企事業(yè)單位,突破一批標志性技術產(chǎn)品和方案。

財聯(lián)社2月21日訊,工業(yè)和信息化部近日印發(fā)通知,組織開展算力強基揭榜行動。將面向計算、存儲、網(wǎng)絡、應用、綠色、安全等六大重點方向,發(fā)掘一批掌握關鍵核心技術、具備較強創(chuàng)新能力的企事業(yè)單位,突破一批標志性技術產(chǎn)品和方案。工業(yè)和信息化部將統(tǒng)籌利用各類資源對揭榜入圍、優(yōu)勝單位予以支持,推動優(yōu)秀成果示范應用推廣。

關于組織開展算力強基揭榜行動的通知

各省、自治區(qū)、直轄市工業(yè)和信息化主管部門、通信管理局以及有關中央企業(yè):

為夯實算力網(wǎng)絡發(fā)展底座,加快創(chuàng)新技術和產(chǎn)品應用,推動算力網(wǎng)絡“點、鏈、網(wǎng)、面”體系化發(fā)展,現(xiàn)組織開展算力強基揭榜行動。有關事項通知如下:

一、揭榜任務內(nèi)容

面向算力網(wǎng)絡的計算、存儲、網(wǎng)絡、應用、綠色、安全等六大重點方向,發(fā)掘一批掌握關鍵核心技術、具備較強創(chuàng)新能力的企事業(yè)單位,突破一批標志性技術產(chǎn)品和方案。

計算方面,攻關智能算力管理、算力加速等技術,提高計算性能與效率;存儲方面,研發(fā)多介質(zhì)存儲設備管理、跨域存儲資源池協(xié)同等技術,實現(xiàn)海量數(shù)據(jù)可靠與靈活存儲;網(wǎng)絡方面,突破算內(nèi)網(wǎng)絡與算間網(wǎng)絡等技術,促進算力資源高速互聯(lián);應用方面,加強算力與行業(yè)深度融合,實現(xiàn)多場景便捷用算;綠色方面,研發(fā)新型制冷、碳排放感知優(yōu)化等技術,推動算力設施節(jié)能降碳;安全方面,推動智能監(jiān)測、運維機器人等技術發(fā)展,保障算力中心可靠運行。

二、申報和推薦

(一)申報單位須為在中華人民共和國境內(nèi)注冊、具有獨立法人資格、具有較強技術創(chuàng)新和產(chǎn)業(yè)化應用能力的企事業(yè)單位。申報單位根據(jù)《算力強基揭榜行動任務榜單》(見附件)選擇揭榜任務,并需承諾揭榜后能夠在指定期限內(nèi)完成相應任務,每個單位申報不超過3個項目。有關企業(yè)、高校、科研機構等以聯(lián)合體方式申報的,牽頭單位為1家,聯(lián)合參與單位不超過4家。

(二)各省、自治區(qū)、直轄市工業(yè)和信息化主管部門、通信管理局以及有關中央企業(yè)按照政府引導、企業(yè)自愿的原則,組織有關單位積極申報揭榜,并作為推薦單位,遵循公開、公平、公正的原則,審核遴選推薦創(chuàng)新能力突出、產(chǎn)業(yè)化前景好、行業(yè)帶動作用明顯的項目,報工業(yè)和信息化部(信息通信發(fā)展司)。

三、工作程序和要求

(一)申報單位通過申報系統(tǒng)(鏈接)進行申報,完成注冊后填寫申報所需材料。申報截止時間為2025年3月15日。

(二)各省、自治區(qū)、直轄市工業(yè)和信息化主管部門、通信管理局以及有關中央企業(yè)作為推薦單位,應于2025年3月31日前登錄系統(tǒng)并確認推薦名單(賬號密碼請通過聯(lián)系人獲取)。推薦單位在每個方向推薦項目數(shù)量原則上不超過3個,所有方向累計推薦項目總量不超過20個。鼓勵各推薦單位結合實際情況,對推薦項目單位在政策、資金、資源配套等方面加大扶持力度。

(三)工業(yè)和信息化部組織遴選并公布入圍揭榜單位名單。入圍揭榜單位完成攻關任務后(名單公布之日起不超過2年),工業(yè)和信息化部委托第三方專業(yè)機構開展測評工作,擇優(yōu)確定揭榜優(yōu)勝單位(每個揭榜方向原則上不超過3家)。工業(yè)和信息化部將統(tǒng)籌利用各類資源對揭榜入圍、優(yōu)勝單位予以支持,推動優(yōu)秀成果示范應用推廣。

工業(yè)和信息化部辦公廳

2025年2月18日

附件

算力強基揭榜行動任務榜單

一、計算

(一)云邊端算網(wǎng)協(xié)同管理系統(tǒng)

揭榜任務:面向云邊端多層級算力環(huán)境,研發(fā)算網(wǎng)協(xié)同應用管理系統(tǒng),設計面向不同應用軟件架構的管理機制,支持對不同架構應用軟件的統(tǒng)一管理;研發(fā)應用軟件在算網(wǎng)協(xié)同中的自動化構建部署能力,支持應用軟件的自動構建和分發(fā)部署;研究算網(wǎng)協(xié)同應用系統(tǒng)的一體化觀測能力,降低運維復雜度,提高復雜應用軟件運行的穩(wěn)定性和可靠性。

預期目標:到2026年,研制應用軟件管理系統(tǒng),支持對傳統(tǒng)應用軟件、云原生應用軟件、AI應用軟件、大數(shù)據(jù)應用軟件等不少于5種應用軟件的全生命周期管理。研究基于算網(wǎng)協(xié)同的分布式構建和部署技術,支持上述應用軟件的自動分發(fā)和跨算力節(jié)點部署,實現(xiàn)零人工介入。研發(fā)算網(wǎng)應用一體化觀測功能,具備白盒化動態(tài)分析以及智能故障根因定位能力。在不少于3個行業(yè)完成試點驗證。

(二)支持超大規(guī)模參數(shù)模型的訓推一體化異構智算平臺

揭榜任務:面向人工智能大模型訓練和推理對計算資源的需求,研發(fā)支持超大規(guī)模參數(shù)模型的訓練、推理一體化智算平臺,包括資源調(diào)度策略、訓推加速套件等,并可支持多種硬件架構,屏蔽底層硬件差異,提升超大規(guī)模模型在訓練、推理過程中穩(wěn)定性、資源利用率和運行效率。

預期目標:到2026年,研發(fā)一套支持萬億參數(shù)模型的超大規(guī)模訓推一體化智算平臺,萬卡環(huán)境下穩(wěn)定訓練時間不低于30天,有效訓練時長不低于95%,訓練效率較當前主流水平提升不低于30%,推理效率提升不低于50%。支持主流深度學習框架,兼容多種硬件架構,并提供統(tǒng)一的編程接口和開發(fā)環(huán)境,實現(xiàn)不低于10個行業(yè)用戶的落地驗證。

(三)異構算力跨域任務編排系統(tǒng)

揭榜任務:針對跨域異構算力協(xié)同,研發(fā)跨域異構算力管理系統(tǒng),實現(xiàn)跨域異構算力的管理和應用。研發(fā)針對多樣性算力的規(guī)范化開放互聯(lián)功能,支持對不同類型的異構算力模型統(tǒng)一抽象封裝;研發(fā)跨域異構算力的管理功能,支持對跨域異構算力的統(tǒng)一管理和協(xié)同;研究跨域多主體算力的安全認證和控制方法,保障跨域協(xié)同安全。

預期目標:到2026年,研發(fā)不少于6種跨域協(xié)同調(diào)度算法,支持數(shù)據(jù)處理、函數(shù)計算、機器學習等不少于3個場景的計算任務部署,完成不少于5個跨域算力中心的統(tǒng)一管理。研發(fā)跨域多主體算力的安全認證方法,支持云邊端等不同層級算力協(xié)同的安全要求。在不少于2個行業(yè)完成試點驗證。

(四)訓推算力一體機

揭榜任務:面向人工智能訓練、推理場景,研發(fā)基于基礎設施即服務(IaaS)和平臺即服務(PaaS)的高性能訓推一體化解決方案,覆蓋對大模型開發(fā)訓練和部署推理的全流程,包括數(shù)據(jù)準備、模型訓練、模型評測和模型部署。同時,支持大模型加密、攻擊防御等能力,解決針對大模型數(shù)據(jù)泄露、指令攻擊等安全問題和風險。

預期目標:到2026年,研發(fā)支持至少3種指令集芯片的訓推一體機,針對至少5個行業(yè)開展人工智能訓推一體機應用,為用戶提供多元化訓推一體化服務,并在至少10種不同的場景進行人工智能訓推一體機落地。

(五)大規(guī)模異構算力集群推理加速技術

揭榜任務:研發(fā)存儲、網(wǎng)絡、計算的協(xié)同優(yōu)化技術,通過模型加速、調(diào)度加速等方法實現(xiàn)大規(guī)模異構算力集群在大模型推理方面的加速,從而支持更大的模型、更長的上下文、更高的性能及更低的能耗,促進算力芯片在大模型推理方面的更好應用。

預期目標:到2026年,實現(xiàn)集群有效吞吐量5倍以上提升,實際應用場景中可處理的請求數(shù)提升1倍以上,首字延遲性能提升1倍以上,芯片利用率提升50%以上。通過優(yōu)化算力中心計算、存儲、網(wǎng)絡的配比以及拓撲結構和系統(tǒng)調(diào)度策略,實現(xiàn)千卡以上異構集群在推理加速領域的突破。

二、存儲

(六)磁光電融合存儲系統(tǒng)

揭榜任務:針對單一存儲介質(zhì)難以滿足多樣化數(shù)據(jù)存儲需求的現(xiàn)狀,依托磁、光、電存儲在性能、壽命、功耗等方面的差異化特性,將磁、光、電存儲技術進行融合,研發(fā)磁光電融合存儲系統(tǒng),構建基于固態(tài)硬盤(SSD)、機械硬盤(HDD)和光存儲的多級存儲架構。根據(jù)業(yè)務特征,將數(shù)據(jù)保存在不同級別的存儲設備中,實現(xiàn)海量數(shù)據(jù)的集中、統(tǒng)一存儲管理,支撐算力中心高效、低碳、安全持續(xù)發(fā)展。

預期目標:到2026年,研發(fā)磁、光、電融合存儲系統(tǒng),支持適配分布式文件、分布式塊和分布式對象等至少3種存儲類型,系統(tǒng)可以根據(jù)數(shù)據(jù)的訪問時間、訪問頻率、文件屬性等自定義分級策略,根據(jù)業(yè)務負載動態(tài)調(diào)整遷移。系統(tǒng)可通過介質(zhì)安全、系統(tǒng)安全、軟件安全等夯實底層安全能力,通過防勒索、加密算法、遠程監(jiān)控、光存儲預警檢測等增強數(shù)據(jù)安全能力。打造磁光電融合存儲應用示范,完成至少20個業(yè)務系統(tǒng)應用,實現(xiàn)至少4個東部地區(qū)數(shù)據(jù)流動至西部磁光電存儲系統(tǒng),且數(shù)據(jù)存儲量不少于10PB。

(七)存儲調(diào)度管理及應用技術

揭榜任務:針對海量數(shù)據(jù)存儲和算力孤島問題,研發(fā)跨域多算的存力調(diào)度、存網(wǎng)編排和存算網(wǎng)一體化系統(tǒng),實現(xiàn)數(shù)據(jù)的智能冷熱分級、應用的跨域無感訪問等能力,有效降低成本、提高性能和支撐業(yè)務。系統(tǒng)具備資源規(guī)劃、策略調(diào)整能力,可優(yōu)化和調(diào)整全網(wǎng)數(shù)據(jù)存儲布局,實現(xiàn)對不斷變化的需求的適應。

預期目標:到2026年,研制具備高效、可擴展性的存儲系統(tǒng),基于智能算法,對數(shù)據(jù)進行分析和調(diào)度,實現(xiàn)應用無感訪問和智能流動。研究存力調(diào)度策略,使數(shù)據(jù)召回率控制在30%以下;研究基于潮汐網(wǎng)絡調(diào)度算法,實現(xiàn)網(wǎng)絡帶寬利用率提升50%以上,達到存網(wǎng)一體的目標。集成存儲、計算和網(wǎng)絡的能力,支持存算網(wǎng)一體化調(diào)度,在算力中心資源池落地應用。

三、網(wǎng)絡

(八)高性能數(shù)據(jù)處理器(DPU)

揭榜任務:開展基于芯粒(Chiplet)和第五代精簡指令集(RISC-V)技術的軟硬件一體DPU芯片技術研究,支持算力中心、智算中心、超算中心場景所需的超高帶寬和超低時延,突破Chiplet異構芯片封裝技術、高速Serdes通信、大規(guī)模無損網(wǎng)絡擁塞算法、硬件密碼算法、高性能虛擬化、硬件可編程等技術,實現(xiàn)基于ARM、X86、RISC-V等異構核心的DPU應用,提升算力中心基礎設施處理能力和數(shù)據(jù)傳輸能效比。

預期目標:到2026年,完成超高性能DPU芯片研發(fā)工作,吞吐能力達到400Gbps,單向流量時延不高于30us,支持與國內(nèi)外主流CPU、GPU芯片平臺的適配,支持主流操作系統(tǒng)兼容,支持數(shù)據(jù)報文硬件處理邏輯可編程。

(九)基于RoCE的智算網(wǎng)絡

揭榜任務:面向RoCE網(wǎng)絡開展設備及管控系統(tǒng)研發(fā),通過提高設備帶寬、優(yōu)化負載均衡算法、強化網(wǎng)絡流量規(guī)劃及運維能力等方式,提升RoCE網(wǎng)絡的吞吐量和時延性能。研制新一代智能化管控工具,引入AI大模型能力,簡化RoCE網(wǎng)絡的部署和配置工作,實現(xiàn)全局、多維度的可視化運維。在網(wǎng)絡波動、業(yè)務變更、故障等情況下,網(wǎng)絡參數(shù)自動調(diào)整,流量快速切換,從而達到提升網(wǎng)絡效率和降低運維成本的目標。

預期目標:到2026年,實現(xiàn)新型RoCE網(wǎng)絡整體方案的商用部署,網(wǎng)絡性能提升10%以上。通過智能化管控及運維工具,網(wǎng)絡部署難度大幅降低,運維效率提升50%以上,可支撐更大規(guī)模部署和應用。

(十)光交換智算網(wǎng)絡技術研究與驗證

揭榜任務:面向智算集群低功耗、高帶寬、低延遲技術需求,開展智算集群光交換組網(wǎng)關鍵技術研究與驗證,重點突破智算集群光交換組網(wǎng)、路由協(xié)議適配等關鍵技術。針對智算集群的功能、性能、可靠性和擴展性等要求,研究光拓撲映射、光電混合路由、多路徑負載均衡等技術。

預期目標:到2026年,實現(xiàn)支持智算集群的易操作、高可靠、可平滑過渡升級的光網(wǎng)絡,支持人工智能等關鍵業(yè)務承載;光交換設備單端口速率支持100GE/400GE/800GE,交換容量彈性可擴展,可支持不少于3種異構算力資源互聯(lián),在不少于2個智算集群完成驗證,并完成不少于3種智算業(yè)務承載驗證。

(十一)面向分布式智算中心的網(wǎng)絡關鍵技術研究與驗證

揭榜任務:針對智算集群從集中式向分布式部署探索的趨勢,攻關算力中心間網(wǎng)絡技術,研發(fā)面向智算中心間的高可靠傳輸設備,構建智算中心間超大容量、超低時延、超高可靠光電協(xié)同網(wǎng)絡,實現(xiàn)智算中心高速、可靠互聯(lián)。

預期目標:到2026年,突破智算中心間超大容量、超高可靠網(wǎng)絡傳輸關鍵技術,研制面向智算中心間網(wǎng)絡的傳輸設備,單波速率不低于1.6Tbps,設備時延不超過30us,支撐分布式智算中心間業(yè)務的高可靠傳輸。

四、應用

(十二)智算中心跨域互聯(lián)應用

揭榜任務:優(yōu)化人工智能算力基礎設施布局,構建跨地域互補、協(xié)同算力調(diào)度的超大規(guī)模人工智能算力服務能力。加強與人工智能芯片廠商的兼容適配,構筑大規(guī)模高性能異構算力池,提供面向大模型訓推場景深度優(yōu)化的彈性調(diào)度、彈性容錯、高資源利用率的人工智能算力服務。

預期目標:到2026年,形成覆蓋5個以上全國重點算力樞紐節(jié)點的人工智能算力中心,支持跨地域、跨云的算力需求感知和動態(tài)調(diào)度,完成3款以上算力芯片適配,聚焦大模型訓練和推理場景,構建大規(guī)模、高性能、彈性調(diào)度、高容錯的訓推一體算力資源池,具備分鐘級斷點續(xù)訓能力,支持萬卡級別并行訓練。

(十三)算力電力協(xié)同應用

揭榜任務:研發(fā)基于算力調(diào)度技術與能源大模型的多云異構算電協(xié)同管理平臺,構建基于數(shù)據(jù)驅(qū)動的算力集群用電負荷特性模型、基于計算任務的時空轉(zhuǎn)移特性的能源大模型,推動算力預測與調(diào)度技術在智算中心應用落地,提升整體資源利用率,基于新能源、新型儲能系統(tǒng)開展算力負荷與電力系統(tǒng)的協(xié)同優(yōu)化,實現(xiàn)精準、動態(tài)、實時的能源調(diào)度與交易,實現(xiàn)算力與電力等能源的深度協(xié)同。

預期目標:到2026年,實現(xiàn)智算場景下能源與算力全鏈路的數(shù)據(jù)穿透及流程整合,構建“算”隨“電”動的直接控制及間接引導機制,實現(xiàn)算力需求預測精準度達到70%、集群有效負載率提升25%以上,智算中心整體集群資源利用率提高10%。結合算力集群用電數(shù)據(jù)、時間周期、氣象數(shù)據(jù)、工作負載等多種因素,實現(xiàn)“電”隨“算”用的能源效率優(yōu)化與算效提升,實現(xiàn)基礎設施用能決策精準度85%以上,響應時效性達到提前15分鐘響應級別,智算中心整體算力能效水平提升30%,算力中心用電成本降低5%以上。

(十四)大規(guī)模通信業(yè)務場景中的算力應用

揭榜任務:圍繞網(wǎng)絡功能虛擬化(NFV)系統(tǒng)架構,針對NFV中網(wǎng)絡性能、資源利用和靈活展性等方面的挑戰(zhàn),研發(fā)面向NFV架構的高性能虛擬化、智能化網(wǎng)絡管理和資源編排算法等技術和系統(tǒng),突破虛擬化層與硬件加速器(如FPGA、DPU、GPU)之間的協(xié)同能力。

預期目標:到2026年,NFV算力平臺系統(tǒng)中實現(xiàn)對虛擬化網(wǎng)絡功能的智能調(diào)度,支持異構集群部署、動態(tài)擴展,資源動態(tài)分配,虛擬化資源利用率提升20%以上;支持GPU、FPGA等硬件加速器的虛擬化調(diào)度,加速網(wǎng)絡處理性能至Tbps以上;支持智能化網(wǎng)絡虛擬化功能管理,提升NFV系統(tǒng)的自動化運維能力和管理效能,故障修復時間縮減不低于30%。

五、綠色低碳

(十五)綠色算力技術研究及應用

揭榜任務:圍繞算力的綠色節(jié)能技術突破,面向算力中的任務調(diào)度特性、能源使用模式、負載均衡要求等關鍵要素,研發(fā)適應于綠色計算的動態(tài)資源調(diào)度算法、能耗優(yōu)化管理系統(tǒng),以及面向多場景的協(xié)同節(jié)能機制,突破節(jié)能算法的智能化程度,提升算力網(wǎng)絡中多節(jié)點的能源利用效率。

預期目標:到2026年,能耗管理系統(tǒng)實現(xiàn)對算力中心和網(wǎng)絡節(jié)點的實時監(jiān)控與節(jié)能調(diào)度,通過計算節(jié)點支持動態(tài)調(diào)頻、動態(tài)電壓調(diào)節(jié),單節(jié)點平均能耗降低30%以上,滿足AI推理等應用需求。

(十六)企業(yè)綠色計算碳感知平臺

揭榜任務:建立企業(yè)算力中心碳排放度量體系,能夠?qū)崟r、精準地統(tǒng)計企業(yè)各個算力中心碳排放,并能將碳排放量分攤到不同的業(yè)務部門、應用場景和工作負載,實現(xiàn)精細化的碳排放的管理。同時,基于碳排放的數(shù)據(jù),實現(xiàn)碳感知調(diào)度能力,通過在保證業(yè)務體驗和連續(xù)性的情況下將工作負載調(diào)度到更加低碳的算力中心,進一步降低碳排放。

預期目標:到2026年,圍繞千萬核級別跨域的算力中心,構建企業(yè)級綠色計算碳感知平臺,形成一套行業(yè)通用的、可精確度量不同類型工作負載碳排放的技術方法和指標體系,通過生態(tài)共建形成綠色度量衡標準體系。構建碳感知調(diào)度能力,達到算力中心可再生能源比例30%的目標。

(十七)冷板式液冷原生整機柜服務器

揭榜任務:面向新一代液冷算力中心,研發(fā)冷板式液冷整機柜,包括液冷服務器節(jié)點、無源液冷門等,突破高密算力、多樣性算力的散熱技術及架構要求,實現(xiàn)支持供電總線、網(wǎng)絡互聯(lián)總線、液冷管路可盲插運維的液冷設備,具備液冷機柜及液冷服務器等多級漏液檢測能力,有效降低業(yè)務中斷范圍與損失。

預期目標:到2026年,液冷整機柜實現(xiàn)100%液冷散熱,制冷PUE低于1.15。整機柜服務器內(nèi)部實現(xiàn)全盲插設計,管理模塊可實現(xiàn)整機柜功耗管理、漏液檢測、資產(chǎn)管理等功能;通用算力單柜功率不低于20kW,智能算力單機柜功率不低于30kW,實現(xiàn)不少于500臺液冷節(jié)點的規(guī)模落地應用。

(十八)算力中心節(jié)能調(diào)優(yōu)平臺

揭榜任務:研制高精確度、高仿真效率、多場景覆蓋的算力中心PUE仿真平臺,突破物理機理模型構建、仿真引擎集群、模型自動生成等關鍵技術,實現(xiàn)對算力中心不同運行狀態(tài)下細分時間顆粒度PUE的快速、精準評估。研發(fā)基于大數(shù)據(jù)分析技術的算力中心制冷系統(tǒng)AI節(jié)能優(yōu)化系統(tǒng),通過自動化數(shù)據(jù)治理、自動推理等關鍵技術,準確匹配制冷需求,在滿足可靠性要求條件下實現(xiàn)算力中心制冷系統(tǒng)整體動態(tài)實時優(yōu)化,優(yōu)化算力中心PUE。

預期目標:到2026年,支持液冷、水冷等至少2類典型制冷場景進行能效優(yōu)化,支持制冷系統(tǒng)和配電系統(tǒng)聯(lián)合仿真,系統(tǒng)可輸出不同負載及運行工況條件下的PUE運行曲線、系統(tǒng)設備運行模擬工況等參數(shù),PUE仿真精度達到97%以上?;谀苄?yōu)化平臺,支持AI自動推理,小時級策略自動下發(fā),實現(xiàn)對算力中心能耗的可視、可管、可控。通過AI能效優(yōu)化,實現(xiàn)算力中心PUE降低5%以上,通過算力中心基礎設施與IT聯(lián)動節(jié)能,實現(xiàn)總能耗降低5%以上,在5個以上算力中心落地應用。

(十九)新型制冷系統(tǒng)

揭榜任務:研發(fā)人工智能節(jié)能系統(tǒng),針對算力中心基礎設施的運行調(diào)控和環(huán)境監(jiān)測。提出全新自適應算法,突破原有常見算法的局限性,提升數(shù)據(jù)的分析和處理效果,搭建基于專家經(jīng)驗的人工智能算法數(shù)據(jù)庫,提升包括能耗管理、能源調(diào)度、安全監(jiān)測、故障診斷、輔助運維等功能的節(jié)能性、可靠性、經(jīng)濟性。

預期目標:到2026年,在滿足制冷要求的基礎上,提高冷卻系統(tǒng)的可靠性和自適應性,提高能源使用效率、水資源使用效率和運維效率,其中節(jié)電率提升10%以上。支持冷卻系統(tǒng)數(shù)據(jù)采集、標注、治理、存儲,具備系統(tǒng)運行異常告警、告警收斂、自動診斷、遠程通信、自動控制等功能,支持冷卻系統(tǒng)智能化調(diào)優(yōu)、智能化控制的核心能力,并開展不少于5個實際業(yè)務場景所提供的AI節(jié)能調(diào)優(yōu)案例。

六、安全可靠

(二十)算力中心智能運維機器人

揭榜任務:研發(fā)算力中心智能運維機器人以及智能機器人管理平臺,基于云邊端三層架構,實現(xiàn)智能機器人在多層、多房間樓宇機房內(nèi)的設備設施識別、多模態(tài)環(huán)境感知、精準空間定位、智能人機協(xié)同、多任務聯(lián)合調(diào)度等方面的技術與算法優(yōu)化。支撐機器人在算力中心設施運維和IT運營等典型場景的應用,提升巡檢質(zhì)量,促進算力中心運維、運營的降本增效。

預期目標:到2026年,實現(xiàn)大型算力中心內(nèi)智能機器人的多機房、多樓層協(xié)同應用部署;機器人巡檢任務成功率不低于95%,設備識別準確率達到97%,環(huán)境巡檢召回率不低于90%,保障算力中心巡檢業(yè)務持續(xù)運行。實現(xiàn)云邊端協(xié)同調(diào)度,支持不同場景下的自主作業(yè),提高任務并發(fā)執(zhí)行效率,促進穩(wěn)定、安全、可靠、可控的算力中心智能運維體系建設。

(二十一)云邊端一體化智能監(jiān)測平臺

揭榜任務:開發(fā)高性能云邊端一體化系統(tǒng),研發(fā)以智能化終端或機器人為硬件載體、以多算法模型融合和平臺工具為軟件載體的軟硬結合的集中監(jiān)測管理與運維巡檢方案。突破多層級自動化運維、多維度診斷、多平臺覆蓋、多模型量化等關鍵技術。構建綜合運維健康度數(shù)字化評估體系與模型,實現(xiàn)算力設施從規(guī)劃、設計、建設、部署、運行、維護的全生命周期數(shù)字化管理。

預期目標:到2026年,建立大規(guī)模集群的智能化運維能力,設備實現(xiàn)跨平臺及系統(tǒng)穩(wěn)定性風險和安全風險識別能力,綜合視頻識別技術等,結構化告警收斂推送,準確率超過98%。算力設施全生命周期數(shù)字化聯(lián)動,平臺自動化流程推進,實現(xiàn)云端直控覆蓋超10棟算力中心,落地數(shù)字化算力中心健康度評估,智能化終端或機器人的自驅(qū)動巡檢,視頻流識別與告警的聯(lián)動,系統(tǒng)的智能化運維問答,并保障業(yè)務服務級別協(xié)議(SLA)達標率99%以上。

收藏
72.56W
我要評論
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關聯(lián)話題
1.26W 人關注