①多家AI芯片初創(chuàng)公司透露,隨著越來(lái)越多的客戶(hù)采用DeepSeek開(kāi)源模型,推理算力需求正在攀升。 ②DeepSeek日前暫停API服務(wù)充值,也反應(yīng)了算力還是不夠用。 ③當(dāng)DeepSeek通過(guò)技術(shù)降本,為AI應(yīng)用打開(kāi)更多落地場(chǎng)景,“杰文斯悖論”或許也將在AI行業(yè)應(yīng)驗(yàn)。
《科創(chuàng)板日?qǐng)?bào)》2月8日訊 DeepSeek R1模型的橫空出世,在全球范圍內(nèi)一度引發(fā)了對(duì)算力長(zhǎng)期需求的質(zhì)疑,甚至重挫英偉達(dá)股價(jià)。
算力需求真的將要萎縮嗎?
AI芯片初創(chuàng)公司可能不會(huì)這么認(rèn)為。在他們眼中,這不是一個(gè)威脅,而是一個(gè)能“做大做強(qiáng)”的巨大機(jī)會(huì)——隨著越來(lái)越多的客戶(hù)采用和搭建起DeepSeek開(kāi)源模型,對(duì)推理芯片和算力的需求正在攀升。
英偉達(dá)競(jìng)爭(zhēng)對(duì)手之一Cerebras Systems主要為客戶(hù)提供AI芯片,并可以通過(guò)自家計(jì)算集群為客戶(hù)提供云服務(wù),去年8月曾發(fā)布號(hào)稱(chēng)是“全球最快的AI推理解決方案”的Cerebras Inference。
這家公司CEO Andrew Feldman向CNBC透露,DeepSeek R1模型發(fā)布之后,公司迎來(lái)了“有史以來(lái)最大的服務(wù)需求高峰之一”?!伴_(kāi)發(fā)者非常想用DeepSeek R1這樣的開(kāi)源模型取代OpenAI昂貴且封閉的模型。價(jià)格下降能推動(dòng)全球使用范圍擴(kuò)張,就像之前的PC和互聯(lián)網(wǎng)行業(yè),而現(xiàn)在AI也正走在一條類(lèi)似的長(zhǎng)期增長(zhǎng)之路上。”
另一家AI芯片制造商Etched也表示,自從DeepSeek發(fā)布推理模型以來(lái),已有數(shù)十家公司向Etched伸出了橄欖枝,因此公司正在將支出從訓(xùn)練集群轉(zhuǎn)向推理集群。“DeepSeek-R1證明了推理計(jì)算已成為每個(gè)主要模型供應(yīng)商的‘最先進(jìn)’方法,而推理思考并不便宜——為了將這些模型擴(kuò)展到數(shù)百萬(wàn)用戶(hù),我們將需要越來(lái)越多的算力?!?/p>
“從DeepSeek的例子就能看到,較小的開(kāi)放模型可以訓(xùn)練得與更大的專(zhuān)有模型一樣強(qiáng)大,甚至更強(qiáng),而且這可以以極低的成本實(shí)現(xiàn)。而小型模型的普及,將進(jìn)一步催化推理時(shí)代到來(lái)。”AI芯片初創(chuàng)公司 d-Matrix首席執(zhí)行官Sid Sheth也表示。
在芯片初創(chuàng)公司和業(yè)內(nèi)分析師們看來(lái),DeepSeek有望加速“從訓(xùn)練到推理”的AI周期,促進(jìn)新芯片技術(shù)采用。
“簡(jiǎn)單來(lái)說(shuō),AI訓(xùn)練是構(gòu)建一個(gè)工具或算法,而推理則是將這個(gè)工具實(shí)際應(yīng)用于現(xiàn)實(shí)場(chǎng)景中?!盡orningstar半導(dǎo)體分析師Phelix Lee稱(chēng),AI訓(xùn)練非常依賴(lài)算力,但推理可以在不那么先進(jìn)的芯片上進(jìn)行,這些芯片可以執(zhí)行較窄范圍的任務(wù)。
▌“AI行業(yè)的杰文斯悖論”
實(shí)際上,DeepSeek日前的表現(xiàn)也反應(yīng)了算力還是不夠用。
2月6日DeepSeek突然暫停其API服務(wù)充值,按鈕顯示灰色不可用狀態(tài)。對(duì)此官方聲明稱(chēng),“當(dāng)前服務(wù)器資源緊張,為避免對(duì)您造成業(yè)務(wù)影響,我們已暫停 API 服務(wù)充值。存量充值金額可繼續(xù)調(diào)用,敬請(qǐng)諒解!”
據(jù)國(guó)泰君安測(cè)算,假設(shè)DeepSeek日均訪(fǎng)問(wèn)量為1億次、每次提問(wèn)10次,每次提問(wèn)的回復(fù)用到1000個(gè)token,1000個(gè)token大概對(duì)應(yīng)750個(gè)英文字母,則DeepSeek每秒的推理算力需求為1.6*1019TOPs。在這種普通推理情境下, 假設(shè)DeepSeek采用的是FP8精度的H100卡做推理,利用率50%,那么推理端H100卡需求為16177張,A100卡需求為51282張。
其進(jìn)一步表示,在以DeepSeek為首的低成本推理模型的逐漸普及下,推理成本及價(jià)格大幅削減勢(shì)必會(huì)帶來(lái)應(yīng)用側(cè)繁榮,由此將拉動(dòng)成倍數(shù)的總算力需求提升。
未來(lái)的AI投入不再盲目“大力出奇跡”的Scaling Law,逐漸將重心從預(yù)訓(xùn)練轉(zhuǎn)向推理,東吳證券認(rèn)為,訓(xùn)練+推理的整體需求依然樂(lè)觀(guān),參考從2G到4G流量費(fèi)用不斷降低,但因?yàn)橛昧康闹笖?shù)級(jí)提升,導(dǎo)致整體市場(chǎng)規(guī)模依然快速增大。
回看19世紀(jì),英國(guó)經(jīng)濟(jì)學(xué)家杰文斯發(fā)現(xiàn),當(dāng)通過(guò)技術(shù)提升,實(shí)現(xiàn)煤炭使用效率提高、成本下探,煤炭消費(fèi)量反而會(huì)增加,從而提出了環(huán)境經(jīng)濟(jì)學(xué)中廣為人知的“杰文斯悖論”。
站在160年后的今天,當(dāng)DeepSeek通過(guò)技術(shù)降本,為AI應(yīng)用打開(kāi)更多落地場(chǎng)景,“杰文斯悖論”或許也將在AI行業(yè)應(yīng)驗(yàn)。
