Kimi爆火后,大廠角逐長(zhǎng)文本|聚焦
原創(chuàng)
2024-03-23 19:42 星期六
財(cái)聯(lián)社記者 張洋洋
①Kimi爆火,核心優(yōu)勢(shì)在于長(zhǎng)文本讀取和解析能力,阿里和百度正在長(zhǎng)文本領(lǐng)域布局。
②評(píng)判應(yīng)用的核心標(biāo)準(zhǔn)是看輸出結(jié)果的精準(zhǔn)性連貫性,并不是文本長(zhǎng)度越長(zhǎng)越好。
③對(duì)于2024年的應(yīng)用落地,行業(yè)保持審慎樂(lè)觀。

《科創(chuàng)板日?qǐng)?bào)》3月23日訊(記者 張洋洋)月之暗面不再“晦暗”。近期,由這家公司創(chuàng)作的大模型應(yīng)用Kimi,吸引了大量目光。Kimi產(chǎn)生的效應(yīng)已經(jīng)從大模型圈外溢至資本市場(chǎng),Kimi概念股在本周應(yīng)運(yùn)而生。用戶激增,巨大流量突然涌入,甚至讓Kimi服務(wù)器一度宕機(jī)。

Kimi在這一輪大模型應(yīng)用當(dāng)中突圍,核心優(yōu)勢(shì)在于長(zhǎng)文本讀取和解析能力。頗為巧合的是,就在22日晚間,阿里高調(diào)宣布通義千問(wèn)開(kāi)放1000萬(wàn)字長(zhǎng)文本能力。360當(dāng)晚緊隨其后,宣布360智腦正式內(nèi)測(cè)500萬(wàn)字長(zhǎng)文本處理功能,即將入駐360AI瀏覽器。

而據(jù)《科創(chuàng)板日?qǐng)?bào)》了解,百度也將在下個(gè)月開(kāi)放200萬(wàn)-400萬(wàn)的長(zhǎng)文本能力。

阿里巴巴、百度等互聯(lián)網(wǎng)巨頭紛紛布局并升級(jí)自家的大模型產(chǎn)品,強(qiáng)化長(zhǎng)文本處理能力,正讓業(yè)界重新審視長(zhǎng)文本處理在大模型領(lǐng)域的必要性和重要性。而隨著Kimi的崛起,這也讓大模型的討論焦點(diǎn)從大模型本身轉(zhuǎn)移到了應(yīng)用端,2024年是否會(huì)成為AI大模型應(yīng)用落地元年?

▍長(zhǎng)文本是必要的嗎?

相較于其他大模型應(yīng)用,Kimi的長(zhǎng)處在于長(zhǎng)文本分析聯(lián)網(wǎng)搜索、文檔處理和等功能上,尤其在深度解析厚重書(shū)籍內(nèi)容方面,其性能遠(yuǎn)超遠(yuǎn)超其他模型。3月18日,月之暗面甚至一口氣將無(wú)損上下文長(zhǎng)度提升了十倍,直達(dá)200萬(wàn)字級(jí)別。

據(jù)目前的用戶體驗(yàn)來(lái)看,Kimi也不是全能選手。有用戶反饋表示,對(duì)于一些較為困難的任務(wù),包括結(jié)構(gòu)化信息處理和圖像中潦草文字的識(shí)別,對(duì)話連續(xù)性上,Kimi仍顯示出一些短板。在生成能力和語(yǔ)音能力上,目前Kimi還未加入這些模態(tài)。

盡管如此,長(zhǎng)文本能力的重要性不言而喻。目前,市面上的大模型應(yīng)用,GPT-4Turbo-128k公布的文本范圍約為10萬(wàn)漢字,Claude3200k上下文約16萬(wàn)漢字。

一家AI上市公司大模型架構(gòu)業(yè)務(wù)人士告訴記者,由于模型訓(xùn)練結(jié)構(gòu)的限制,以往大模型的文本范圍都不算長(zhǎng),但復(fù)雜任務(wù)和行業(yè)知識(shí)通常是長(zhǎng)篇巨制,這種情況下,只能拆分輸入提問(wèn),但這可能會(huì)導(dǎo)致輸出的結(jié)果上下不連貫邏輯不通順。長(zhǎng)文本可以全篇連貫的去理解上下文,滿足理解和問(wèn)答的需求,長(zhǎng)文本能力在此時(shí)是具備優(yōu)勢(shì)的。

而國(guó)內(nèi)大廠們,則正在長(zhǎng)文本領(lǐng)域快速布局。

《科創(chuàng)板日?qǐng)?bào)》記者從知情人士方面了解到,百度在下個(gè)月將對(duì)文心一言進(jìn)行升級(jí),屆時(shí)也將開(kāi)放長(zhǎng)文本能力,文本范圍在200萬(wàn)-500萬(wàn)。目前,文心一言的文本最高上限在3.2萬(wàn)。

而阿里已經(jīng)先行一步。22日晚間,阿里的通義千問(wèn)官宣升級(jí),向所有人免費(fèi)開(kāi)放1000萬(wàn)字的長(zhǎng)文檔處理功能。用戶可通過(guò)通義千問(wèn)網(wǎng)站和APP快速讀研報(bào)、分析財(cái)報(bào)、讀科研論文、研判案情、讀醫(yī)療報(bào)告、解讀法律條文、分析考試成績(jī)、總結(jié)深度文章。

360緊隨其后,其在當(dāng)晚宣布,360智腦正式內(nèi)測(cè)500萬(wàn)字長(zhǎng)文本處理功能,即將入駐360AI瀏覽器。

Kimi成功在前,阿里、百度、360先后角逐長(zhǎng)文本。長(zhǎng)文本能力會(huì)是大模型未來(lái)差異化的競(jìng)爭(zhēng)點(diǎn)嗎?

上述大模型架構(gòu)人士表示,長(zhǎng)文本能力目前在訓(xùn)練和效果上仍存在一些難點(diǎn),比如如何避免遺漏細(xì)節(jié)。事實(shí)上,文本長(zhǎng)度也可以通過(guò)RoPE等算法技術(shù)去拓展,但是此時(shí)會(huì)嚴(yán)重丟失細(xì)節(jié),這就導(dǎo)致輸出效果不準(zhǔn)確。因此,核心標(biāo)準(zhǔn)是看輸出結(jié)果的精準(zhǔn)性連貫性,并不是文本長(zhǎng)度越長(zhǎng)越好。

另外一名大模型行業(yè)人士也告訴記者,長(zhǎng)文本實(shí)際是大模型的基礎(chǔ)能力,只要算力資源足夠,理論上長(zhǎng)文本可以追求無(wú)限長(zhǎng),“但是如果使用場(chǎng)景根本用不上長(zhǎng)文本,那么此時(shí)的長(zhǎng)文本就沒(méi)有任何意義”。

▍2024年是大模型應(yīng)用落地元年嗎?

Kimi的火爆,一定程度上也反應(yīng)了當(dāng)下國(guó)內(nèi)大模型的發(fā)展階段,從打基建開(kāi)始走向應(yīng)用落地。那么,2024年是否會(huì)成為AI大模型應(yīng)用落地元年?

瀾舟科技CEO周明認(rèn)為,從長(zhǎng)遠(yuǎn)來(lái)看,人工智能在逼近AGI。而經(jīng)過(guò)去一年的發(fā)展,大模型已經(jīng)具備了落地的能力,企業(yè)側(cè)也積攢了很多業(yè)務(wù)落地場(chǎng)景。加上國(guó)家政策的推動(dòng),2024年將會(huì)是大模型落地元年。

零一萬(wàn)物聯(lián)合創(chuàng)始人祁瑞峰也表達(dá)了類似的看法,但他是聚焦在B端場(chǎng)景。目前,內(nèi)容生成、理解、摘要和對(duì)話等應(yīng)用仍占據(jù)主導(dǎo),但隨著新一代模型推理、決策和執(zhí)行能力的提升,有望更快地將AI技術(shù)植入企業(yè)業(yè)務(wù)系統(tǒng),真正開(kāi)啟大模型賦能的騰飛。

電商是AI應(yīng)用最具代表性的領(lǐng)域之一。魔琺科技目前是阿里媽媽、淘寶直播生態(tài)官方指定的3D超寫(xiě)實(shí)虛擬直播服務(wù)商,旗下有一款3D虛擬人直播AIGC產(chǎn)品“有光”。

魔琺科技CEO柴金祥在接受《科創(chuàng)板日?qǐng)?bào)》記者采訪時(shí)表示,電商是公司AI產(chǎn)品應(yīng)用的最主要一個(gè)行業(yè)。從已有的使用效果來(lái)看,多個(gè)知名頭部美妝品牌在使用魔琺科技提供的3D虛擬人后,午夜6小時(shí)的直播時(shí)段內(nèi)累計(jì)年GMV增量高達(dá)數(shù)千萬(wàn)。3D虛擬直播午夜超級(jí)直播廣告投放高于行業(yè)均值2倍以上,ROI大于5倍。

盡管2024年被寄予厚望,但是各方仍然保持著審慎樂(lè)觀的態(tài)度。

祁瑞峰認(rèn)為,在C端市場(chǎng),目前成本還很高,商業(yè)模式還未完全跑通。即便是對(duì)于現(xiàn)在已經(jīng)可以創(chuàng)收的B端市場(chǎng),周明也認(rèn)為,要想做好產(chǎn)品標(biāo)準(zhǔn)化和完整交付,訓(xùn)練和部署成本、行業(yè)適配能力、幻象問(wèn)題、數(shù)據(jù)安全四方面的問(wèn)題,還有待解決。

夢(mèng)餉科技CTO曹均濤在接受《科創(chuàng)板日?qǐng)?bào)》記者采訪時(shí)表示,雖然AI在電商行業(yè)的應(yīng)用,想象空間非常大,夢(mèng)餉也在通過(guò)GPT大模型重構(gòu)業(yè)務(wù)場(chǎng)景,包括解決模特圖片生成、素材差異化、服裝秀、AI創(chuàng)作助手、聊天室導(dǎo)購(gòu)等問(wèn)題。

“但是現(xiàn)在的階段,基礎(chǔ)設(shè)施并不完善。”曹均濤告訴記者,夢(mèng)餉在去年為創(chuàng)作者做了AI創(chuàng)作平臺(tái),雖然能生成模特圖,但是成圖率并不高,還是需要技術(shù)升級(jí)和內(nèi)部做技術(shù)提示詞、算法模型的調(diào)優(yōu),這個(gè)平臺(tái)到現(xiàn)在還沒(méi)有開(kāi)放,“現(xiàn)在大家都在找應(yīng)用場(chǎng)景,估計(jì)2024年開(kāi)始能夠看到更多AI、大模型帶來(lái)的變化”。

在42章經(jīng)創(chuàng)始人曲凱看來(lái),2024年仍會(huì)是技術(shù)上不斷突破的一年,很難真的做到大規(guī)模的落地和有非常多的場(chǎng)景,不過(guò),不管是在B端還是C端,今年有望看到更多應(yīng)用開(kāi)始跑出來(lái)。與此同時(shí),應(yīng)用端的項(xiàng)目今年也將更受投資人青睞。

“去年大家投了非常多資金和精力在大模型本身,要想將這個(gè)故事持續(xù)下去,就需要有落地,因此會(huì)在應(yīng)用端繼續(xù)探索,找到PMF(Product Market Fit,產(chǎn)品市場(chǎng)匹配)?!鼻鷦P說(shuō)。

收藏
95.71W
我要評(píng)論
歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
要聞
股市
關(guān)聯(lián)話題
5933 人關(guān)注
4.25W 人關(guān)注