①知識圖譜擅長表達專業(yè)知識、私密知識,這與大模型所表達的參數(shù)化、不可理解的知識是緊密的互補關系; ②復旦大學教授肖仰華認為,大模型沒有通識能力,是不可能發(fā)展出專業(yè)認知能力。通用大模型的行業(yè)適配和優(yōu)化的道路才剛剛開始**。
《科創(chuàng)板日報》9月9日訊(記者 黃心怡)在上海舉行的2023 inclusion·外灘大會,吸引了多家金融大模型廠商參會,探討大模型技術從基礎大模型走向行業(yè)大模型的機會和挑戰(zhàn)。
多位金融領域的專家指出,大模型對整個金融體系的影響是長期的,但金融業(yè)對精準度、可控性、安全等都有很高的要求,而當下大模型仍無法解決幻覺問題——不準確或誤導性的輸出,影響了其應用落地。要解決這一點,應注重知識圖譜技術與大模型技術的融合,并重視傳統(tǒng)小模型的協(xié)同作用,不管是重底座、輕應用,還是重應用、輕底座,都是錯誤的。
▍大模型對金融體系將產(chǎn)生長期影響
相關研究數(shù)據(jù)顯示,目前國內(nèi)參數(shù)在10億規(guī)模以上的大模型數(shù)量已有116個,其中金融行業(yè)大模型約18個。螞蟻集團、度小滿、恒生電子、同花順等已經(jīng)在積極研發(fā)金融大模型。
有業(yè)內(nèi)分析認為,中國金融機構經(jīng)歷互聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)兩大浪潮之后,如今正迎接第三波大模型浪潮。
中國社科院國家金融與發(fā)展實驗室副主任楊濤在會上表示,大模型對整個金融體系的影響是一個長期的過程,而短期內(nèi)在某些方面已經(jīng)體現(xiàn)了一些價值:
一是在提升面向客戶的服務能力方面,可為金融機構員工的專業(yè)化營銷、渠道維護提供更加智能化的間接支持。
二是在改善機構工作流程與效率方面,可進一步提升業(yè)務鏈條智能化與辦公模式的自動化。
三是在文本處理方面,對金融機構的一般文本、專業(yè)合規(guī)文件及業(yè)務所需的信息,都能更低成本、高效地提供技術支持。
四是對金融機構實現(xiàn)了IT支持,其代碼生成的功能提升了IT基礎工作的效率。
平安集團首席科學家肖京介也分享了正在開展的大模型和AIGC實踐。肖京介透露,平安集團有幾十萬業(yè)務員,每個業(yè)務員可以通過人工智能生成多個高清數(shù)字人,從而擁有自己的數(shù)字分身,提高營銷能力。
在客戶服務方面,平安集團的語音機器人去年總計服務了26億次客戶,約占客服業(yè)務的81%。在保險理賠方面,借助AI技術實現(xiàn)98.6%的案件一天內(nèi)賠付。在風控領域,通過人臉和聲音等身份識別技術來反欺詐,并對債券、投資或二級市場投資等領域可能出現(xiàn)的風險,借助智能系統(tǒng)進行防范和預警。
不過,大模型本身能力仍有很多地方待改進。
肖京介指出,不管是精準度、可控性、安全等很多地方需要不斷進步。此外,在投產(chǎn)價值上,大模型的一大弊端是成本很高?!捌髽I(yè)做任何工作都要考慮產(chǎn)出,不能只看投入。而生成式大模型雖然在業(yè)務場景中逐漸出現(xiàn)成效,但還沒有呈現(xiàn)出規(guī)模化的效應。”
▍大模型、小模型互相協(xié)同
復旦大學教授、上海市數(shù)據(jù)科學重點實驗室主任肖仰華提到,“大模型的出現(xiàn)顛覆了認知。讓我們發(fā)現(xiàn)行業(yè)的很多問題恰恰是建立在通用的認知能力基礎上。沒有通識能力,是不可能發(fā)展出專業(yè)認知能力。”
但是,通用大模型的行業(yè)適配和優(yōu)化的道路才剛剛開始?!按竽P驮诮鹑陬I域的應用屬于復雜決策任務,要比ChatGPT這一類開放閑聊的任務,困難得多。通用模型里面的專業(yè)知識是遠遠不夠的。為此,大模型需要進行面向領域的訓練優(yōu)化,提升大模型的行業(yè)認知能力。” 肖仰華稱。
其中,特別要注重大模型與知識圖譜的協(xié)同。肖仰華認為,知識圖譜擅長表達的是專業(yè)知識、私密知識,和可理解、可控的符號知識,這與大模型所表達的參數(shù)化、不可理解的知識是緊密的互補關系,可以緩解大模型的幻覺問題。
此外,企業(yè)還需從知識、能力、價值三方面重新架構自身系統(tǒng)。在這個過程當中,尤其要重視傳統(tǒng)小模型的價值?!?strong>傳統(tǒng)的分類模型、預測模型依然有用,我們真正要做的是把大模型、小模型協(xié)同起來。實際上小模型的插件應用,可顯著地補足通用大模型能力的不足。重底座、輕應用和重應用、輕底座,都是在行業(yè)里使用大模型的錯誤。兩者我們要兼顧,把大模型、小模型協(xié)同好。”
▍大模型就像“鸚鵡學舌” 數(shù)理能力有待提升
螞蟻集團CTO何征宇在接受《科創(chuàng)板日報》記者采訪時表示,AI大模型在語言文字上有較強的表現(xiàn),但在數(shù)理邏輯上仍有差距。
何征宇把大模型比喻為一只大號的鸚鵡?!艾F(xiàn)在,大模型學習東西的過程,就像是鸚鵡學舌。人類不斷重復告訴大模型1+1=2,通過一段時間地訓練,它可以說人話、告訴你答案。但并不意味著真的理解了,特別在邏輯推斷、數(shù)理分析方面,你想想一只鸚鵡怎么可能做好量化分析?”
螞蟻集團副總裁、金融大模型負責人王曉航則在采訪中坦言,金融對知識專業(yè)性、邏輯的嚴謹性,以及合規(guī)性都要求很高。原生大模型距離金融行業(yè)的要求還有很大的鴻溝,如何防止大模型出現(xiàn)幻覺,并沒有很好的辦法。
“為此,我們采用了知識圖譜的結構化數(shù)據(jù),與大模型參數(shù)化數(shù)據(jù)相結合雙驅動方式。希望通過積累的大規(guī)模金融領域的知識圖譜,能確保大模型的專業(yè)和嚴謹性。通過知識的注入、一致性的對齊,在生成完后,對真實和一致性進行判別,這是一個系統(tǒng)化的過程?!?/p>
王曉航認為,當下金融業(yè)還沒有成熟到可以全面駕馭大模型所帶來的機會?!?strong>這依賴金融科技公司,金融體系內(nèi)部的科技力量,能夠把技術轉化成產(chǎn)品、轉化成平臺。我判斷,這還需要大概1、2年的時間?!?/p>