
豆包:視頻生成模型“VideoWorld”可僅靠視覺認(rèn)知世界 現(xiàn)已開源
視頻生成實(shí)驗(yàn)?zāi)P汀癡ideoWorld”由豆包大模型團(tuán)隊(duì)與北京交通大學(xué)、中國(guó)科學(xué)技術(shù)大學(xué)聯(lián)合提出。不同于Sora 、DALL-E 、Midjourney等主流多模態(tài)模型,VideoWorld在業(yè)界首次實(shí)現(xiàn)無(wú)需依賴語(yǔ)言模型,即可認(rèn)知世界。?目前,該項(xiàng)目代碼與模型已開源。
關(guān)聯(lián)文章
我要評(píng)論
反饋意見 

歡迎您發(fā)表有價(jià)值的評(píng)論,發(fā)布廣告和不和諧的評(píng)論都將會(huì)被刪除,您的賬號(hào)將禁止評(píng)論。
發(fā)表評(píng)論
關(guān)聯(lián)話題