Sora火爆的當(dāng)下,國內(nèi)大模型企業(yè)如何追趕Sora,難點(diǎn)在哪兒?2月23日晚,360集團(tuán)創(chuàng)始人周鴻祎獨(dú)家回應(yīng)了新京報貝殼財經(jīng)記者的這一問題。他認(rèn)為,Sora的技術(shù)路線如果被開源,國內(nèi)將能很快趕上,但在追趕Sora時,算力有可能成為門檻,對此,集中國內(nèi)所有AI企業(yè)的算力或許是方法之一。
周鴻祎接受記者采訪。 新京報貝殼財經(jīng)記者羅亦丹/攝
文生視頻技術(shù)路線方向已被Sora確定 但工程化思路需要探索
Sora發(fā)布后,周鴻祎曾一連發(fā)了十多條視頻談?wù)撨@一文生視頻大模型,他認(rèn)為Sora對物理世界的很多描述符合常識,符合人類對世界的認(rèn)識,因此不能把Sora僅看作一個文生視頻的工具,而要看到背后人工智能的發(fā)展。
對于Sora采用的技術(shù),周鴻祎稱目前Pika、Runway等文生視頻公司可能只是使用了文生圖模型的相關(guān)技術(shù),但Sora將文生圖模型技術(shù)與文生文模型技術(shù)結(jié)合了起來,因此才能達(dá)到令人驚嘆的效果。
周鴻祎對貝殼財經(jīng)記者表示,Sora所代表的技術(shù)路線出爐后,國外也有兩條路線的斗爭,一條是OpenAI的閉源,另一條是以Meta為代表的開源,“開源路線的目標(biāo)就要打破閉源,他們會不斷去猜測閉源是怎么做的,最后再開源出來。開源出來的好處是,很多小公司和大公司的個人成員會積極地在開源項目中借鑒他人成果,同時再貢獻(xiàn)自己的成果,其化學(xué)作用會非常明顯。”
在他看來,一旦Sora的技術(shù)被開源出來,國內(nèi)就能很快跟上。一個可供參考的事實(shí)是,一年前的今天ChatGPT沖擊科技圈,而國內(nèi)企業(yè)僅用了不到一年的時間就達(dá)到了GPT3.5的技術(shù)水平。
周鴻祎告訴貝殼財經(jīng)記者,他近幾日跟很多AI專家有過交流,發(fā)現(xiàn)目前許多技術(shù)里用到的模型和算法都是公開的,他認(rèn)為OpenAI最大的能力一個是找方向,另一個就是工程化思路非常嚴(yán)謹(jǐn)。因此,現(xiàn)在需要把工程化的思路探索出來,“此前大家學(xué)習(xí)ChatGPT的過程中,同樣也是在方向已確定的情況下,解決‘具體一個坎怎么過’、‘碰到一個山怎么翻’,踩很多坑,驗證許多具體的方法,這需要時間。”
Sora可能會生成更長視頻 追趕Sora國內(nèi)應(yīng)集中算力
周鴻祎同時認(rèn)為,在追趕Sora方面,算力可能也是一個坎。
此前,有專家分析稱,Sora的參數(shù)規(guī)模不大,約為30億。對此周鴻祎持反對態(tài)度,“這就弄錯了一個概念,視頻的參數(shù)和文本的參數(shù)是不能簡單做對比的,文本有10萬字,視頻只有640×480,但是它兩個所占的存儲量完全不在一個數(shù)量級上。所以Sora可能不僅有30億參數(shù),第二就算只有30億參數(shù),他視頻分析對算力的消耗應(yīng)該是遠(yuǎn)遠(yuǎn)超過千億模型的。所以,當(dāng)現(xiàn)在國內(nèi)顯卡都被卡脖子之后,算力就可能會是一個問題。”
“Sora為什么只能做1分鐘視頻,我猜測因為它和4秒6秒有本質(zhì)的差別,4秒和6秒是因為全部用像素來生成,沒有這個世界的知識。4、6秒之后這個圖怎么樣?你就想不出來了。”周鴻祎猜測,Sora能生成一分鐘的視頻,就意味著也能生成10分鐘、60分鐘的視頻,但是為什么不做呢?是由于算力和成本的限制。
同樣,算力問題也出現(xiàn)在中國的AI行業(yè)中。對此,周鴻祎表示,他正在思考是否要提出如下建議,“目前,Meta已經(jīng)有50萬塊GPU,明年可能會買百萬塊,微軟應(yīng)該也會按照百萬級別去下訂單。而國內(nèi)的所有人工智能公司加在一起可能有50萬塊GPU,但都分散在各個公司里。”
在他看來,是否能夠把國內(nèi)的GPU算力都集中起來,“我之所以最近一直在科普,是因為Sora不僅僅是一個文生視頻的工具,如果是的話我們落后就落后了,無非是廣告落后一點(diǎn)、電影拍得慢一點(diǎn),這些落后除了可能對娛樂業(yè)造成影響外,不會影響大國競爭,但實(shí)際上Sora預(yù)示著AGI(通用人工智能)的一個關(guān)鍵節(jié)點(diǎn),所以我認(rèn)為這對國家很重要。”
記者聯(lián)系郵箱:[email protected]
新京報貝殼財經(jīng)記者 羅亦丹
編輯 徐超
校對 張彥君