【億邦原創(chuàng)】過去兩天,零一萬(wàn)物的熱度超過正在進(jìn)行的CES。
1月2日,零一萬(wàn)物與阿里云成立“產(chǎn)業(yè)大模型聯(lián)合實(shí)驗(yàn)室”,推動(dòng)大模型從技術(shù)到應(yīng)用的發(fā)展。其背后的更深入合作,則是零一萬(wàn)物預(yù)訓(xùn)練團(tuán)隊(duì)和Infra團(tuán)隊(duì)轉(zhuǎn)手阿里云,雙方達(dá)成一次各取所需的合作與交接。
除了大模型公司在預(yù)訓(xùn)練投入與商業(yè)化緩慢之間的巨大鴻溝,國(guó)內(nèi)的AI人才荒也是本次雙方合作的重要基石。
在過去一年半,字節(jié)開啟空前的人才網(wǎng)羅行動(dòng),阿里則成為人才流失的重災(zāi)區(qū)。公開信息顯示,字節(jié)不僅挖走零一萬(wàn)物前預(yù)訓(xùn)練負(fù)責(zé)人黃文灝,谷歌原VideoPost項(xiàng)目負(fù)責(zé)人蔣路、面壁智能原核心成員,也從阿里云挖走通義千問核心技術(shù)負(fù)責(zé)人周暢,及其手下的十多名團(tuán)隊(duì)成員。據(jù)介紹,字節(jié)為周暢提供一份難以拒絕的8位數(shù)的薪酬包,其團(tuán)隊(duì)成員同樣獲得了相當(dāng)于阿里P10、P9級(jí)別的優(yōu)厚待遇。字節(jié)的Seed團(tuán)隊(duì)(專注大模型底層技術(shù)研發(fā))和Flow團(tuán)隊(duì)(負(fù)責(zé)AI原生應(yīng)用研發(fā))的規(guī)模分別迅速擴(kuò)張到150人和300人。
此次阿里云與零一萬(wàn)物的戰(zhàn)略合作,也被認(rèn)為是在填補(bǔ)阿里云的技術(shù)空缺,穩(wěn)定市場(chǎng)信心。
“一些成員擅長(zhǎng)和愿意投入Scaling Law,所以部分團(tuán)隊(duì)會(huì)通過聯(lián)合實(shí)驗(yàn)室和阿里深度整合?!崩铋_復(fù)在回應(yīng)媒體采訪時(shí)公開表示。
1、“強(qiáng)強(qiáng)聯(lián)合”背后
在過去一年,零一萬(wàn)物三位重量級(jí)負(fù)責(zé)人相繼離職——8月技術(shù)聯(lián)創(chuàng)、算法副總裁黃文灝轉(zhuǎn)投字節(jié),9月產(chǎn)品負(fù)責(zé)人曹大鵬離職。零一萬(wàn)物8月完成A輪融資,來自某國(guó)際戰(zhàn)投東南亞財(cái)團(tuán),融資額在“六小虎”中并不突出。
人員動(dòng)蕩下,零一萬(wàn)物的大模型訓(xùn)練依然取得不錯(cuò)成績(jī)。
2024年10月,零一萬(wàn)物曾發(fā)布新旗艦?zāi)P蚘i-Lightening,在國(guó)際權(quán)威盲測(cè)榜單LMSYS上,超越OpenAI的GPT-4o-2024-05-13和Anthropic Claude 3.5 Sonnet,排名世界第六。
這個(gè)成績(jī)?cè)诋?dāng)時(shí)超出零一萬(wàn)物團(tuán)隊(duì)的預(yù)想。LMSYS屬于盲測(cè)榜,通過平臺(tái)隨機(jī)比試與匿名眾籌,進(jìn)行線上盲測(cè)評(píng)選,測(cè)評(píng)結(jié)果受到OpenAI、Anthropic、Google、Meta等企業(yè)的認(rèn)可。
零一萬(wàn)物內(nèi)部員工表示,團(tuán)隊(duì)也沒有想到Y(jié)i-Lightening取得這樣的好成績(jī),本來只打算將結(jié)果簡(jiǎn)單發(fā)布,成績(jī)出來后隨即決定開線上發(fā)布會(huì)。李開復(fù)在會(huì)上宣布,“零一萬(wàn)物緊隨OpenAI、Google之后,與xAI打平,進(jìn)擊全球前三大模型企業(yè)?!?/p>
這是對(duì)零一萬(wàn)物大模型團(tuán)隊(duì)的一次證明,比如與稠密模型架構(gòu)不同的MoE架構(gòu)、獨(dú)特的混合注意力機(jī)制(Hybrid Attention)、動(dòng)態(tài)Top-P路由、 多階段訓(xùn)練(Multi-stage Training)等?!拔覀冇懈墒斓挠?xùn)練方法,只花了xAI成本的1%或2%,做出來的Pre-training模型跟Grok-2-08-13打平?!崩铋_復(fù)解釋。
同時(shí)零一萬(wàn)物還透露,李開復(fù)博士正在接觸“一位預(yù)訓(xùn)練大咖,非常厲害?!蹦壳翱磥碚恰禠oRA:Low-Rank Adaptation of Large Language Models》的二作YeLong Shen,曾任微軟Azure AI首席研究員。
盡管由于預(yù)訓(xùn)練投入與商業(yè)化營(yíng)收之間鴻溝,讓零一萬(wàn)物調(diào)整戰(zhàn)略縮減團(tuán)隊(duì),這樣一支成熟的大模型訓(xùn)練團(tuán)隊(duì)依然價(jià)值不菲。
《智能涌現(xiàn)》報(bào)道稱,零一萬(wàn)物預(yù)訓(xùn)練團(tuán)隊(duì)收到阿里“通義”的offer,Infra團(tuán)隊(duì)則收到了阿里智能云團(tuán)隊(duì)的offer。
2、AI人才荒凸顯,缺口高達(dá)數(shù)百萬(wàn)
過去一年,阿里云不僅要在模型性能面臨國(guó)內(nèi)外挑戰(zhàn),在人才爭(zhēng)奪上也面臨激烈競(jìng)爭(zhēng)。
2024年11月,阿里起訴通義前員工周暢違反競(jìng)業(yè)協(xié)議的仲裁案,暴露了大廠之間的人才軍備競(jìng)賽。周暢2017年加入阿里巴巴,花名“鐘煌”,曾參與多款語(yǔ)言模型和多模態(tài)模型的研發(fā)。2024年7月,周暢以創(chuàng)業(yè)為名提出離職,并簽署了競(jìng)業(yè)協(xié)議,隨之離開的還有十幾名團(tuán)隊(duì)成員。幾個(gè)月后該團(tuán)隊(duì)均低調(diào)加入字節(jié)跳動(dòng),從事大模型相關(guān)工作。
阿里對(duì)周暢提出仲裁并要求巨額賠償,同時(shí)尋找新的“AI戰(zhàn)略人才”。
急于補(bǔ)充AI人才的不止阿里,近期小米集團(tuán)董事長(zhǎng)雷軍親自挖來95后AI女工程師羅福莉,或供職于小米AI實(shí)驗(yàn)室,領(lǐng)導(dǎo)小米大模型團(tuán)隊(duì),并開出了千萬(wàn)元級(jí)別的薪酬offer。
事實(shí)上,不僅AI頂尖人才的年薪破千萬(wàn),各行各業(yè)都加入這場(chǎng)AI人才爭(zhēng)奪戰(zhàn)。
脈脈高聘發(fā)布的報(bào)告顯示,大模型算法研究員新發(fā)崗位平均月薪高達(dá)6.4萬(wàn)元,領(lǐng)跑高薪崗位榜。新金融科技行業(yè)為多個(gè)崗位開出了全行業(yè)最高薪資,如人工智能工程師平均月薪為67460元;智能硬件行業(yè)的產(chǎn)品經(jīng)理和銷售經(jīng)理薪資也高于其他行業(yè)。
隨著大模型應(yīng)用的普及,大模型開發(fā)人員也水漲船高。算法工程師作為人工智能技術(shù)的核心崗位,需求量最大,新發(fā)崗位占比接近一半,達(dá)到46.45%。自然語(yǔ)言處理崗位占比11.04%,位居第二。
同時(shí)國(guó)內(nèi)的AI人才更多集中于應(yīng)用層。根據(jù)中科科界的數(shù)據(jù),應(yīng)用層AI人才占比達(dá)到54.3%。這些人才在實(shí)際項(xiàng)目中積累了豐富的經(jīng)驗(yàn),能夠迅速推動(dòng)AI技術(shù)的應(yīng)用和普及。而基礎(chǔ)層人才存量較低,僅占17.1%。
高薪搶人背后,AI人才缺口仍然明顯。麥肯錫公司此前發(fā)布的報(bào)告預(yù)計(jì),2030年中國(guó)對(duì)熟練AI專業(yè)人員的需求將增至2022年的六倍,達(dá)到600萬(wàn),而AI人才缺口可能多達(dá)400萬(wàn)。
在本次人才競(jìng)速中,阿里與零一萬(wàn)物無(wú)疑完成一次各取所需的合作。零一萬(wàn)物剝離投入巨大的預(yù)訓(xùn)練和Infra團(tuán)隊(duì),輕裝上陣,為全力沖刺商業(yè)化做好準(zhǔn)備。阿里則補(bǔ)充彈藥,填補(bǔ)技術(shù)空缺,穩(wěn)定市場(chǎng)信心。
只是不知道,下一個(gè)面臨著陸的大模型公司,會(huì)不會(huì)有零一萬(wàn)物的智慧和運(yùn)氣。