美團(tuán)收購光年之外,能否留住AI人才是關(guān)鍵 當(dāng)前速讀
(原標(biāo)題:美團(tuán)收購光年之外,能否留住AI人才是關(guān)鍵)
【資料圖】
近日,美團(tuán)宣布以20.65億元人民幣的價(jià)格,收購AI公司光年之外,引發(fā)了業(yè)界的廣泛關(guān)注。
王慧文與美團(tuán)創(chuàng)始人王興是清華大學(xué)的同學(xué)兼室友,曾經(jīng)在創(chuàng)業(yè)道路上數(shù)度并肩作戰(zhàn),被譽(yù)為互聯(lián)網(wǎng)圈的一段佳話。
此前,王慧文因健康原因,不得不中止了對光年之外AI事業(yè)的領(lǐng)導(dǎo)。
這次的收購,被很多人看成是王興對這位上鋪兄弟的“出手相救”。
來源:罐頭圖庫
不過,除了個(gè)人情誼之外,光年之外本身在AI領(lǐng)域的價(jià)值,自然也是美團(tuán)此次收購的重要原因。
光年之外成立于2023年2月,由王慧文個(gè)人出資5000萬美元,估值2億美元,王慧文曾表示,“個(gè)人肉身不占股份,75% 的股份用于邀請頂級研發(fā)人才”。并發(fā)布了“英雄帖”,聲稱要打造“中國的OpenAI”。
那么,如此高調(diào)進(jìn)軍AI領(lǐng)域的光年之外,其真正技術(shù)實(shí)力究竟如何?被收購之后,其與美團(tuán)又將在AIGC領(lǐng)域,打開怎樣的局面呢?。
01 收購下的收購
按照常理推斷,今年2月才成立的光年之外,注定在AI技術(shù)上不會有太深厚的積累。
既然如此,決意向AGI進(jìn)軍的王慧文,就只能通過最“速成”的方式——收購,來增強(qiáng)自身團(tuán)隊(duì)的技術(shù)實(shí)力。
王慧文在兩個(gè)月內(nèi)完成技術(shù)人才團(tuán)隊(duì)搭建,吸引了包括多名人工智能領(lǐng)域頂級專家和創(chuàng)業(yè)者的加入。其中最引人注目的是收購了有著40多人規(guī)模的AI框架公司“一流科技”。
一流科技是一家專注于人工智能基礎(chǔ)設(shè)施軟件的研發(fā)工作的創(chuàng)新企業(yè),由清華袁進(jìn)輝博士于2017年創(chuàng)立。
師從清華人工智能研究院院長張鈸的袁進(jìn)輝,不僅曾任微軟亞洲研究院主管研究員,獲得過多項(xiàng)國際專利,還提出了當(dāng)時(shí)世界上最快的主題模型訓(xùn)練算法系統(tǒng)LightLDA。
今年4月,光年之外完成收購一流科技,持有約46.52%股權(quán),袁進(jìn)輝及輝煌合伙持有約34.63%及18.84%權(quán)益,到被美團(tuán)收購時(shí),光年之外整個(gè)團(tuán)隊(duì)規(guī)模已經(jīng)達(dá)到了70多人。
可以說,目前光年之外最主要的AI技術(shù),就是來自一流科技。
而要衡量一流科技在AI領(lǐng)域的技術(shù)水平,我們不妨看看其親自研發(fā)的核心產(chǎn)品——OneFlow,這是一個(gè)對標(biāo)TensorFlow、PyTorch及百度飛槳的深度學(xué)習(xí)框架。
如果要用一句話,概括OneFlow對大模型的意義,那就是它可以使用更多的計(jì)算資源,加快訓(xùn)練速度,提高模型性能,同時(shí)不受內(nèi)存容量的限制。
這樣的特點(diǎn),主要?dú)w功于OneFlow,靜態(tài)編譯和流式并行的核心理念和架構(gòu)。
這樣的架構(gòu),簡單來說,就是在運(yùn)行前就會構(gòu)建好一個(gè)完整的計(jì)算圖和數(shù)據(jù)流的表示,包括計(jì)算節(jié)點(diǎn)、數(shù)據(jù)節(jié)點(diǎn)、通信節(jié)點(diǎn)等,而非在運(yùn)行時(shí)才根據(jù)輸入這些信息。
如此一來,就可以有效地減少運(yùn)行時(shí)的開銷,提高計(jì)算效率,降低大模型訓(xùn)練所需的設(shè)備數(shù)量和通信量。
雖然,在當(dāng)下的大模型競爭中,降低模型的訓(xùn)練難度和成本,早已不是什么新穎的技術(shù),但OneFlow的獨(dú)特之處就在于:其不僅讓大模型訓(xùn)練得更快,而且還讓大模型具備了更高的“易用性”。
而這樣的“易用性”,說白了就是能讓應(yīng)用更容易地落地,并支持更多的場景,例如大規(guī)模人臉識別、廣告推薦大規(guī)模訓(xùn)練等。
為實(shí)現(xiàn)這點(diǎn),OneFlow采用了數(shù)據(jù)并行與模型并行相結(jié)合的技術(shù)。
簡單地說,就是可以將一個(gè)大的數(shù)據(jù)集切分到多個(gè)設(shè)備上,每個(gè)設(shè)備使用相同的模型參數(shù)進(jìn)行訓(xùn)練,然后通過通信同步梯度,提高訓(xùn)練速度和效率。
這樣的技術(shù),不僅解決了解決模型過大,無法放入單個(gè)設(shè)備的問題,還能根據(jù)不同的用戶和場景,靈活地選擇最合適的并行方式,實(shí)現(xiàn)更高效的分布式訓(xùn)練。
了解了這一切之后,我們再從整體上分析這次美團(tuán)的收購事件,就可以從中窺見,這樣的技術(shù),在美團(tuán)目前的AI布局中,為何顯得至關(guān)重要。
02 并行訓(xùn)練
要理解光年之外對美團(tuán)的意義,我們就得先看看美團(tuán)想用AI來做什么。
早在2020年的世界人工智能大會上,美團(tuán)首席科學(xué)家、AI平臺部總經(jīng)理夏華夏首次公布了美團(tuán)在AI科技領(lǐng)域的布局和愿景。
夏華夏表示:“美團(tuán)AI將以‘幫大家吃得更好,生活更好’為核心目標(biāo),致力于在實(shí)際業(yè)務(wù)場景需求上探索前沿的人工智能技術(shù),并將之迅速落地在實(shí)際生活服務(wù)場景中,完成線下經(jīng)濟(jì)的數(shù)字化?!?/p>
說白了,就是以AI技術(shù)+海量真實(shí)數(shù)據(jù),形成以美團(tuán)AI為核心的智能化生活服務(wù)閉環(huán)。
來源:罐頭圖庫
但問題是,“實(shí)際生活服務(wù)場景”,是一個(gè)涵蓋面很廣的概念,它包括了餐飲、外賣、酒店、旅游、電影、打車等。
這么多的場景,怎么用AI一攬子拿下?
美團(tuán)給出的策略是“以場景驅(qū)動技術(shù)”。
換句話說,美團(tuán)有很多種不同的服務(wù),包括線下生活里的各種方面,有這些場景就有大量的數(shù)據(jù),這些大量的數(shù)據(jù)可以反過來幫助美團(tuán)人工智能算法不斷迭代、優(yōu)化,這些算法再幫助用戶在場景中得到更好的服務(wù)。
這實(shí)際上是一種以專有數(shù)據(jù)形成正循環(huán)的思路。
在這樣的整體布局中,一個(gè)能夠根據(jù)不同的用戶和場景,實(shí)現(xiàn)高效的分布式訓(xùn)練的算法框架,就顯得尤為重要。
而這正是之前提到的OneFlow的并行訓(xùn)練所具備的優(yōu)勢。
舉例來說,在美團(tuán)外賣場景下,需求是與情境依存的,在不同的時(shí)間、空間以及其他更廣義的環(huán)境下,用戶需求、商家供給等都有顯著區(qū)別。
這樣的情況,造成了外賣場景具有很強(qiáng)的地理位置和就餐文化約束,
比如工作日多為單人餐,以飯類套餐、輕食、米線為主;而在周末,用戶會適當(dāng)犒勞自己、兼顧家人,傾向于選擇更適合多人就餐的燒烤、韓國料理、火鍋。
某地區(qū)高消費(fèi)用戶在工作日和周末的差異性就餐習(xí)慣
面對這種情況,以往的模型設(shè)計(jì),比如用戶興趣建模,或者樸素的多層神經(jīng)網(wǎng)絡(luò),都無法應(yīng)對這些復(fù)雜的用戶、時(shí)間和地理環(huán)境糾纏在一起的情況。
雖然美團(tuán)對此提出了“情境細(xì)分+統(tǒng)一模型”的思路,將用戶的行為序列按照不同的情境進(jìn)行劃分,然后用一個(gè)統(tǒng)一的模型,來對每個(gè)情境下的用戶行為進(jìn)行預(yù)測。
但這種大參數(shù)的統(tǒng)一模型,往往會導(dǎo)致訓(xùn)練和預(yù)測的開銷較大,影響推薦的效率和穩(wěn)定性。
而OneFlow的框架,正好解決了這一痛點(diǎn)。
得益于數(shù)據(jù)并行與模型并行的技術(shù),OneFlow可以把一個(gè)大的模型切分成多個(gè)小的模型,分配到多個(gè)設(shè)備上,每個(gè)設(shè)備負(fù)責(zé)一部分模型的計(jì)算,然后通過通信傳遞中間結(jié)果,完成整個(gè)模型的計(jì)算。
如此一來,OneFlow就不需要一個(gè)統(tǒng)一的模型,而是可以使用多個(gè)子模型來對不同細(xì)分群體的用戶行為進(jìn)行預(yù)測,并通過多任務(wù)學(xué)習(xí)和遷移學(xué)習(xí),來實(shí)現(xiàn)不同情境間的知識共享和遷移,提高推薦的精準(zhǔn)度和個(gè)性化程度。
從這個(gè)角度上說,OneFlow的技術(shù)對美團(tuán)而言,無疑是一塊用在刀刃上的“好鋼”。
03 留住人才才是關(guān)鍵
盡管光年之外的加入,在技術(shù)層面上,為美團(tuán)的AI生態(tài)注入了新的活力,然而,每一個(gè)技術(shù)的背后,其實(shí)都是人才的競爭。
可以說,正是這些人才的存在,才讓此次的收購真正具有了“價(jià)值”,而非僅僅是買來了一個(gè)徒有口號和情懷的空殼公司。
在此次的收購中,光年之外對美團(tuán)最大的意義,就是帶來了原先一流科技頂尖的AI人才。
除了在深度學(xué)習(xí)有著頗深造詣的袁進(jìn)輝博士外,一流科技的首席科學(xué)家張鈸,不僅是清華大學(xué)人工智能智能研究院院長、而且還是中國計(jì)算機(jī)學(xué)會CCF終身成就獎獲得者,堪稱中國人工智能領(lǐng)域的學(xué)界泰斗。
從這點(diǎn)來看,美團(tuán)的科研隊(duì)伍正不斷壯大。
然而,在繁盛的表象之下,如何留住這些頂尖的人才,將是王興接下來的一個(gè)重大難題。
在這方面,百度與辛頓之間的往事,也許是一個(gè)很有啟發(fā)意義的例子。
弗里·辛頓(Geoffrey Hinton),在業(yè)內(nèi)有“人工智能教父”之稱
2012年,百度曾斥資4400萬美元,試圖收購辛頓(人工智能三大泰斗之一)的初創(chuàng)公司——DNNresearch,想將這位學(xué)界泰斗納入自己麾下。
結(jié)果辛頓最終還是選擇了谷歌。
雖然錢是少了點(diǎn),但辛頓選擇了遵從內(nèi)心——谷歌才是他想要的環(huán)境。
這樣的例子說明了,對于AI人才,尤其是頂尖的AI人才來說,錢永遠(yuǎn)不是唯一考慮的因素。
能否為人才提供一個(gè)施展自身才華、理想的空間,能否使之認(rèn)同企業(yè)的價(jià)值觀,這都是能否留住人才的重要的因素。
在這點(diǎn)上,美團(tuán)是否會表現(xiàn)得比其他企業(yè)更好?恐怕只有時(shí)間才能給出答案了。
關(guān)鍵詞: