堅(jiān)持不用GPU!Meta又要All in自研AI芯片?
就在整個(gè)硅谷都在以自家公司拿到多少塊英偉達(dá)的AI芯片(A100 GPU)為傲?xí)r,有這么一家倔強(qiáng)的公司,堅(jiān)持不用英偉達(dá)的GPU,決定自研AI芯片。
(相關(guān)資料圖)
這家公司就是Facebook的母公司Meta。
5月18日本周四,Meta披露了旗下數(shù)據(jù)中心項(xiàng)目支持AI工作的細(xì)節(jié),提到已經(jīng)打造一款定制芯片,簡(jiǎn)稱MTIA,用于加快生成式AI模型的訓(xùn)練。這是Meta首次推出AI定制芯片。Meta稱,MTIA是加快AI訓(xùn)練和推理工作負(fù)載的芯片“家族”的一分子。
MTIA全稱為Meta訓(xùn)練和推理加速器。MTIA是一種ASIC,也就是將不同電路集成在一塊板上的芯片,可以將它進(jìn)行編程,執(zhí)行一項(xiàng)或多項(xiàng)任務(wù)??雌饋?lái)和GPU的功能類(lèi)似,對(duì)不對(duì)?
和現(xiàn)在全球都在搶著用的英偉達(dá)A100 GPU相比,Meta自稱這款芯片也有優(yōu)勢(shì)。Meta稱,MTIA采用開(kāi)源芯片架構(gòu)RISC-V,它的功耗僅有25瓦,遠(yuǎn)低于英偉達(dá)等主流芯片廠商的產(chǎn)品功耗。
而且,為了凸顯自己在AI領(lǐng)域早有布局,Meta稱,第一代MTIA芯片在2020年就已經(jīng)設(shè)計(jì)完成,采用的是7納米工藝。Meta說(shuō),打造第一代MTIA芯片的目的是提高內(nèi)容推薦模型的效率,以便更精準(zhǔn)地為用戶推薦廣告等內(nèi)容。此外,第一代MTIA可以將內(nèi)部128MB的內(nèi)存擴(kuò)展到高達(dá)128GB。在Meta設(shè)計(jì)的基準(zhǔn)測(cè)試中,它處理了低等和中等復(fù)雜度的AI模型,效率高于GPU。
對(duì)于投資者關(guān)于Meta為什么不直接采用GPU的質(zhì)疑,Meta的軟件工程師Joel Cohurn特別介紹稱,Meta并非不是沒(méi)有嘗試過(guò)GPU,而是在最初使用GPU執(zhí)行推理任務(wù)時(shí),發(fā)現(xiàn)GPU不太適合這種工作。用GPU固然可以大幅優(yōu)化軟件,但對(duì)真實(shí)模型的效率很低,現(xiàn)實(shí)配置時(shí)難度大、成本高。所以Meta認(rèn)為,靠人不如靠己,需要搞個(gè)MTIA。
不過(guò),Meta也承認(rèn),盡管在處理中低復(fù)雜程度模型時(shí)效率更高,但MTIA芯片在處理高復(fù)雜度AI模型時(shí)卻問(wèn)題多多。
Meta間接承認(rèn),要想讓MTIA達(dá)到英偉達(dá)A100的水平,尚有差距。Meta表示,這款芯片在內(nèi)存和網(wǎng)絡(luò)領(lǐng)域的工作還未完成,隨著AI模型發(fā)展,這些工作會(huì)出現(xiàn)瓶頸。目前,MTIA 的重點(diǎn)放在Meta應(yīng)用家族的推理方面,而不是訓(xùn)練。不過(guò)Meta強(qiáng)調(diào),MTIA“大大”提高了單位瓦特的推薦負(fù)載運(yùn)行效率,讓公司能運(yùn)行加強(qiáng)版的、更尖端的AI工作負(fù)載。
Meta本周四并未披露配置新芯片的時(shí)間表,也未說(shuō)明具體有什么計(jì)劃開(kāi)發(fā)可能訓(xùn)練模型的芯片。
Meta在AI領(lǐng)域已經(jīng)落后同行
去年底ChatGPT大火之后,AI成為全球科技界最熱門(mén)的話題。AI芯片的主流制造商英偉達(dá)賺得盆滿缽滿,一度被視為已經(jīng)落伍的微軟借著投資OpenAI成功逆襲,向來(lái)宣稱在AI領(lǐng)域投資諸多的谷歌倉(cāng)促發(fā)布Bard應(yīng)戰(zhàn),以及一眾互聯(lián)網(wǎng)大廠面對(duì)英偉達(dá)的“霸權(quán)”紛紛宣布要自研AI芯片……
這中間,獨(dú)獨(dú)沒(méi)有Meta的蹤影。
上個(gè)月,有媒體爆出一個(gè)大瓜,Meta如今居然還在用CPU來(lái)跑AI!
這不僅僅是因?yàn)橛ミ_(dá)的A100定價(jià)頗高,更是因?yàn)镸eta之前All in元宇宙留下的后遺癥。扎克伯格決定把全部身家賭在元宇宙上這一戰(zhàn)略,直接榨干了Meta的算力。不管是AI的部署,還是對(duì)競(jìng)爭(zhēng)對(duì)手威脅的應(yīng)對(duì)上,Meta的潛力都遭到了極大的削弱。
更不要說(shuō)去年以來(lái),Meta連續(xù)不斷的裁員,讓整個(gè)公司人心惶惶,絲毫沒(méi)有戰(zhàn)斗力應(yīng)對(duì)突如其來(lái)的AI大潮。
這些失誤,引起了前Meta董事會(huì)成員Peter Thiel的注意,隨后,他于2022年初辭職。據(jù)內(nèi)部人士透露,在離開(kāi)前的一次董事會(huì)會(huì)議上,Thiel告訴扎克伯格和其他高管們,他們對(duì)Meta的社交媒體業(yè)務(wù)太自滿,并且過(guò)分關(guān)注元宇宙了,這讓公司很容易被競(jìng)爭(zhēng)對(duì)手撼動(dòng)。
在去年夏末,扎克伯格曾召集高管們,花了五個(gè)小時(shí),對(duì)Meta的計(jì)算能力進(jìn)行分析。他們需要知道,在開(kāi)發(fā)尖端的AI方面,Meta有多大的能力?
出來(lái)的結(jié)果,讓所有人倒吸一口涼氣。
根據(jù)去年9月20日的公司備忘錄顯示,盡管Meta對(duì)AI研究進(jìn)行了大筆高調(diào)的投資,然而主要業(yè)務(wù)需要的AI友好型硬件和軟件系統(tǒng)都非常昂貴,在這些方面公司的進(jìn)展相當(dāng)緩慢。緩慢到,已經(jīng)阻礙了Meta跟上大規(guī)模創(chuàng)新的步伐。
哪怕是Meta All in的元宇宙,要想維持增長(zhǎng),也必須越來(lái)越多地依靠AI。
Meta基礎(chǔ)設(shè)施負(fù)責(zé)人Santosh Janardhan強(qiáng)調(diào),無(wú)論是開(kāi)發(fā)AI的工具,還是工作流程,Meta都已經(jīng)遠(yuǎn)遠(yuǎn)落后于其他對(duì)手。
要想追上英偉達(dá)有多難?
想要搞AI自研芯片的科技大廠不止Meta一家,但是想要做到英偉達(dá)這么成功、達(dá)到與之比肩的地位,還有很多路要走。
目前AI領(lǐng)域最常見(jiàn)的芯片是英偉達(dá)的A100。根據(jù)New Street Research的數(shù)據(jù),英偉達(dá)占據(jù)了可用于機(jī)器學(xué)習(xí)的圖形處理器市場(chǎng)的95%。
A100非常適合支持ChatGPT、Bing AI或Stable Diffusion等工具的機(jī)器學(xué)習(xí)模型,它能夠同時(shí)執(zhí)行許多簡(jiǎn)單的計(jì)算,這對(duì)于訓(xùn)練和使用神經(jīng)網(wǎng)絡(luò)模型非常重要。
A100背后的技術(shù)最初用于在游戲中渲染復(fù)雜的3D圖形,它通常被稱為圖形處理器(GPU),但如今A100配置和目標(biāo)是機(jī)器學(xué)習(xí)任務(wù),并在數(shù)據(jù)中心運(yùn)行,而不是在個(gè)人電腦中運(yùn)行。
市場(chǎng)對(duì)A100的需求可謂巨大。對(duì)AI公司來(lái)說(shuō),一塊A100是難以支撐起他們的AI夢(mèng)想的。許多數(shù)據(jù)中心使用一個(gè)包含八個(gè)A100的協(xié)同工作系統(tǒng)。該系統(tǒng)是英偉達(dá)的DGX A100,建議售價(jià)接近 20萬(wàn)美元。
New Street Research的一項(xiàng)估計(jì)認(rèn)為,Bing搜索和ChatGPT的模型可能需要8個(gè)A100 GPU才能在不到一秒的時(shí)間內(nèi)響應(yīng)用戶問(wèn)題。這意味著,微軟將需要超過(guò)2萬(wàn)個(gè)DGX系統(tǒng),這意味著微軟在AI基礎(chǔ)設(shè)施建設(shè)上的支出就可能高達(dá)40億美元的基礎(chǔ)設(shè)施支出。如果谷歌想實(shí)現(xiàn)同樣的AI轉(zhuǎn)型,那么將在DGX上花費(fèi)800億美元。
更讓硅谷其他公司不敢有所懈怠的是,英偉達(dá)并不因?yàn)锳100的巨大成功而自滿。
當(dāng)前,英偉達(dá)已經(jīng)開(kāi)始開(kāi)始量產(chǎn)下一代AI芯片H100。A100在2020年推出,H100則在2022年開(kāi)始量產(chǎn),當(dāng)然,價(jià)格也高于A100。英偉達(dá)表示,H100是其第一款針對(duì)變壓器進(jìn)行優(yōu)化的數(shù)據(jù)中心GPU,這是許多最新和頂級(jí)人工智能應(yīng)用程序使用的一項(xiàng)越來(lái)越重要的技術(shù)。
面對(duì)當(dāng)前英偉達(dá)在AI芯片領(lǐng)域一家獨(dú)大的局面,當(dāng)前在自研AI芯片領(lǐng)域步子邁得最大的是微軟。
本月早些時(shí)候,微軟正在提供財(cái)務(wù)支持以加強(qiáng)AMD研發(fā)AI芯片的努力,并與之合作開(kāi)發(fā)代號(hào)為Athena的自研AI芯片,這是微軟在自研AI芯片方面多管齊下、多重下注的一部分。
有分析認(rèn)為,此舉反映了微軟對(duì)芯片行業(yè)的介入持續(xù)深化。在過(guò)去幾年里,該公司一直在英特爾前高管Rani Borkar的領(lǐng)導(dǎo)下建立一個(gè)芯片部門(mén),該部門(mén)目前擁有近1000名員工。據(jù)其中一位知情人士稱,其中數(shù)百名員工正在從事Athena項(xiàng)目,微軟已在該項(xiàng)目上投入了約20億美元。
但這并不預(yù)示著微軟和英偉達(dá)的分裂。微軟打算與英偉達(dá)保持密切合作,該公司的芯片是訓(xùn)練和運(yùn)行AI系統(tǒng)的主力軍。微軟還試圖獲得更多英偉達(dá)芯片,這進(jìn)一步凸顯了微軟和其他公司面臨的AI芯片的緊迫短缺。
4月中旬,據(jù)媒體援引兩位知情人士的話說(shuō),微軟早在2019年就開(kāi)始開(kāi)發(fā)內(nèi)部代號(hào)為Athena的AI芯片。其中一位知情人士稱,一些微軟和OpenAI的員工已經(jīng)開(kāi)始測(cè)試并使用這些芯片。微軟希望該芯片的性能優(yōu)于目前從其他供應(yīng)商處購(gòu)買(mǎi)的芯片,從而節(jié)省其在昂貴的AI業(yè)務(wù)上的時(shí)間和成本。
如此看來(lái),Meta想要趕上英偉達(dá),甚至趕上其他硅谷同行的步伐,還有很長(zhǎng)的路要走。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: