方正楊曉峰:AI大幅降低游戲制作成本,半年到一年內(nèi)將取得突破性進(jìn)展 | 見(jiàn)智研究
華爾街見(jiàn)聞·見(jiàn)智研究特邀到了方正證券AI互聯(lián)網(wǎng)首席分析師【楊曉峰】詳細(xì)拆解了AI大模型對(duì)游戲行業(yè)能夠帶來(lái)哪些降本增效的影響,并且初步預(yù)判該影響至少要二個(gè)季度才能反應(yīng)在財(cái)務(wù)上。
核心觀點(diǎn):
(相關(guān)資料圖)
1、AI現(xiàn)在有兩個(gè)大模型能夠極大程度提高游戲在美術(shù)制作流程上的效率,節(jié)省制作成本以及縮短時(shí)間。這兩個(gè)大模型分別是Stable Diffusion和NeRF模型,能夠分別在游戲美術(shù)制作過(guò)程中,對(duì)2D和3D場(chǎng)景和人物生成進(jìn)行優(yōu)化。
2、Stable Diffusion又稱(chēng)文生圖模型,能夠生成多視角的2D圖,進(jìn)一步為生成3D圖奠定基礎(chǔ),但是條件受限于需要性能等級(jí)高的顯卡,因此在普通消費(fèi)者群體中很難大范圍滲透。
3、NeRF模型主要是對(duì)2D-3D過(guò)程進(jìn)行了降本增效,當(dāng)前制作一個(gè)3D游戲角色的周期在30-45天左右,且需要的步驟較多,參與的人員眾多;使用NeRF可以快速建模,從而提高效率,節(jié)省成本。之前要10個(gè)工作日的工作現(xiàn)在只需要半天到一天就能完成,這相當(dāng)于節(jié)省了90%的時(shí)間。
4、但是NeRF模型尚未達(dá)到引爆點(diǎn),主要原因是該技術(shù)有一定壁壘,不過(guò)龍頭公司Luma AI,開(kāi)發(fā)了NeRF相關(guān)的APP,目前已上線APP Store,極大的降低了NeRF的使用門(mén)檻,預(yù)計(jì)在未來(lái)的半年到一年內(nèi)會(huì)取得突破性進(jìn)展。
5、總得來(lái)看,AI模型能夠?qū)τ螒蜓邪l(fā)設(shè)計(jì)過(guò)程中成本和時(shí)間進(jìn)行極大的優(yōu)化,據(jù)不完全統(tǒng)計(jì),在游戲的研發(fā)成本中美術(shù)成本一般占50%到80%。如果一個(gè)游戲公司的研發(fā)成本占70%,那么其中的40%基本上都可以大幅降低。
6、大公司和小公司的區(qū)別就是否只能降 2D 的錢(qián),還是也能降 3D 的錢(qián),如果 2D 和?3D 都能降低了,那么整個(gè)降本增效的幅度其實(shí)是60%-70%都不一定打得住,所以說(shuō)下降的幅度其實(shí)非常大的。
正文:
見(jiàn)智研究:為什么AI在游戲的應(yīng)用受到關(guān)注?
楊曉峰:
核心原因是游戲公司的商業(yè)模式相對(duì)比較優(yōu)秀,他們有一定的資源可以運(yùn)用AI模型。另一個(gè)原因是現(xiàn)在有很多 AI 模型已經(jīng)比較成熟,例如 AI 作畫(huà),這直接顛覆或者改變了游戲行業(yè),所以目前來(lái)看游戲行業(yè)是最快應(yīng)用 AI 的行業(yè)。當(dāng)然,動(dòng)畫(huà)行業(yè)也是類(lèi)似的,因?yàn)楝F(xiàn)在國(guó)內(nèi)和國(guó)外的技術(shù)水平基本持平,尤其在 AI 作畫(huà)方面。
最近我們注意到海外有一款游戲,其中有好幾個(gè)角色都是通過(guò)人工智能控制的。可以想象,這款游戲就像《西部世界》一樣,游戲中的許多角色都有自己的成長(zhǎng)軌跡和個(gè)性。在這個(gè)世界里,除了玩家自己以外,每個(gè)人都是真實(shí)的。這種體驗(yàn)的沉浸感非常高,這種應(yīng)用將會(huì)越來(lái)越普及。這種體驗(yàn)其實(shí)就是 NPC 的一個(gè)改進(jìn)。
我們還注意到另一個(gè)案例,當(dāng)我們用游戲制作美術(shù)的時(shí)候,花同樣的錢(qián),我們可以把整個(gè)美術(shù)場(chǎng)景做得越來(lái)越漂亮。過(guò)去,我們只能把在前面的視角做得比較漂亮,但現(xiàn)在花同樣的錢(qián)能把整個(gè)視覺(jué)都做得非常漂亮。我們已經(jīng)看到很多這樣的案例。
此外,我們最近還發(fā)現(xiàn)了一個(gè)名為?Inword 的平臺(tái)。這個(gè)產(chǎn)品事先已經(jīng)訓(xùn)練好了各種非常有性格的人物角色,可以直接將這個(gè)代碼集成到游戲中。這樣游戲中可能會(huì)出現(xiàn)像馬斯克這樣有性格的角色。其他人已經(jīng)把這些集成好了,只需要接入使用就可以了,游戲體驗(yàn)將會(huì)得到非??焖俚母纳?。
見(jiàn)智研究:哪些AI模型可以應(yīng)用于游戲領(lǐng)域?各自的特點(diǎn)是什么?
楊曉峰:
現(xiàn)在有兩種成熟的模型,一種是大文本模型,另一種是 2D 作圖模型,還有一種處于爆發(fā)期的2D轉(zhuǎn)3D NeRF模型。
第一類(lèi)模型是文本生成模型,例如 ChatGPT 和國(guó)內(nèi)的各種大模型,它們可以接受文本輸入并輸出對(duì)應(yīng)的文本,這種模型被廣泛使用。但在游戲中,通常直接使用其中的角色。
第二類(lèi)模型類(lèi)似于文生圖,它可以根據(jù)輸入的文本生成各種各樣的圖片。這種模型已經(jīng)非常成熟,大多數(shù)互聯(lián)網(wǎng)公司都在使用它來(lái)生成圖片。比較著名的有Stable?Diffusion和 Midjourney,其中Stable?Diffusion的使用較為廣泛,因?yàn)樗璧馁M(fèi)用較少;Midjourney面向消費(fèi)者,使用體驗(yàn)較好,且對(duì)電腦的要求較低。因此,后續(xù)制作 2D 圖像時(shí)可以使用它。
現(xiàn)在還有一個(gè)模型即將爆發(fā),可能會(huì)在未來(lái)半年到一年內(nèi)實(shí)現(xiàn),它是將 2D 轉(zhuǎn)化為 3D 的模型,名為神經(jīng)輻射場(chǎng)(NeRF)。只需拍幾張照片,就可以立即生成一個(gè)包括場(chǎng)景和人物的 3D 模型。想象一下以前制作游戲時(shí)需要的場(chǎng)景圖,如刺客信條中的巴黎場(chǎng)景?,F(xiàn)在只需花費(fèi)一些資金用無(wú)人機(jī)拍攝一些視頻,就能立即將 3D 模型建立起來(lái),成本降低非??臁_@是目前可能已經(jīng)使用的模型。
見(jiàn)智研究:生成3D模型的方式有哪些?分別有何優(yōu)劣?
楊曉峰:
過(guò)去生成 3D 的方法一般是通過(guò)畫(huà)平面圖進(jìn)行建模,例如對(duì)于一個(gè)角色,可能需要從不同視角畫(huà)多張圖來(lái)進(jìn)行建模。然后建模師會(huì)使用建模軟件一個(gè)個(gè)搭建,例如將立體的頭發(fā)貼到人臉上。這種方法需要花費(fèi)大量的時(shí)間,可能需要 2 到 3 周才能完成一個(gè)人物的建模。優(yōu)勢(shì)是每個(gè)物體都是比較精巧的立體結(jié)構(gòu),但劣勢(shì)在于時(shí)間成本很高,因此一般會(huì)交給外包公司去完成。
還有一種叫照相技術(shù)的方法,即通過(guò)拍攝物體的照片來(lái)建立模型,但是每張照片必須要重合50%才能建立一個(gè)模型,但這種技術(shù)對(duì)光影等細(xì)節(jié)處理比較困難,因此很少被使用。
最近開(kāi)始使用的 NeRF 模型已經(jīng)有了一篇公開(kāi)的論文,目前可供使用的軟件只有兩個(gè):Instant NGP和Luma。目前這兩個(gè)產(chǎn)品已經(jīng)能夠做到只需拍攝一個(gè)物體,即可立即生成3D模型。但它也有缺點(diǎn),即在制作產(chǎn)品時(shí)未考慮兼容性。
比如在英偉達(dá)的生態(tài)系統(tǒng)內(nèi)制作了一個(gè)非常漂亮的3D模型,但我們并不會(huì)考慮將其優(yōu)化并放到Unity或虛幻引擎中運(yùn)行,因?yàn)?D建模完成后必須將其放入游戲引擎中才能產(chǎn)生最佳效果。目前看來(lái),這個(gè)領(lǐng)域仍在發(fā)展中,但是Luma已將其插件放入虛幻引擎和游戲引擎中,它的進(jìn)展可能會(huì)更快。我們可以這樣理解:目前這個(gè)模型并不十分開(kāi)源,因此需要一些人工智能工程師才能更好地使用它。優(yōu)點(diǎn)就是確實(shí)可以降低很大的成本,但是需要掌握一些相對(duì)高水平的技能。
見(jiàn)智研究:NeRF是否會(huì)替代原來(lái)的 3D 模型成為未來(lái)主流選擇?
楊曉峰:
我認(rèn)為大概率會(huì)實(shí)現(xiàn),因?yàn)樾袠I(yè)目前的最新進(jìn)展是,就像我們剛才介紹的,2D照片可以生成3D模型?,F(xiàn)在,行業(yè)最新的動(dòng)態(tài)是可以直接進(jìn)行修改,比如說(shuō)我有一個(gè)自己的人物3D模型,我可以通過(guò)輸入文本,將我的人物頭像替換成馬斯克的頭像。這個(gè)技術(shù)已經(jīng)相當(dāng)成熟了。
最近,有一個(gè)海外的大一新生,對(duì)NeRF技術(shù)貢獻(xiàn)了非常迅速的進(jìn)展。將來(lái),你可以通過(guò)文本修改3D模型,例如,你可以讓它為你的模型加胡子或眼鏡。這個(gè)功能看起來(lái)非??犰?,也相當(dāng)強(qiáng)大,但如果你了解其原理,你就會(huì)發(fā)現(xiàn)其實(shí)并不是那么難,只是以前沒(méi)有人去優(yōu)化。
現(xiàn)在大多數(shù)人使用模型進(jìn)行嫁接,每個(gè)模型都有自己擅長(zhǎng)的領(lǐng)域。例如,文本模型擅長(zhǎng)處理文本輸入和輸出,Stable?Diffusion擅長(zhǎng)生成 2D 圖像,而 NeRF 模型則擅長(zhǎng)將 2D 圖像轉(zhuǎn)換為 3D 圖像。
未來(lái)的發(fā)展趨勢(shì)是將所有模型連接在一起,用戶只需簡(jiǎn)單地表達(dá)意圖,模型就能幫助實(shí)現(xiàn)任務(wù)。目前,NeRF 模型是最具潛力的模型之一,但其尚未達(dá)到引爆點(diǎn)。預(yù)計(jì)在未來(lái)的半年到一年內(nèi),NeRF 模型會(huì)大放異彩。
見(jiàn)智研究:Stable?Diffusion模型的特點(diǎn)是?
楊曉峰:
我們剛才提到了 NERF 可以將 2D 照片轉(zhuǎn)換成 3D 圖片,而Stable?Diffusion 本質(zhì)上是一個(gè)文生圖的工具。這個(gè)工具為什么會(huì)這么受歡迎?它目前的功能有多強(qiáng)大?
在去年的 11 月到 12 月之前,這個(gè)軟件其實(shí)并沒(méi)有什么熱度,但突然間變得火爆起來(lái)。原因是有人上傳了一個(gè)數(shù)據(jù)包,用戶只需要輸入想要的卡通或真人形象,就能迅速生成一個(gè)非常漂亮的圖像,吸引了大量用戶涌入。同時(shí)無(wú)數(shù)人也開(kāi)始為其提供各種訓(xùn)練數(shù)據(jù)包,進(jìn)一步豐富了其功能,現(xiàn)在不僅能畫(huà)出二次元卡通和真人形象,還能畫(huà)出 GTA5 的圖像。
這個(gè)軟件之所以能如此強(qiáng)大,因?yàn)槭袌?chǎng)上的無(wú)數(shù)用戶都在為其提供訓(xùn)練數(shù)據(jù)包,使得模型能夠生成各種精美圖像。但是需要注意的是,這個(gè)軟件需要較好的顯卡,最好是 3090 或者更高的4090,因此對(duì)于普通消費(fèi)者的用戶體驗(yàn)可能一般。為此,有人專(zhuān)門(mén)用Stable?Diffusion的建模開(kāi)發(fā)了網(wǎng)頁(yè)版,讓用戶不需要擁有好的電腦,就能在網(wǎng)頁(yè)上使用。不過(guò),這個(gè)服務(wù)需要付費(fèi),普通用戶每月需要支付幾十美元,企業(yè)用戶則需要支付更高的費(fèi)用。
因?yàn)殚_(kāi)源的原因,現(xiàn)在Stable?Diffusion 不僅能夠生成靜態(tài)圖像,甚至能夠生成視頻。這是因?yàn)樵诮衲?月份,有人修改了底層代碼,使得可以規(guī)定 AI 作圖的一些參數(shù),例如如果我畫(huà)了一匹馬,我可以再畫(huà)一張馬抬腿的圖像,然后將每個(gè)馬的腿都抬起來(lái),合成為一個(gè)視頻。這就是為什么現(xiàn)在國(guó)內(nèi)外很多公司突然推出了 AI 視頻的原因,因?yàn)樗鼈兌际腔?Stable?Diffusion這個(gè)原理,只是可能在這個(gè)渠道上進(jìn)行了一些優(yōu)化。
此外,Stable?Diffusion 現(xiàn)在更強(qiáng)大的一點(diǎn)是可以無(wú)中生有地建立 3D 模型,只要你能描述這個(gè)物體的各個(gè)角度,它就能夠生成多個(gè)角度的2D圖片,接著再利用多視角的2D圖片生成3D圖片。因此未來(lái)是可以無(wú)中生有的生成 3D 的。這意味著Stable?Diffusion 已經(jīng)成為了 AI 作圖領(lǐng)域最強(qiáng)大的工具之一,其他的工具都是在其基礎(chǔ)上進(jìn)行迭代。
見(jiàn)智研究:開(kāi)源的模型的優(yōu)勢(shì)和意義在哪?拓展插件對(duì)于模型起到什么作用?
楊曉峰:
模型一旦開(kāi)源,全球頂尖的人才就可以使用它并做微調(diào),他們可以貢獻(xiàn)各種各樣的素材包,使得模型使用效果更強(qiáng)大。因?yàn)镾table?Diffusion開(kāi)源,全球所有人都可以享受到這個(gè) AI 作圖的紅利,大家都可以在上面進(jìn)行修改或?qū)⑵浞诺阶约旱姆?wù)器上。開(kāi)源意味著這個(gè)軟件的每一條代碼都是公開(kāi)的,可以下載到本地,而別人也無(wú)法對(duì)你進(jìn)行操作。
當(dāng)然,行業(yè)可能需要一些相對(duì)厲害的人才,才能將這個(gè)產(chǎn)品推向更高層次,修改底層代碼,進(jìn)一步提升產(chǎn)品水平。因此,開(kāi)源對(duì)整個(gè)模型的進(jìn)步速度非???,可以想象,在 11 月和 12 月之前,大多數(shù)人的水平都比較低,但是因?yàn)殚_(kāi)源,無(wú)數(shù)人在 1 月和 2 月份上傳了數(shù)據(jù)包,3 月份修改了底層代碼,這個(gè)產(chǎn)品的進(jìn)展就非??炝?。可以這樣理解,開(kāi)源把所有人的水平都提高了一個(gè)非常高的狀態(tài)。
見(jiàn)智研究:模型開(kāi)源很大程度加速了應(yīng)用層面的落地?
楊曉峰:
Midjourney為什么會(huì)如此受歡迎呢?并不是因?yàn)樗屑夹g(shù)上的優(yōu)勢(shì),而是因?yàn)樗軌驖M足C端用戶的需求。比如,我們都知道Stable?Diffusion技術(shù)很好,產(chǎn)品性能也很好,但問(wèn)題在于并非每個(gè)人的電腦都有如此高的顯卡,同時(shí),數(shù)據(jù)包越多并不一定意味著更好的體驗(yàn),因?yàn)楹芏嗳烁胍恍└诱鎸?shí)的、大氣的效果,對(duì)吧?因此,很多產(chǎn)品都是在這個(gè)基礎(chǔ)上針對(duì)C端用戶的體驗(yàn)進(jìn)行了優(yōu)化。背后的技術(shù)可能需要使用Stable?Diffusion等原創(chuàng)技術(shù),或者出于成本考慮使用其他技術(shù),但對(duì)于普通的C端用戶,使用Midjourney基本上就足夠了。
見(jiàn)智研究:AI是如何對(duì)游戲進(jìn)行降本增效的?
楊曉峰:
以一個(gè)游戲公司為例,該公司的研發(fā)成本中,美術(shù)成本一般占50%到80%。因?yàn)橛行┯螒虻挠脩魯?shù)量非常多,不能出現(xiàn)卡頓等問(wèn)題,因此游戲的程序成本非常高,那么美術(shù)成本占據(jù)了研發(fā)成本的 50%。但是有些游戲只是卡牌游戲,只需要將卡片畫(huà)好,它就能自己動(dòng)了,這種游戲的美術(shù)成本占據(jù)了80%??梢韵胂笠幌逻@種情況下的成本。
而作為游戲美術(shù),首先,我需要設(shè)計(jì)游戲的UI界面,如果我手頭有10個(gè)人,其中一個(gè)人會(huì)負(fù)責(zé)繪制游戲橫屏的UI界面,比如登錄界面。剩下的三個(gè)人會(huì)設(shè)計(jì)人物模型,做2D的人物設(shè)計(jì),比如繪制多個(gè)視角下的角色,通常需要兩周的時(shí)間才能完成一個(gè)角色的繪制。
這四個(gè)人以前需要兩周才能完成的工作,現(xiàn)在只需要半天就能完成了。這意味著我們可以節(jié)省很多時(shí)間和成本。之前需要10個(gè)工作日的工作現(xiàn)在只需要半天到一天就能完成,這相當(dāng)于節(jié)省了90%的時(shí)間。
如果我們只考慮2D方面,那就是2D的人物和平面界面。其余的六層都是外包給其他人做建模的。比如說(shuō),我拿到了一個(gè)2D的畫(huà)面,我可以找一個(gè)建模師幫我把它建成一個(gè)3D的物體或人物,這個(gè)錢(qián)一般都是給外面的人。這一部分成本是可以砍掉的。
但NeRF不是開(kāi)源的,很多公司沒(méi)有這么優(yōu)秀的AI人才去使用它,所以這方面的進(jìn)展還不是很大。如果一個(gè)游戲公司的研發(fā)成本占70%,那么其中的40%基本上都可以大幅降低。
所以我覺(jué)得說(shuō),大公司和小公司的區(qū)別就是你是否只能降 2D 的錢(qián),還是說(shuō)你也能降 3D 的錢(qián),如果你 2D 加 3D 都能降低了,那么我覺(jué)得整個(gè)降本增效的幅度其實(shí)是60%-70%都不一定打得住,所以說(shuō)下降的幅度其實(shí)非常大的。
互動(dòng)環(huán)節(jié):
見(jiàn)智研究:游戲降本增效的成果多久能夠反映在財(cái)務(wù)報(bào)表上?
楊曉峰:
這個(gè)主要看的是一個(gè)自上而下的邏輯,因?yàn)?2D 作畫(huà)這個(gè)工具在今年一、二月份才開(kāi)始反映,在公司內(nèi)推行基本上要到4月以后,可能在二季度甚至三季度會(huì)逐步顯現(xiàn)。
而從模型上來(lái)看,生成多個(gè)視角圖的功能都是在 3 月份才開(kāi)始的,二季度慢慢地就開(kāi)始熟練起來(lái),三季度可能慢慢就顯現(xiàn)出來(lái)了成品效果。
見(jiàn)智研究:對(duì)擁有 IP 較多的公司會(huì)有什么影響?
楊曉峰:
IP的價(jià)值被認(rèn)為很高,因?yàn)樗梢猿掷m(xù)產(chǎn)生產(chǎn)品。通過(guò)提高生產(chǎn)能力,像迪斯尼動(dòng)畫(huà)一樣,供應(yīng)量可以大幅增加,但需求可能無(wú)法跟上。人工智能可以將生產(chǎn)能力增加至5倍,但市場(chǎng)是否能夠承受這么多還不確定,可能需要打折扣。擁有強(qiáng)大的IP可以增加產(chǎn)品的吸引力,因?yàn)殡S著產(chǎn)品數(shù)量的增加,創(chuàng)造新IP變得越來(lái)越困難。
見(jiàn)智研究:對(duì)于不同類(lèi)型的游戲公司降本增效的方式會(huì)有哪些側(cè)重?
楊曉峰:
我們首先看的就是對(duì)于頭部的公司而言,它降本增效特別明顯,就是2D、 3D 同時(shí)降,因?yàn)樗麄冋械氖且恍╉敿?jí)的 AI 工程師,所以2D、 3D 都能降。他們可能能夠跟海外的 3A 大廠進(jìn)行競(jìng)爭(zhēng)了,因?yàn)?3A 大廠過(guò)去構(gòu)筑的那種美術(shù)壁壘就相對(duì)于漏了非常多,那么這是頭部的公司,那么對(duì)于中腰部的公司而言,就相對(duì)而言說(shuō),它可以通過(guò)使用一定的技術(shù)把自己的成本降下去。
見(jiàn)智研究:接下來(lái)您比較看好的是哪些的賽道?
楊曉峰:
AI作畫(huà)是當(dāng)前比較成熟的技術(shù)之一,其中動(dòng)畫(huà)和游戲是最有可能最快落地應(yīng)用的領(lǐng)域。由于之前美術(shù)人才緊缺,這些行業(yè)在使用AI作畫(huà)后將大幅提高產(chǎn)能。此外,隨著時(shí)間的推移,使用AI作畫(huà)的成本也會(huì)顯著降低。因此,這兩個(gè)領(lǐng)域是值得關(guān)注的賽道,不僅能降低成本,還能快速提高產(chǎn)能。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: