環(huán)球簡訊:叫板ChatGPT!AI作畫鼻祖Stability AI也推出大型語言模型
或許每一次歷史潮流的開場(chǎng),總是這么熙熙攘攘,年初被ChatGPT引爆的AI大型語言模型(LLM),又迎來一位重磅入局者——Stability AI。
【資料圖】
4月19日,推出火爆AI繪畫賽道Stable Diffusion的開源模型的公司Stability AI,宣布“加入戰(zhàn)局,叫板ChatGPT”,推出開源大語言模型StableLM。
在Stability AI公告大語言模型的網(wǎng)頁上,一只體現(xiàn)了Stable Diffusion XL作畫特點(diǎn)的綠鸚鵡先于語言大模型的介紹出現(xiàn)了,大語言模型的"Stable Diffusion”時(shí)刻或許就這樣不期而至。
對(duì)于大語言模型StableLM,網(wǎng)站介紹道:
目前StableLM的Alpha版本中擁有30億和70億參數(shù)。
已經(jīng)可以從GitHub等開源平臺(tái)上下載:https://github.com/stability-AI/stableLM/
Stability AI后續(xù)還將推出150億至650億參數(shù)的版本。
與Stable Diffusion類似,開發(fā)者可以在遵守協(xié)議的情況下,將這個(gè)模型用于商業(yè)或研究活動(dòng)。
抨擊OpenAI不夠“open”的Stability AI,能穩(wěn)定發(fā)揮,推出超越ChatGPT的大語言模型嗎?
大語言模型的“安卓時(shí)刻”
Stability AI成立于 2019 年,是生成式AI領(lǐng)域最知名的公司之一。
在ChatGPT“占領(lǐng)”的大語言模型市場(chǎng)上,不少人期待著類似Stable Diffusion的開源模型能盡快出現(xiàn)。
大語言模型的"Stable Diffusion”時(shí)刻可能在十幾個(gè)小時(shí)前到來了。
AI軍備競賽的開啟可以追溯到去年7月,在Open AI的繪畫模型DALL- E2之后,Stability AI發(fā)布的模型圖像生成模型 Stable Diffusion,因其源代碼開源,且對(duì)公眾開放使用,在當(dāng)時(shí)吸引了更多的注意力(使用 DALL-E2 需要申請(qǐng),通過率很低)。
Stability AI把StableLM的發(fā)布比作了Stable Diffusion,這讓AI可以繼續(xù)服務(wù)所有人:
2022年,Stability AI推動(dòng)了Stable Diffusion的公開發(fā)布,這是一款革命性的圖像模型,代表了透明、開放、可擴(kuò)展的AI。
這次我們發(fā)布開源StableLM模型,想繼續(xù)讓所有人都能使用AI。
我們的StableLM模型可以生成文本和代碼,并將支持一系列下游應(yīng)用。
正如Stability AI的CEO Emad Mostaque所說,他們最新發(fā)布的LLM代表著Stability AI的初心“開源”:
現(xiàn)在每個(gè)人都可以在Hugging Face上測(cè)試驅(qū)動(dòng)這個(gè)7B版本的聊天機(jī)器人。
Emad Mostaque認(rèn)為,LLM不應(yīng)在大公司內(nèi)部進(jìn)行訓(xùn)練,社區(qū)系統(tǒng)的開放性也至關(guān)重要,需要更多監(jiān)督,巨頭控制流量算法的游戲規(guī)則——是對(duì)人們的操縱。
因此,Stability AI在今年年初與Hugging Face等幾個(gè)初創(chuàng)公司一起資助了研究中心Eleuther AI,而StableLM便建立在Eleuther AI的開源模型上:
StableLM建立在我們與非營利性研究中心EleutherAI一起開源的早期語言模型基礎(chǔ)上,這些語言模型包括GPT-J、GPT-NeoX和Pythia等等。
此次大模型也是在The Pile開源的數(shù)據(jù)集上進(jìn)行的訓(xùn)練,該數(shù)據(jù)集結(jié)合了PubMed、StackExchange和維基百科等網(wǎng)站的的文本樣本,其規(guī)模是The Pile的三倍,包含1.5萬億個(gè)內(nèi)容標(biāo)記。
Stability AI表示,正式因?yàn)檫@個(gè)豐富的數(shù)據(jù)集,盡管參數(shù)規(guī)模和GPT-3沒有可比性,但StableLM在交流和編程方面都展現(xiàn)了“驚人的高性能”(surprisingly high performance ):
盡管StableLM參數(shù)規(guī)模只有30億至70億(相比之下,GPT-3有1750億參數(shù)),但性能非常好,下面是例子:
在這個(gè)例子里,StableLM回到了有關(guān)“對(duì)于從高中畢業(yè)的朋友你回說些什么?”以及“寫一封郵件”的請(qǐng)求。
在這個(gè)例子里要求該模型寫一個(gè)“計(jì)算生命意義的C語言程序”,但該模型表示無法完成此項(xiàng)任務(wù),但寫了一個(gè)計(jì)算生命長度的程序。
Mostaque在Twitter上表示,他相信StableLM及其訓(xùn)練數(shù)據(jù)會(huì)隨著時(shí)間而變得更好,沒有人知道這個(gè)模型可以被優(yōu)化到什么程度:
我知道現(xiàn)在還有很長的路要走,這只是一個(gè)開始。我認(rèn)為我們可以在接下來的3-6個(gè)月內(nèi)讓該模型變得和Stable Diffusion一樣有用,而在接下來的幾年里,發(fā)展將是驚人的。
OpenAI不夠Open,Stability AI夠穩(wěn)嗎
前不久,馬斯克批評(píng)Open AI背離了開源、非盈利的初衷,這是Open AI一直以來面臨的爭議,也是Stability AI“暗戳戳”的諷刺OpenAI的要點(diǎn)。
盡管OpenAI不夠開放,但GPT-4無疑是當(dāng)下最好用的大語言模型。而夠開放的Stability AI,其語言模型StableLM夠穩(wěn)嗎。
要知道,目前StableLM的Alpha版本擁有30億和70億參數(shù),而GPT-3.5模型的參數(shù)量為2000億。
有網(wǎng)友稱,Stability AI并沒有在公告上說明StableLM當(dāng)前的局限性。
該模型是否存在與其他模型一樣傾向于編造事實(shí)?是否會(huì)經(jīng)常答非所問?
媒體分析認(rèn)為,該模型基于The Pile訓(xùn)練,而The Pile數(shù)據(jù)集內(nèi)存在大量不雅用語,因此對(duì)話過程可能會(huì)讓用戶不適。
還有網(wǎng)友表示,他嘗試在Hugging Face上測(cè)試這些模型,但每次都遇到“滿負(fù)荷”的問題,無法成功在前端上運(yùn)行,這很可能與模型的大小及受歡迎的程度有關(guān)。
“大語言模型是否應(yīng)該開源”也成了近期爭論的焦點(diǎn)。有研究人員認(rèn)為,類似StableLM等開源模型的發(fā)布,很可能被用于,發(fā)送釣魚信息或協(xié)助惡意軟件攻擊等不良目的。
但Stability AI認(rèn)為,開源模型的出現(xiàn)可以協(xié)助研究人員識(shí)別潛在風(fēng)險(xiǎn),并制定一些列保護(hù)措施。
Stability AI的營收困境
更嚴(yán)重的問題是,Stability AI或許正面臨營收困境。
最近有媒體報(bào)道稱,Stability AI正在以驚人的速度燒錢,但卻沒有明確的盈利途徑。而且在競爭激烈的AI賽道,還面臨著一眾初創(chuàng)企業(yè)和科技巨頭的“圍剿”。
Meta此前發(fā)布開源大語言模型LLaMA,使得越來越多的公司有望在開源模型基礎(chǔ)上定制自己的大模型,人工智能也正在迎來“安卓時(shí)刻”。
Stability AI現(xiàn)在正在尋找新的高管人才,希望他能在惡劣的條件下給公司帶來收入,以解決當(dāng)前“瘋狂燒錢、營收可憐”的窘?jīng)r。
去年底,Stability AI 宣布融資1.01億美元,并稱Stable Diffusion已成為當(dāng)前可用性最高的開源模型。
據(jù)《福布斯》的數(shù)據(jù),每天約有有1000萬人使用 Stable Diffusion——比使用 OpenAI 的 DALL-E 2 的人數(shù)還要多。同時(shí),Stability AI還提供面向消費(fèi)者的產(chǎn)品——DreamStudio, 目前擁有來100萬名注冊(cè)用戶。
但訓(xùn)練模型所需的計(jì)算資源和成本讓Stability AI不得不探索新商業(yè)模式。Mostaque 曾在 Twitter 上回復(fù)一位用戶時(shí)說:
“實(shí)際上,我們模型使用了256個(gè)A100顯卡,總共15萬小時(shí),所以按市場(chǎng)價(jià)格計(jì)算為60 萬美元。”
Stability AI去年融到的1億美元至今已經(jīng)“燒”掉大半。
還有一個(gè)不可忽略的事實(shí)是,其競爭對(duì)手Midjourney已經(jīng)成為互聯(lián)網(wǎng)上事實(shí)上的圖像生成模型的領(lǐng)跑者,甚至一定程度上擊敗了OpenAI的DALL-E。
當(dāng)前,有消息稱,Stability AI正在謀求新一輪融資,希望能將公司的估值漲至40億美元。Stability AI能否扭轉(zhuǎn)局面,籌集到足夠的資金來維持局面,還有待觀察。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: