每日簡(jiǎn)訊:AI大戰(zhàn)升級(jí)!Meta推出先進(jìn)大型語(yǔ)言模型 下一個(gè)ChatGPT不遠(yuǎn)了?
當(dāng)?shù)貢r(shí)間2月24日,Meta宣布將推出針對(duì)研究社區(qū)的“Meta人工智能大型語(yǔ)言模型”系統(tǒng)(Large Language Model Meta AI),簡(jiǎn)稱(chēng)“LLaMA”。
同ChatGPT、New Bing不同,LLaMA并不是一個(gè)任何人都可以與之對(duì)話(huà)的產(chǎn)品,也并未接入任何Meta應(yīng)用。更為確切地說(shuō),該產(chǎn)品將是一個(gè)開(kāi)源的“研究工具”。
【資料圖】
公司CEO扎克伯格在社交媒體上表示,LLaMA旨在幫助研究人員推進(jìn)研究工作,LLM(大型語(yǔ)言模型)在文本生成、問(wèn)題回答、書(shū)面材料總結(jié),以及自動(dòng)證明數(shù)學(xué)定理、預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)等更復(fù)雜的方面也有很大的發(fā)展前景。
1、開(kāi)源的“研究工具”
Meta表示,LLaMA可以在非商業(yè)許可下提供給政府、社區(qū)和學(xué)術(shù)界的研究人員和實(shí)體工作者,正在接受研究人員的申請(qǐng)。
此外,LLaMA將提供底層代碼供用戶(hù)使用,因此用戶(hù)可以自行調(diào)整模型,并將其用于與研究相關(guān)的用例。與之截然不同的是,谷歌旗下的DeepMind和OpenAI并不公開(kāi)訓(xùn)練代碼。
該公司還表示,LLaMA作為一個(gè)基礎(chǔ)模型被設(shè)計(jì)成多功能的,可以應(yīng)用于許多不同的用例,而不是為特定任務(wù)設(shè)計(jì)的微調(diào)模型。
2、比GPT3.5性能更強(qiáng)
根據(jù)Meta官網(wǎng)介紹,LLaMA包含4個(gè)基礎(chǔ)模型,參數(shù)分別為70億、130億、330億和650億。其中,LLaMA 65B 和 LLaMA 33B 在 1.4 萬(wàn)億個(gè) tokens 上訓(xùn)練,而最小的模型 LLaMA 7B 也經(jīng)過(guò)了 1 萬(wàn)億個(gè) tokens 的訓(xùn)練。
Meta表示,在大多數(shù)基準(zhǔn)測(cè)試中,參數(shù)小的多的LLaMA-13B的性能優(yōu)于GPT3.5的前身GPT3-175B,而LLaMA-65B更可與業(yè)內(nèi)最佳的Chinchilla-70B和PaLM-540B競(jìng)爭(zhēng)。值得一提的是,近期大火的ChatGPT便是由GPT3.5提供支持。
Meta 還提及,LLaMA-13B對(duì)算力的要求“低得多”,可以在單個(gè)數(shù)據(jù)中心級(jí)GPU(Nvidia Tesla V100)上運(yùn)行。
扎克伯格寫(xiě)道:
“Meta 致力于這種開(kāi)放的研究模式,我們將向 AI 研究社區(qū)提供我們的新模型。”
值得一提的是,去年5月,Meta 也曾推出過(guò)大型語(yǔ)言模型 OPT-175B。該項(xiàng)目同樣也是針對(duì)研究人員的,這構(gòu)成了其聊天機(jī)器人 blenterbot 新迭代的基礎(chǔ)。后來(lái),該公司還推出了一款名為“卡拉狄加”(Galactica) 的模型,但因經(jīng)常分享偏見(jiàn)和不準(zhǔn)確的信息而遭到下架。
據(jù)媒體報(bào)道,扎克伯格已將人工智能作為公司內(nèi)部的首要任務(wù),其本人也經(jīng)常在財(cái)報(bào)電話(huà)會(huì)議和采訪(fǎng)中談?wù)撍鼘?duì)改進(jìn) Meta 產(chǎn)品的重要性。媒體分析稱(chēng),雖然現(xiàn)在 LLaMA 沒(méi)有在 Meta 產(chǎn)品中使用,但未來(lái)不排除使用的可能。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶(hù)應(yīng)考慮本文中的任何意見(jiàn)、觀(guān)點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。