國(guó)內(nèi)AI大模型“安卓時(shí)刻”到來(lái)!阿里云通義千問(wèn)免費(fèi)、開(kāi)源、可商用
大模型激戰(zhàn)之際,繼海外的Meta之后,阿里巴巴成為又一家推動(dòng)人工智能(AI)大模型“安卓時(shí)刻”潮流的科技巨頭。
8月3日周四,阿里云將70億參數(shù)的通義千問(wèn)模型開(kāi)源,包括通用模型Qwen-7B和對(duì)話(huà)模型Qwen-7B-Chat。這兩款模型均已上線(xiàn)國(guó)內(nèi)首個(gè)“模型即服務(wù)”開(kāi)放平臺(tái)魔搭社區(qū),開(kāi)源、免費(fèi)、可商用。
(資料圖)
開(kāi)源代碼支持對(duì)Qwen-7B和Qwen-7B-Chat的量化,支持用戶(hù)在消費(fèi)級(jí)顯卡上部署和運(yùn)行模型。用戶(hù)既可從魔搭社區(qū)直接下載模型,也可通過(guò)阿里云靈積平臺(tái)訪(fǎng)問(wèn)和調(diào)用Qwen-7B和Qwen-7B-Chat,阿里云為用戶(hù)提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的服務(wù)。
魔塔社區(qū)已有發(fā)帖,專(zhuān)門(mén)介紹通義千問(wèn)上述模型的安裝、創(chuàng)空間體驗(yàn)、模型推理、模型訓(xùn)練最佳實(shí)踐,并附有模型鏈接及下載情況截圖。
公開(kāi)資料顯示,Qwen-7B使用去重及過(guò)濾后超過(guò)2.2萬(wàn)億tokens的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,是支持中、英等多種語(yǔ)言的基座模型,上下文窗口長(zhǎng)度達(dá)到8k。它包含高質(zhì)量中、英、多語(yǔ)言、代碼、數(shù)學(xué)等數(shù)據(jù),囊括全網(wǎng)文本、百科、書(shū)籍、代碼、數(shù)學(xué)及各個(gè)領(lǐng)域垂類(lèi)。
評(píng)測(cè)英文綜合能力的基準(zhǔn)評(píng)測(cè)之一MMLU的評(píng)測(cè)結(jié)果顯示,在英文評(píng)測(cè)方面,Qwen-7B的效果超過(guò)了目前國(guó)內(nèi)外其他同類(lèi)開(kāi)源預(yù)訓(xùn)練模型,對(duì)比更大規(guī)模版本的模型也具有較強(qiáng)競(jìng)爭(zhēng)力。中文評(píng)測(cè)方面,在C-Eval驗(yàn)證集上,Qwen-7B在同等規(guī)模現(xiàn)有模型中取得了最高分?jǐn)?shù),甚至相比更大規(guī)模模型也具有較強(qiáng)競(jìng)爭(zhēng)力。
以下為Qwen-7B的MMLU 5-shot準(zhǔn)確率結(jié)果對(duì)比。
在Qwen-7B的基礎(chǔ)上,阿里云使用對(duì)齊機(jī)制打造了基于基座模型的AI助手Qwen-7B-Chat。它是基于Transformer的中英文對(duì)話(huà)大語(yǔ)言模型,已實(shí)現(xiàn)與人類(lèi)認(rèn)知對(duì)齊。預(yù)訓(xùn)練數(shù)據(jù)類(lèi)型多樣,覆蓋廣泛,包括大量網(wǎng)絡(luò)文本、專(zhuān)業(yè)書(shū)籍、代碼等。
無(wú)論是在C-Eval驗(yàn)證集上,還是在MMLU評(píng)測(cè)集上,Qwen-7B-Chat模型的zero-shot準(zhǔn)確率均在同類(lèi)對(duì)齊模型中表現(xiàn)較優(yōu)。
以下為C-Eval測(cè)試集上的zero-shot準(zhǔn)確率結(jié)果對(duì)比。
通義千問(wèn)的開(kāi)源后,阿里云成為國(guó)內(nèi)首個(gè)加入大模型開(kāi)源行列的大型科技企業(yè)。今年7月,微軟宣布,聯(lián)手Meta發(fā)布開(kāi)源AI模型的可商用版本Llama 2,提供OpenAI和谷歌模型的平替產(chǎn)品。也是在7月,智譜AI及清華KEG實(shí)驗(yàn)室公布,中國(guó)頂尖開(kāi)源大模型ChatGLM2-6B允許免費(fèi)商用。
華爾街見(jiàn)聞此前文章提及,開(kāi)源模型的好處包括用戶(hù)的接受率更高,然后輸入更多數(shù)據(jù)供人工智能處理。LLM擁有的數(shù)據(jù)越多,其功能就越強(qiáng)大。此外,開(kāi)源模型使研究人員和開(kāi)發(fā)人員能夠發(fā)現(xiàn)和解決漏洞,同時(shí)提高技術(shù)和安全性。
今年4月的2023阿里云峰會(huì)上,阿里巴巴宣布向企業(yè)開(kāi)放通義千問(wèn),企業(yè)可以調(diào)用通義千問(wèn)的能力訓(xùn)練自己的大模型。
阿里云智能集團(tuán)首席技術(shù)官(CTO)周靖人當(dāng)時(shí)介紹,未來(lái)企業(yè)在阿里云上既可以調(diào)用通義千問(wèn)的全部能力,也可以結(jié)合企業(yè)自身的行業(yè)知識(shí)和應(yīng)用場(chǎng)景,訓(xùn)練自己的企業(yè)大模型。比如,每個(gè)企業(yè)都可以有自己的智能客服、智能導(dǎo)購(gòu)、智能語(yǔ)音助手、文案助手、AI設(shè)計(jì)師、自動(dòng)駕駛模型等。
阿里巴巴集團(tuán)CEO兼阿里云智能集團(tuán)CEO張勇當(dāng)時(shí)稱(chēng),阿里巴巴所有產(chǎn)品未來(lái)都將接入通義千問(wèn)大模型。
張勇表示,面向 AI 時(shí)代,所有產(chǎn)品都值得用大模型重做一次,而基于這一信念,阿里云也希望幫助更多企業(yè)用上大模型,讓每家企業(yè)都能基于通義千問(wèn),擁有具備自己行業(yè)能力的專(zhuān)屬大模型。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶(hù)特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶(hù)應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: