國(guó)內(nèi)AI大模型“安卓時(shí)刻”到來(lái)！阿里云通義千問(wèn)免費(fèi)、開(kāi)源、可商用

大模型激戰(zhàn)之際，繼海外的Meta之后，阿里巴巴成為又一家推動(dòng)人工智能（AI）大模型“安卓時(shí)刻”潮流的科技巨頭。

8月3日周四，阿里云將70億參數(shù)的通義千問(wèn)模型開(kāi)源，包括通用模型Qwen-7B和對(duì)話(huà)模型Qwen-7B-Chat。這兩款模型均已上線(xiàn)國(guó)內(nèi)首個(gè)“模型即服務(wù)”開(kāi)放平臺(tái)魔搭社區(qū)，開(kāi)源、免費(fèi)、可商用。

(資料圖)

開(kāi)源代碼支持對(duì)Qwen-7B和Qwen-7B-Chat的量化，支持用戶(hù)在消費(fèi)級(jí)顯卡上部署和運(yùn)行模型。用戶(hù)既可從魔搭社區(qū)直接下載模型，也可通過(guò)阿里云靈積平臺(tái)訪(fǎng)問(wèn)和調(diào)用Qwen-7B和Qwen-7B-Chat，阿里云為用戶(hù)提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的服務(wù)。

魔塔社區(qū)已有發(fā)帖，專(zhuān)門(mén)介紹通義千問(wèn)上述模型的安裝、創(chuàng)空間體驗(yàn)、模型推理、模型訓(xùn)練最佳實(shí)踐，并附有模型鏈接及下載情況截圖。

公開(kāi)資料顯示，Qwen-7B使用去重及過(guò)濾后超過(guò)2.2萬(wàn)億tokens的數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練，是支持中、英等多種語(yǔ)言的基座模型，上下文窗口長(zhǎng)度達(dá)到8k。它包含高質(zhì)量中、英、多語(yǔ)言、代碼、數(shù)學(xué)等數(shù)據(jù)，囊括全網(wǎng)文本、百科、書(shū)籍、代碼、數(shù)學(xué)及各個(gè)領(lǐng)域垂類(lèi)。

評(píng)測(cè)英文綜合能力的基準(zhǔn)評(píng)測(cè)之一MMLU的評(píng)測(cè)結(jié)果顯示，在英文評(píng)測(cè)方面，Qwen-7B的效果超過(guò)了目前國(guó)內(nèi)外其他同類(lèi)開(kāi)源預(yù)訓(xùn)練模型，對(duì)比更大規(guī)模版本的模型也具有較強(qiáng)競(jìng)爭(zhēng)力。中文評(píng)測(cè)方面，在C-Eval驗(yàn)證集上，Qwen-7B在同等規(guī)模現(xiàn)有模型中取得了最高分?jǐn)?shù)，甚至相比更大規(guī)模模型也具有較強(qiáng)競(jìng)爭(zhēng)力。

以下為Qwen-7B的MMLU 5-shot準(zhǔn)確率結(jié)果對(duì)比。

在Qwen-7B的基礎(chǔ)上，阿里云使用對(duì)齊機(jī)制打造了基于基座模型的AI助手Qwen-7B-Chat。它是基于Transformer的中英文對(duì)話(huà)大語(yǔ)言模型，已實(shí)現(xiàn)與人類(lèi)認(rèn)知對(duì)齊。預(yù)訓(xùn)練數(shù)據(jù)類(lèi)型多樣，覆蓋廣泛，包括大量網(wǎng)絡(luò)文本、專(zhuān)業(yè)書(shū)籍、代碼等。

無(wú)論是在C-Eval驗(yàn)證集上，還是在MMLU評(píng)測(cè)集上，Qwen-7B-Chat模型的zero-shot準(zhǔn)確率均在同類(lèi)對(duì)齊模型中表現(xiàn)較優(yōu)。

以下為C-Eval測(cè)試集上的zero-shot準(zhǔn)確率結(jié)果對(duì)比。

通義千問(wèn)的開(kāi)源后，阿里云成為國(guó)內(nèi)首個(gè)加入大模型開(kāi)源行列的大型科技企業(yè)。今年7月，微軟宣布，聯(lián)手Meta發(fā)布開(kāi)源AI模型的可商用版本Llama 2，提供OpenAI和谷歌模型的平替產(chǎn)品。也是在7月，智譜AI及清華KEG實(shí)驗(yàn)室公布，中國(guó)頂尖開(kāi)源大模型ChatGLM2-6B允許免費(fèi)商用。

華爾街見(jiàn)聞此前文章提及，開(kāi)源模型的好處包括用戶(hù)的接受率更高，然后輸入更多數(shù)據(jù)供人工智能處理。LLM擁有的數(shù)據(jù)越多，其功能就越強(qiáng)大。此外，開(kāi)源模型使研究人員和開(kāi)發(fā)人員能夠發(fā)現(xiàn)和解決漏洞，同時(shí)提高技術(shù)和安全性。

今年4月的2023阿里云峰會(huì)上，阿里巴巴宣布向企業(yè)開(kāi)放通義千問(wèn)，企業(yè)可以調(diào)用通義千問(wèn)的能力訓(xùn)練自己的大模型。

阿里云智能集團(tuán)首席技術(shù)官（CTO）周靖人當(dāng)時(shí)介紹，未來(lái)企業(yè)在阿里云上既可以調(diào)用通義千問(wèn)的全部能力，也可以結(jié)合企業(yè)自身的行業(yè)知識(shí)和應(yīng)用場(chǎng)景，訓(xùn)練自己的企業(yè)大模型。比如，每個(gè)企業(yè)都可以有自己的智能客服、智能導(dǎo)購(gòu)、智能語(yǔ)音助手、文案助手、AI設(shè)計(jì)師、自動(dòng)駕駛模型等。

阿里巴巴集團(tuán)CEO兼阿里云智能集團(tuán)CEO張勇當(dāng)時(shí)稱(chēng)，阿里巴巴所有產(chǎn)品未來(lái)都將接入通義千問(wèn)大模型。

張勇表示，面向 AI 時(shí)代，所有產(chǎn)品都值得用大模型重做一次，而基于這一信念，阿里云也希望幫助更多企業(yè)用上大模型，讓每家企業(yè)都能基于通義千問(wèn)，擁有具備自己行業(yè)能力的專(zhuān)屬大模型。

風(fēng)險(xiǎn)提示及免責(zé)條款市場(chǎng)有風(fēng)險(xiǎn)，投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議，也未考慮到個(gè)別用戶(hù)特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶(hù)應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資，責(zé)任自負(fù)。

關(guān)鍵詞：