人工智能里程碑式應(yīng)用,ChatGPT到底是什么?
AI繪畫的熱潮還沒散去,AI問答最近又迅速火了。
近期OpenAI發(fā)布了全新的聊天機(jī)器人模型ChatGPT,沒想到一經(jīng)上線,就因其高質(zhì)量的回答、高效獲取信息的方式、以及上癮式的交互體驗(yàn)而迅速出圈。
(資料圖片)
不少體驗(yàn)過的人都驚呼,ChatGPT可能一舉消滅記者、程序員和搜索引擎。
就連馬斯克也忍不住發(fā)推表示,ChatGPT厲害得嚇人,我們距離危險(xiǎn)而強(qiáng)大的AI不遠(yuǎn)了。最近這個(gè)周末因沒有跟蹤C(jī)hatGPT新聞的“紐約時(shí)報(bào)”,甚至直接遭到了的馬斯克發(fā)推“奚落”。
圖:TED負(fù)責(zé)人Chris對(duì)紐約時(shí)報(bào)沒有報(bào)道ChatGPT表示震驚,馬斯克也在下面奚落紐約時(shí)報(bào)應(yīng)該改名叫“社會(huì)正義時(shí)報(bào)”
用戶數(shù)據(jù)上,上線還不到一周時(shí)間,12月5日OpenAI CEO就在推特上宣布,ChatGPT已經(jīng)達(dá)到了百萬用戶。
什么是ChatGPT?
ChatGPT是OpenAI發(fā)布的聊天機(jī)器人模型,它的交互界面簡(jiǎn)潔,只有一個(gè)輸入框,AI將根據(jù)輸入內(nèi)容進(jìn)行回復(fù),并允許在一個(gè)語境下持續(xù)聊天。
自從發(fā)布以來,ChatGPT可謂出盡風(fēng)頭,無論是讓它寫首押韻的詩、檢查代碼的bug、回答科學(xué)問題、對(duì)推特未來的發(fā)展提出建議……通通不在話下,它回復(fù)的內(nèi)容每次都是隨機(jī)的,但總體保持著一定的專業(yè)性和信息量,具備很強(qiáng)的參考意義。
比如,知識(shí)講解。
比如,寫小說。
目前已經(jīng)有網(wǎng)友嘗試讓ChatGPT參加美國(guó)高考;寫小說;誘騙ChatGPT規(guī)劃如何毀滅世界;甚至讓ChatGPT扮演OpenAI,在系統(tǒng)內(nèi)構(gòu)建ChatGPT套娃。
為什么這么強(qiáng)大?
據(jù)浙商和國(guó)盛證券研報(bào),ChatGPT相比以往的主要提升點(diǎn)在于記憶能力,ChatGPT可以儲(chǔ)存對(duì)話信息,延續(xù)上下文,從而實(shí)現(xiàn)連續(xù)對(duì)話,這在對(duì)話場(chǎng)景中至關(guān)重要,極大地提升了對(duì)話交互模式下的用戶體驗(yàn)。
具體而言,此次新加入的訓(xùn)練方式被稱為“從人類反饋中強(qiáng)化學(xué)習(xí)”(ReinforcementLearning from Human Feedback,RLHF)。這一訓(xùn)練方法增加了人類對(duì)模型輸出結(jié)果的演示,并且對(duì)結(jié)果進(jìn)行了排序。具體操作上,人工智能訓(xùn)練者扮演對(duì)話的雙方,即用戶和人工智能助手,提供對(duì)話樣本。在人類扮演聊天機(jī)器人的時(shí)候,會(huì)讓模型生成一些建議輔助訓(xùn)練師撰寫回復(fù),訓(xùn)練師會(huì)對(duì)回復(fù)選項(xiàng)打分排名,將更好的結(jié)果輸回到模型中,通過以上獎(jiǎng)勵(lì)策略對(duì)模型進(jìn)行微調(diào)并持續(xù)迭代。
ChatGPT相比前輩模型還具有以下特征:
1)可承認(rèn)錯(cuò)誤,若用戶指出其錯(cuò)誤,模型會(huì)聽取意見并優(yōu)化答案。
2)可質(zhì)疑不正確的前提,減少虛假描述,如被詢問“哥倫布2015年來到美國(guó)的情景”的問題時(shí),機(jī)器人會(huì)說明哥倫布不屬于這一時(shí)代并調(diào)整輸出結(jié)果。
3)因ChatGPT采用了注重道德水平的訓(xùn)練方式,ChatGPT在減少有害和不真實(shí)的回復(fù)上改善顯著,如拒絕回答尋求霸凌他人方案的問題,指出其不正義性。
此外,ChatGPT的背后離不開大模型、大數(shù)據(jù)、大算力。
ChatGPT成為AIGC里程碑的背后,是算力發(fā)展和數(shù)字時(shí)代形成的大數(shù)據(jù)所共同支持的大模型訓(xùn)練,才能實(shí)現(xiàn)目前的效果。由OpenAI研發(fā)的ChatGPT是微調(diào)后的GPT-3.5系列模型,有著多達(dá)1750億個(gè)模型參數(shù),并在今年年初訓(xùn)練完成。模型訓(xùn)練的背后離不開大數(shù)據(jù)的支持,OpenAI主要使用的公共爬蟲數(shù)據(jù)集有著超過萬億單詞的人類語言數(shù)據(jù)集。在算力方面,GPT-3.5在Azure AI超算基礎(chǔ)設(shè)施(由V100GPU組成的高帶寬集群)上進(jìn)行訓(xùn)練,總算力消耗約3640PF-days(即每秒一千萬億次計(jì)算,運(yùn)行3640個(gè)整日)。
AIGC里程碑級(jí)應(yīng)用
之前文章里,我們給大家介紹了AIGC——人工智能自動(dòng)生成內(nèi)容,它當(dāng)前主要用在文字、繪畫、圖像、視頻、音頻、游戲以及虛擬人等。很明顯,AI問答ChatGPT都屬于AIGC的一個(gè)分支。
國(guó)盛證券表示,AIGC不僅改變創(chuàng)作,還將改變獲取信息的主要方式。而在此之上,ChatGPT所展示了作為生產(chǎn)力的存在,ChatGPT在尋找答案、解決問題的效率上已經(jīng)部分的超越了如今的搜索引擎,ChatGPT或許在未來會(huì)改變我們獲取信息、輸出內(nèi)容的方式,AIGC有望成為數(shù)字經(jīng)濟(jì)時(shí)代驅(qū)動(dòng)需求爆發(fā)的殺手級(jí)應(yīng)用。
市場(chǎng)空間方面,Gartner預(yù)計(jì)到2025年,生成式人工智能將占所有生成數(shù)據(jù)的10%。根據(jù)《Generative AI:A Creative New World》的分析,AIGC有潛力產(chǎn)生數(shù)萬億美元的經(jīng)濟(jì)價(jià)值。而國(guó)泰君安表示,未來五年或?qū)⒂?0%-30%的圖片內(nèi)容由AI參與生成,相應(yīng)或?qū)⒂?00億以上的市場(chǎng)規(guī)模。
相關(guān)行業(yè)
相比于此前的AI繪畫,ChatGPT更具有將AI能力與工作流程相結(jié)合的潛力。目前OpenAI等巨頭已著手自建計(jì)算集群來滿足AIGC的要求,這種集中式的訓(xùn)練對(duì)GPU、存儲(chǔ)、機(jī)房、供電等基礎(chǔ)設(shè)施均有巨大需求。國(guó)內(nèi)部分創(chuàng)業(yè)團(tuán)隊(duì)目前基于公有云訓(xùn)練,隨著需求的增加,也有望轉(zhuǎn)向自建集群。
國(guó)盛證券表示,今年以來,我國(guó)“東數(shù)西算”戰(zhàn)略自上而下快速推進(jìn),作為數(shù)字經(jīng)濟(jì)的基礎(chǔ),“算力即權(quán)力”,其重要性不言而喻,此前我們更多的互聯(lián)網(wǎng)應(yīng)用聚焦于“存”而非“算”,隨著AIGC技術(shù)在全球的興起,“東數(shù)西算”的算力需求將越來越顯著。
公司方面,浙商證券表示,從下游相關(guān)受益應(yīng)用來看,包括但不限于代碼機(jī)器人、小說衍生器、對(duì)話類搜索引擎、語伴、語音工作助手、對(duì)話虛擬人等。從上游增加需求來看,包括算力、數(shù)據(jù)標(biāo)注、自然語言處理(NLP)等。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。