世界熱門:ChatGPT 5天用戶破百萬,聊天機(jī)器人真的成精了 ?
OpenAI的新模型ChatGPT才誕生沒幾天,已經(jīng)成為廣大網(wǎng)友的「裝逼利器」。
“上周三才上線的 ChatGPT,短短幾天它的用戶已經(jīng)突破 100 萬大關(guān)!”O(jiān)penAI 的 CEO Sam Altman 表示。
(資料圖)
它的回答不說正確不正確,乍一看可是碉堡了。
再加上生成起來格外方便,一時(shí)間這些「看起來不錯(cuò)」的回答就如同潮水般涌向了那個(gè)帶著全世界代碼跑的傳奇問答網(wǎng)站,計(jì)算機(jī)學(xué)子真正的老師——Stack Overflow。
然而,為了判斷這些答案的對(duì)錯(cuò),就需要讓大量具有專業(yè)知識(shí)的人仔細(xì)考察才行。
被逼無奈之下,Stack Overflow不得不急發(fā)聲明:ChatGPT,禁了!
錯(cuò)誤多得離譜,應(yīng)封盡封
眼看著討論熱火朝天,作為全世界第二大程序員交友網(wǎng)站的Stack Overflow官方這邊也是態(tài)度鮮明:
不要想著用AI機(jī)器人混淆視聽,發(fā)回答就好好發(fā),禁止用ChatGPT直接生成垃圾答案,否則封號(hào)。
Stack Overflow在官方通告中表示:這是一個(gè)臨時(shí)性規(guī)定,目的是為了應(yīng)對(duì)目前論壇上ChatGPT生成內(nèi)容的泛濫之勢(shì)。
通告指出,做出這個(gè)規(guī)定的主要原因是,ChatGPT自動(dòng)生成的答案質(zhì)量太低,錯(cuò)誤太多,而且看上去還挺像那么回事,即使是完全不懂的人也能隨便生成答案。
作為一個(gè)以問答質(zhì)量為標(biāo)桿的社區(qū),這些低質(zhì)答案會(huì)給那些來此尋求幫助的人造成嚴(yán)重困擾和不便,對(duì)Stack Overflow本身而言也是有害的。
Stack Overflow表示,未來將繼續(xù)權(quán)衡圍繞 ChatGPT「和其他類似工具」的新政策,但決定日期以及最終限制的內(nèi)容尚不清楚。
總之,Stack Overflow這邊的態(tài)度很明確,總結(jié)起來就是:「玩歸玩,鬧歸鬧,別拿問答開玩笑」。
網(wǎng)友拍手叫好
而對(duì)于這個(gè)決定,底下的圍觀群眾有表示完全贊同的。
——干的漂亮!真希望這個(gè)決定不是臨時(shí)的,而且不僅局限于ChatGPT,應(yīng)該擴(kuò)大到所有AI生成的答案??緼I永遠(yuǎn)給不出高質(zhì)量的編程答案,再過100年都沒戲。
——這個(gè)禁令不應(yīng)該是個(gè)臨時(shí)措施。
使用ChatGPT可以通過瘋狂灌水,自動(dòng)生成答案來刷分,即使這些答案是否正確他們根本不知道,也不關(guān)心,這對(duì)Stack Overflow論壇生態(tài)的危害是顯而易見的。
不過,想要識(shí)別這類答案實(shí)際上并不容易,怎樣保證「應(yīng)封盡封」是個(gè)很大的問題。
很多專業(yè)人士能看出來這種「?jìng)未鸢浮估锏腻e(cuò)誤,但能做的也就是點(diǎn)個(gè)踩,不能保證這些內(nèi)容被清理。
禁止這樣的內(nèi)容是好事,不過審核的人能做什么呢?上面有帖子說,這些AI生成的答案可能看起來像高質(zhì)量答案,這意味著對(duì)于訓(xùn)練有素的人來說,可能會(huì)發(fā)現(xiàn)錯(cuò)誤而點(diǎn)個(gè)踩。
這些AI冒充的用戶的答案可能有一些贊,也有一些踩,因?yàn)檫@些回答看起來像高質(zhì)量答案。
我不知道如何判斷一個(gè)答案是不是ChatGPT生成的,而且現(xiàn)在自定義標(biāo)記需要幾個(gè)月的時(shí)間來解決,在及時(shí)處理前,這些用戶可能繼續(xù)損害Stack Overflow。
那么,ChatGPT到底泛濫到什么程度了呢?
有網(wǎng)友自己嘗試將提出的問題貼在ChatGPT的對(duì)話框中,和后面的一個(gè)「真人」給出的答案做了對(duì)比,看看到底生成的答案能不能用,結(jié)果發(fā)現(xiàn)這個(gè)「真人」明顯不對(duì)勁。
這是他自己用ChatGPT生成的回答:
這是所謂「真人用戶」給出的回答:
不難看出,兩個(gè)答案套路上如出一轍,用語口吻也非常相近,代碼示例上也是幾乎相同。
這分明也是ChatGPT生成的偽答案。目前這個(gè)「用戶」已經(jīng)被Stack Overflow封禁。
其實(shí)從ChatGPT的發(fā)布方OpenAI看來,這個(gè)AI工具的重要用途之一正是幫助程序員檢查代碼,而作為編碼輔助工具,在Stack Overflow上答答題,本來是ChatGPT的正當(dāng)用途之一。
沒想到剛出了不到一星期,就被無情封禁。也不知道是怪自己「學(xué)藝不精」,給出的答案沒有幫助,還是怪網(wǎng)友太狡猾,最終不堪重負(fù)被玩壞了。
有媒體聯(lián)系了OpenAI,問其計(jì)劃如何處理這些自動(dòng)生成答案的準(zhǔn)確性問題,目前還沒有收到回復(fù)。
Stack Overflow還不能被取代
作為一名開發(fā)者,你肯定知道這個(gè)讓億萬公司的程序能夠跑起來,讓億萬計(jì)算機(jī)學(xué)子能夠拿到畢業(yè)證的Stack Overflow。
在這里,你可以找到實(shí)現(xiàn)某些功能的最佳實(shí)踐,或者找到那個(gè)只有在月圓之夜的凌晨4點(diǎn)才發(fā)生的晦澀難懂的錯(cuò)誤的解決方案。
不過,在2021年被Prosus以18億美元的價(jià)格收購之后,大家曾普遍在擔(dān)心是不是也要開啟付費(fèi)VIP模式。而那一天的到來大概會(huì)是程序員們的「末日」。
好在,到目前為止,Stack Overflow的用戶體驗(yàn)依然是極好的。
至于OpenAI的ChatGPT,它不僅可以回答任何領(lǐng)域的問題,而且每一次的答案都非常精確和詳細(xì)。
比如,當(dāng)你問到「How to iterate over an keys and values array in Javascript」時(shí),這就是答案:
錦上添花的是,ChatGPT還能通過一個(gè)支持性的例子和解釋,告訴你這個(gè)JavaScript中常見問題的最佳的解決方案:
那么問題來了,既然ChatGPT可以在輸入問題的幾秒鐘內(nèi)給出答案,并且還提供了可以直接復(fù)制的代碼,為何我們不系統(tǒng)性地去使用它呢?
因?yàn)椋珻hatGPT有三個(gè)「致命」的缺陷:
1. 輸入不能有錯(cuò)
在使用ChatGPT時(shí),必須要精確,哪怕是一個(gè)代詞(a/an)的改變,答案都會(huì)完全不同。
比如,之前的那個(gè)問題「How to iterate over an keys and values array in Javascript」,這次我們?nèi)サ粢粋€(gè)「an」,變成「How to iterate over keys and values array in Javascript」
現(xiàn)在ChatGPT給出的解決方案,就只對(duì)由統(tǒng)一的元素列表組成的簡(jiǎn)單數(shù)組有效了。
2. 解釋不人性化
比如接下來這個(gè)Stack Overflow上投票最多的問題:
「為什么對(duì)已排序數(shù)組的操作比對(duì)未排序數(shù)組的操作快?」
ChatGPT給出的答案,毫無疑問是正確的,但僅此而已。
因?yàn)?,如果你能理解這個(gè)答案的話,自然也不需要問這個(gè)問題。
而如果你需要問這個(gè)問題,也就意味著你不太能看懂ChatGPT給出的回答……
相比而言,Stack Overflow上的答主首先會(huì)用非技術(shù)性的術(shù)語提出了一般的背景,然后逐漸將主題拉回到最初和最后的問題上,以加深思考。
當(dāng)然,不是所有Stack OverFlow上的答案都是(也不需要)如此定性和詳細(xì)的。
但這個(gè)例子充分地說明了,人與AI大的區(qū)別是,后者無法確定對(duì)方的理解水平,從而調(diào)整回答。
簡(jiǎn)單來說就是,AI會(huì)以同樣的方式和術(shù)語來解釋「相對(duì)論」,不管你是物理系的教授,還是普通大學(xué)生,或者對(duì)此一竅不通的小白。
這對(duì)于AI來說,并不重要。
3. 社區(qū)的作用
不管你喜不喜歡,Stack OverFlow最大的優(yōu)勢(shì)是它的社區(qū)。這個(gè)平臺(tái)的創(chuàng)建和運(yùn)作方式,就是為了鼓勵(lì)和鼓勵(lì)最大多數(shù)人的貢獻(xiàn)。
而正是這種種類繁多的答案和意見,讓用戶可以通過考慮每個(gè)解決方案的優(yōu)點(diǎn)和限制,來確定自己的位置并進(jìn)行選擇。
此外,Stack OverFlow的另一個(gè)優(yōu)勢(shì)在于同行驗(yàn)證。一個(gè)被成千上萬的開發(fā)者證明和測(cè)試過的解決方案,可以為其正確性提供極大的保證。(當(dāng)然這并不意味著100%是正確的)
P.S. 用還是可以用的
毋庸置疑,Stack OverFlow永遠(yuǎn)不會(huì)被取代。它和GitHub,將永遠(yuǎn)是解決那些需要個(gè)性化解釋或者高難度棘手問題的好去處。
就像Copilot、Intellisense和高級(jí)IDE一樣,ChatGPT(即使它不只限于代碼)只是一個(gè)工具,在開發(fā)者日益豐富的工具調(diào)色板中。就像任何自學(xué)模型一樣,它將隨著時(shí)間的推移學(xué)習(xí)和自我糾正并改進(jìn)。
但是下一次,與其在Stack OverFlow上為相對(duì)簡(jiǎn)單的問題(如何在Flutter中觸發(fā)HookConsumerWidget的重建)等待幾天,不如直接向ChatGPT提問。
畢竟,你有很大概率能夠得到一個(gè)可以用于解決問題的起點(diǎn):
為什么ChatGPT會(huì)犯這么多低級(jí)錯(cuò)誤?
這幾天,全體網(wǎng)友都把ChatGPT玩瘋了。很多人都意識(shí)到,這個(gè)新AI確實(shí)是一個(gè)「裝逼利器」——不費(fèi)吹灰之力,就能給你生成一個(gè)牛逼閃閃的答案。
而撥開這層華麗的外衣,仔細(xì)看進(jìn)去,就會(huì)發(fā)現(xiàn)它的回答經(jīng)常錯(cuò)漏百出。
比如:我在2022年是37歲,那么在1985年的時(shí)候,我是幾歲?
ChatGPT:1985-2022=-37,由于年齡不能是負(fù)的,所以此題無解。
額,有沒有一種可能,出題人出生于1985年呢?
再比如這位網(wǎng)友問ChatGPT,霍布斯主張三權(quán)分立嗎?
ChatGPT自信滿滿地給出了答案,還不忘引經(jīng)據(jù)典。
但是,它的回答是錯(cuò)的。
霍布斯是專制主義的支持者,在他看來,替代無政府狀態(tài)的唯一可行方案,就是將權(quán)力賦予君主。
權(quán)力在行政部門和立法部門之間分配、制衡的觀點(diǎn),是跟霍布斯同時(shí)代的哲學(xué)家約翰洛克提出的。
那么,為什么ChatGPT會(huì)犯這樣的低級(jí)錯(cuò)誤?
很明顯,這是因?yàn)樵谡握軐W(xué)中,霍布斯和洛克幾乎總是被一起提及,當(dāng)ChatGPT去網(wǎng)上找霍布斯的資料時(shí),自然就找到了洛克對(duì)三權(quán)分立的闡述,然后就錯(cuò)誤地把這個(gè)觀點(diǎn)扣在了霍布斯的頭上????。
從這個(gè)例子中,我們也可以看出支撐ChatGPT的GPT-3語言模型的局限——它只能抓取,但無法推理,也無法思考。
所以,這其實(shí)是一個(gè)概率的東西
最近,很多人都在討論:哪些工作會(huì)首先被AI所顛覆?
這是一個(gè)懸而未決的問題。但至少我們可以從老師布置的作業(yè)中,得到一絲啟示。
當(dāng)老師給學(xué)生們布置一篇政治哲學(xué)論文時(shí),學(xué)生的成果對(duì)這個(gè)世界而言,通常只是對(duì)一百萬次已經(jīng)寫過的東西的反省。
而有趣的是,AIGC的文本并不像一道數(shù)學(xué)題,它沒有唯一一條通往正確答案的路。
是的,AI的輸出,是概率性的:ChatGPT沒有任何標(biāo)記了對(duì)錯(cuò)的內(nèi)部記錄,它其實(shí)是一個(gè)統(tǒng)計(jì)模型,這個(gè)模型中,是在不同上下文中的語言組合。
而上下文的基礎(chǔ),就是GPT-3訓(xùn)練所用的整體數(shù)據(jù)集,來自ChatGPT的RLHF訓(xùn)練的額外上下文,prompt和之前的對(duì)話,以及很快就會(huì)有的反饋。
這些組合產(chǎn)生的結(jié)果,無疑令人興奮。
ChatGPT會(huì)運(yùn)行整個(gè)虛擬機(jī),會(huì)寫代碼。
當(dāng)然,ChatGPT并沒有運(yùn)行python,答案其實(shí)是從構(gòu)成GPT-3的互聯(lián)網(wǎng)數(shù)據(jù)語料庫中收集的概率結(jié)果——
ChatGPT在10秒內(nèi)做出了最結(jié)果的最佳猜測(cè),這個(gè)猜測(cè)很可能是正確的,感覺仿佛就是一臺(tái)真正的計(jì)算機(jī)在執(zhí)行相關(guān)的代碼一樣。
這種可能性,足以讓人類驚喜。
雖然對(duì)于要求準(zhǔn)確性的代碼工作來說,它有不少灰色地帶。
但對(duì)于AIGC的其他領(lǐng)域,比如生成文本、圖像,這種多重的可能性無疑幫助人類拓展想象力的邊界。
ChatGPT的商業(yè)模式,推動(dòng)人工智能的革命
為什么這幾天ChatGPT會(huì)爆火呢?
作為底層模型的GPT-3,其實(shí)已經(jīng)誕生兩年了。與之不同的是,ChatGPT既免費(fèi),又好用。
閱讀AI輸出的示例是一回事,而自己生成輸出,又是另一回事了。
AIGC的革命早已掀起。當(dāng)Midjourney使AI生成的藝術(shù)變得簡(jiǎn)單、免費(fèi)時(shí),人類對(duì)此的興趣和意識(shí)也就出現(xiàn)了爆炸式的增長。
ChatGPT是免費(fèi)的,這很關(guān)鍵。
要知道,在OpenAI的API上,最大的限制因素就是成本。
使用OpenAI最強(qiáng)大的語言模型Davinci生成750個(gè)單詞,成本為2美分;使用RLHF或其他方法對(duì)模型進(jìn)行微調(diào),也會(huì)花很多錢,從微調(diào)模型生成750個(gè)單詞,需要12美分。
ChatGPT的迷人之處在于,它使得OpenAI變成和MidJourney一樣的消費(fèi)AI產(chǎn)品領(lǐng)銜者。
Midjourney訂閱的商業(yè)模式,對(duì)于在GPU時(shí)間方面具有邊際成本的東西,很有意義。
對(duì)此,前GitHub的CEO Nat Friedman曾提出這樣一個(gè)有趣的觀點(diǎn):在現(xiàn)實(shí)世界,AI的應(yīng)用程序其實(shí)是匱乏的。
現(xiàn)在,研究人員每天都在以飛速的方式向全世界提供著大量新功能,而企業(yè)和產(chǎn)品人員才剛剛開始消化這些新功能。
再往前想一步,當(dāng)AI在現(xiàn)實(shí)世界中不再匱乏的時(shí)候,人類是否會(huì)被AI取代?
讓我們來看一看AI對(duì)這個(gè)問題的回答。
參考資料:
https://meta.stackoverflow.com/questions/421831/temporary-policy-chatgpt-is-banned
https://dev.to/bienvenuelisis/will-chatgpt-replace-stackoverflow-2h6g
https://stratechery.com/2022/ai-homework/
本文來源:新智元 (ID:AI_era),原文標(biāo)題:《ChatGPT瘋狂生成「辣雞」內(nèi)容,Stack Overflow氣急,連夜封殺!》
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。