OpenAI重磅研究:ChatGPT可能影響80%工作崗位,收入越高影響越大
ChatGPT 來了,失業(yè)還會遠(yuǎn)嗎?上星期在 GPT-4 發(fā)布時(shí),ChatGPT 第一時(shí)間上線了新版本,OpenAI 首席執(zhí)行官 Sam Altman 表示他對自家這種技術(shù)「有點(diǎn)害怕」。
(資料圖片)
和很多專家一樣,Altman 擔(dān)心人工智能技術(shù)的強(qiáng)大能力會制造過多虛假信息,另一方面,新技術(shù)也將改變經(jīng)濟(jì)、勞動力和教育環(huán)境。
有人開玩笑說 Sam Altman 每天背著的同一個(gè)包,里面有緊急關(guān)停 AI 的紅色按鈕。
此前,AI 作畫已經(jīng)讓很多畫師開始擔(dān)憂自己的工作會被取代。昨天,OpenAI 研究人員提交的一篇報(bào)告引發(fā)了人們更加熱烈的討論,研究人員估計(jì) ChatGPT 和使用該程序構(gòu)建的未來應(yīng)用可能影響美國大約 19% 的工作崗位,和他們至少 50% 的工作任務(wù)。
與此同時(shí),80% 的美國勞動力至少有 10% 的工作任務(wù)在某種程度上將受到 ChatGPT 的影響。
該研究分析表明,像 GPT-4 這樣的 LLM(大型語言模型)的影響可能是無處不在的。此外,工資較高的工作 —— 可能需要執(zhí)行許多基于軟件的任務(wù) —— 會面臨更多來自人工智能聊天機(jī)器人的潛在影響。
在職業(yè)影響方面,受影響最大的職業(yè)包括翻譯工作者、作家、記者、數(shù)學(xué)家、財(cái)務(wù)工作者、區(qū)塊鏈工程師等。
該研究還按行業(yè)細(xì)分了 ChatGPT 的影響。數(shù)據(jù)處理托管、出版業(yè)等行業(yè)最有可能受到影響。相比之下,體力勞動較多的行業(yè) —— 食品、林業(yè)、社會援助等受到的潛在影響最小。
OpenAI 研究了美國超過 1000 個(gè)職業(yè),并給他們貼上了執(zhí)行這些工作所需的各種任務(wù)的標(biāo)簽。然后,研究人員使用人工注釋器和 GPT-4 模型來評估訪問由 ChatGPT 驅(qū)動的系統(tǒng)是否會將人類執(zhí)行特定任務(wù)所需的時(shí)間減少至少 50%。
讓我們看看這項(xiàng)研究具體在干什么:
研究介紹
我們先看總結(jié),OpenAI 本次調(diào)查了 GPT 模型和相關(guān)技術(shù)對美國勞動力市場的潛在影響。他們根據(jù)人員職業(yè)與 GPT 能力的對應(yīng)程度來進(jìn)行評估,研究結(jié)果表明,大約 80% 的美國勞動力至少有 10% 的工作任務(wù)會受到 GPT 的引入影響,而大約 19% 的員工可能會看到至少 50% 的工作任務(wù)受到影響。這種影響涵蓋所有工資水平,高收入工作可能面臨更大的風(fēng)險(xiǎn)。值得注意的是,這種影響不僅限于近期生產(chǎn)率增長較高的行業(yè)。
通過分析他們發(fā)現(xiàn),像 GPT-4 這樣的大型語言模型帶來的影響可能是普遍的。隨著時(shí)間的推移,LLM 的能力不斷提高,即使現(xiàn)在研究人員停止對新模型能力的開發(fā),但它們帶來日益增長的經(jīng)濟(jì)效應(yīng)也會持續(xù)增長。該研究還發(fā)現(xiàn),如果考慮到互補(bǔ)技術(shù)的發(fā)展,LLM 的潛在影響將顯著擴(kuò)大。這也恰恰說明了 GPT 正變得越來越通用。
為了分析,該研究還提出了一個(gè)新的標(biāo)準(zhǔn)來理解 LLM 的能力及其對工作潛在影響,該標(biāo)準(zhǔn)用來衡量關(guān)于 GPT 任務(wù)的總暴露數(shù)。
看完結(jié)論,接下來就該介紹數(shù)據(jù)集了。該研究使用 O*NET 27.2 數(shù)據(jù)集 (O*NET, 2023),該數(shù)據(jù)集包含 1016 個(gè)職業(yè)信息,表 1 提供了數(shù)據(jù)集示例,包含任務(wù) ID、職位等。
此外,數(shù)據(jù)集還包括他們從美國勞工統(tǒng)計(jì)局獲得的 2020 年 - 2021 年員工就業(yè)和工資數(shù)據(jù)。該數(shù)據(jù)集包括職業(yè)頭銜、每種職業(yè)的工人數(shù)量等。
在方法上,該研究根據(jù) exposure rubric 來展示結(jié)果,Exposure rubric 定義為訪問 GPT 或 GPT 驅(qū)動的系統(tǒng)是否會將人類執(zhí)行特定 DWA 或完成任務(wù)所需的時(shí)間減少至少 50%。(注:DWA 全稱 Detailed Work Activities ,可以將其理解為完成任務(wù)所需要的動作,例如表 1,對于計(jì)算機(jī)系統(tǒng)工程師,其 DWA 包括監(jiān)控電腦系統(tǒng)性能,確保正常運(yùn)作。)
該研究對每個(gè) O*NET 數(shù)據(jù)集的 DWA 和所有 O*NET 任務(wù)的子集獲得人工注釋,然后在任務(wù)和職業(yè)級別上匯總這些 DWA 和任務(wù)得分。為了確保這些注釋的質(zhì)量,該研究親自標(biāo)記了大量任務(wù)和 DWA 樣本,并招募了經(jīng)驗(yàn)豐富的人工注釋者,他們在 OpenAI 的對齊工作中廣泛審查了 GPT 輸出。
下表為模型與人的一致性比較與皮爾遜相關(guān)系數(shù)。一致性分?jǐn)?shù)是通過觀察兩組人在注釋上達(dá)成一致的頻率來確定的 (例如 E0, E1 或 E2)。在本文中,該研究使用 GPT-4, Rubric 1。
該研究為感興趣的因變量構(gòu)建了三個(gè)主要度量:(i) ????,對應(yīng)于上面 exposure rubric 中的 E1, (ii) ????,是 E1 和 0.5*E2 的總和,以及 (iii) ????,E1 和 E2 的總和。該研究在表 2 中總結(jié)了注釋組和度量之間的一致性。
研究結(jié)果
OpenAI 的這項(xiàng)研究以 GPT 語言模型對經(jīng)濟(jì)具有普遍影響作為假設(shè),我們來看一下具體的研究結(jié)果。
根據(jù) ???? 值,該研究估計(jì) 80% 的人屬于至少一項(xiàng)工作任務(wù)受 GPT 影響的職業(yè),而 19% 的人所處的職業(yè)有超過一半的工作任務(wù)被標(biāo)記為受到 GPT 影響。
工資和就業(yè)
下圖 3 描繪了 GPT 模型對經(jīng)濟(jì)的整體影響。
下圖 4 描繪了工作薪資與對 GPT 等語言模型接觸使用情況的關(guān)系。
然后,該研究又從不同的職業(yè)分類探究了 GPT 模型的影響,包括 ONET 數(shù)據(jù)庫中的 5 個(gè) Job Zone。其中,Job Zone 1 中的工作入職要求最低,Job Zone 5 則最高。
總體來說,OpenAI 這項(xiàng)研究發(fā)現(xiàn),工作對科學(xué)方法和批判性思維的依賴程度與 LLM 接觸使用情況呈負(fù)相關(guān),而編程和寫作技能與 LLM 接觸使用呈正相關(guān)。
不過,該研究也承認(rèn):試圖通過使用簡單的標(biāo)簽來描述工作任務(wù)并代表每個(gè)職業(yè),這種方法本身存在固有的偏見,并且可能忽略了一些特有的技能或任務(wù)。
當(dāng)然,還有一個(gè)非常重要的問題是 GPT 模型目前仍存在很多缺陷,包括編造虛假信息,這使得人工監(jiān)督工作成為必要。
大模型的廣泛應(yīng)用,或許意味著許多人將失去工作,但 OpenAI 首席執(zhí)行官 Sam Altman 認(rèn)為這也將是個(gè)找到更好工作的機(jī)會:「我們可以擁有更高的生活質(zhì)量。同時(shí),人們需要時(shí)間來更新、做出反應(yīng)、習(xí)慣這項(xiàng)新技術(shù)。」
本文來源:機(jī)器之心,原文標(biāo)題:《OpenAI重磅研究:ChatGPT可能影響80%工作崗位,收入越高影響越大》
風(fēng)險(xiǎn)提示及免責(zé)條款 市場有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: