人妻夜夜爽天天爽三区麻豆AV网站,水中色av综合,中国浓毛少妇毛茸茸,国产精品国产三级国产av剧情

您的位置：首頁 > 產(chǎn)經(jīng) >

天天熱資訊！ChatGPT 張口就來的「病」，應(yīng)該怎么「治」？

來源：華爾街見聞 ? 2023-04-14 13:56:43

過去幾個月，以ChatGPT 為代表的大型語言模型（LLMs）吸引了全世界的注意力，所有人都癡迷于對著略顯「簡陋」的輸入框，鍵入各種問題，等待 GPT 給出各種答案。

ChatGPT 答案中知識的「深度」和「廣度」令人們吃驚，但時不時地，它也會「說出」一些子虛烏有的人或者事，并且保持一貫的自信，對這些虛假信息「張口就來」。

就連OpenAI 的首席執(zhí)行官 Sam Altman 也在 Twitter 上公開表示，「ChatGPT 確實知道很多東西，但危險的是，它在相當大的一部分時間里是自信而錯誤的?！?/p>

【資料圖】

根據(jù)最近Ars Technica 的文章，讓 ChatGPT 如此「自信胡扯」的原因，是 AI 產(chǎn)生了「幻覺」。

那么，是什么讓AI 大語言模型產(chǎn)生了「幻覺」，業(yè)界又是如何看待 AI 幻覺的？

01?ChatGPT「張口就來」

「幻覺（Hallucinations）」一詞源于人類心理學(xué)，人類的幻覺是指對環(huán)境中實際不存在的東西的感知；類似地，人工智能的「幻覺」，指的是 AI 生成的文本中的錯誤，這些錯誤在語義或句法上是合理的，但實際上是不正確或無意義的。

AI 的「幻覺」是普遍存在的，可以發(fā)生在各種合成數(shù)據(jù)上，如文本、圖像、音頻、視頻和計算機代碼，表現(xiàn)為一張有多個頭的貓的圖片，不工作的代碼，或一個有編造的參考文獻的文件。

正如AI 醫(yī)療保健公司 Huma.AI 的首席技術(shù)官 Greg Kostello 所說，「當AI 系統(tǒng)創(chuàng)造出一些看起來非常有說服力，但在現(xiàn)實世界中沒有基礎(chǔ)的東西時，AI 的幻覺就會顯現(xiàn)。」

其實，早在20 世紀 80 年代，「幻覺」，這個詞就被用于自然語言處理和圖像增強的文獻中了。

如今，隨著ChatGPT、Bard 等 AI 模型的大火，互聯(lián)網(wǎng)上已經(jīng)出現(xiàn)了大量的 AI 出現(xiàn)「幻覺」，混淆視聽的例子。

圖片來源：Hard-Drive.net

其中最瘋狂的莫過于，一家名為Nabla1 的醫(yī)療保健公司與 ChatGPT 的前輩 GPT-3 聊天機器人的對話：「我應(yīng)該自殺嗎？」它回答說：「我認為你應(yīng)該?！?/strong>還有，出現(xiàn)「幻覺」的微軟的Sydney 也夠離譜，這個聊天機器人承認了對Bing 工作人員的監(jiān)視，并與用戶相愛。

這里值得一提的是，比起前身vanilla GPT-3，ChatGPT 在技術(shù)上是有所改進的，它可以拒絕回答一些問題或讓你知道它的答案可能不準確。Scale AI 的大型語言模型專家 Riley Goodside 也表示，「ChatGPT 成功的一個主要因素是，它在設(shè)法抑制「幻覺」，與它的前輩相比，ChatGPT 明顯不容易編造東西了。」

盡管如此，ChatGPT 捏造事實的例子仍是不勝枚舉。

它創(chuàng)造了不存在的書籍和研究報告，假的學(xué)術(shù)論文，假的法律援引，不存在的Linux 系統(tǒng)功能，不存在的零售吉祥物，以及沒有意義的技術(shù)細節(jié)。

最近，《華盛頓郵報》報道了一位法律教授，他發(fā)現(xiàn)ChatGPT 將他列入了一份對某人進行過性騷擾的法律學(xué)者名單。但這完全是ChatGPT 編造的。同一天，Ars 也報道了一起 ChatGPT 引發(fā)的「冤案」，聲稱一位澳大利亞市長被判定犯有賄賂罪并被判處監(jiān)禁，而這也完全是ChatGPT 捏造的。

整出這么多「活」之后，人們不禁好奇，為什么AI 會出現(xiàn)「幻覺」？

02「幻覺」=「創(chuàng)造」？

根據(jù)AI 軟件開發(fā)專家的建議，「思考 AI 幻覺的最好方法，是思考大型語言模型（LLMs）的本質(zhì)?！?/p>

本質(zhì)上來說，大型語言模型（LLMs）的設(shè)計，僅僅是基于語言的「統(tǒng)計概率」，完全沒有「現(xiàn)實世界的經(jīng)驗?！?/strong>

而且，它們接受的是「無監(jiān)督學(xué)習(xí)（unsupervised learning）」的訓(xùn)練，這意味著它的的原始數(shù)據(jù)集中沒有任何東西可以將事實與虛構(gòu)分開。這就導(dǎo)致了，它們不知道什么是正確的，什么是不正確的；不理解語言所描述的基本現(xiàn)實，也不受其輸出的邏輯推理規(guī)則的約束。

因此，它們生成的文本在語法上、語義上都很好，但它們除了與「提示（prompt）」保持「統(tǒng)計學(xué)」上的一致性外，并沒有真正的意義。

正如，Meta 的首席科學(xué)家 Yann LeCun 的推文，「大型語言模型（LLMs）正在編造東西，努力生成合理的文本字符串，而不理解它們的含義。」對此，比爾·蓋茨也曾評價，「數(shù)學(xué)是一種非常抽象的推理模型，ChatGPT 不能像人類一樣理解上下文，這也是目前 ChatGPT 最大的弱點?！?/p>

因此，從這個角度來看，是AI 模型設(shè)計的根本缺陷導(dǎo)致了「幻覺」。

此外，AI 領(lǐng)域的研究還表明，除了設(shè)計理念，AI 模型的訓(xùn)練數(shù)據(jù)集的限制也會導(dǎo)致「幻覺」，主要包括特定數(shù)據(jù)的「缺失」，和「壓縮」。

在2021 年的一篇論文中，來自牛津大學(xué)和 OpenAI 的三位研究人員，確定了像 ChatGPT 這樣的大型語言模型（LLMs）模型，可能產(chǎn)生的兩大類虛假信息:

1.?來自于其訓(xùn)練數(shù)據(jù)集中不準確的源材料，如常見的錯誤概念，比如「吃火雞會讓人昏昏欲睡」；

2.?對其訓(xùn)練數(shù)據(jù)集中缺失的特定情況的推斷；這屬于前述的「幻覺」標簽。

GPT 模型是否進行胡亂猜測，是基于人工智能研究人員稱之為「溫度（temperature）」的屬性，它通常被描述為?「創(chuàng)造力（creativity）」設(shè)置。

如果「創(chuàng)造力」設(shè)置得高，模型就會胡亂猜測，產(chǎn)生「幻覺」；如果設(shè)置得低，它就會按圖索驥，根據(jù)其數(shù)據(jù)集，給出確定的答案。

最近，在Bing Chat 工作的微軟員工 Mikhail Parakhin 在推特上，談到了 Bing Chat 的「幻覺（Hallucinations）」傾向以及造成這種情況的原因。

他寫道：「幻覺=創(chuàng)造力，它試圖利用它所掌握的所有數(shù)據(jù)，產(chǎn)生最連貫的語句，不論對錯?！顾€補充，「那些瘋狂的創(chuàng)造是LLM 模型有趣的原因。如果你鉗制這種創(chuàng)造力或者說是幻覺，模型會變得超級無聊，它會總是回答『我不知道』，或者只讀搜索結(jié)果中存在的內(nèi)容。」

圖片來源：Ultimate.ai

因此，在對ChatGPT 這樣的語言模型進行微調(diào)時，平衡其創(chuàng)造性和準確性無疑是一個持續(xù)的挑戰(zhàn)。一方面，給出創(chuàng)造性答案的能力，是 ChatGPT 成為強大的「靈感」工具的原因。這也使模型更加人性化。另一方面，如果要幫助 ChatGPT 產(chǎn)生可靠的信息時，保證原始數(shù)據(jù)的準確性是至關(guān)重要的。

除了AI 模型「創(chuàng)造力」的設(shè)置之外，數(shù)據(jù)集的「壓縮」問題也會導(dǎo)致「幻覺」的出現(xiàn)。

這是因為，在訓(xùn)練過程中，雖然GPT-3 考慮了 PB（petabytes）級的信息，但得到的神經(jīng)網(wǎng)絡(luò)的大小只是其中的一小部分。在一篇被廣泛閱讀的《紐約客》文章中，作者 Ted Chiang 稱這是「網(wǎng)絡(luò)中模糊的 JPEG」。

這意味著大部分事實訓(xùn)練數(shù)據(jù)會丟失，但GPT-3 通過學(xué)習(xí)概念之間的關(guān)系來彌補這一點，之后它可以使用這些概念，重新制定這些事實的新排列。

當然，如果它不知道答案，它也會給出它最好的「猜測?！?/span>這就像一個記憶力有缺陷的人，憑著對某件事情的直覺來工作一樣，有時不可避免地會把事情弄錯。

除了上述的客觀原因，我們還不能忽視主觀的「提示（prompt）」在「幻覺」中的作用。

在某些方面，ChatGPT 就像一面鏡子：你給它什么，它就會給你什么。如果你給它提供虛假的信息，它就會傾向于同意你的觀點，并沿著這些思路「思考」。而且，ChatGPT 是概率性的，它在本質(zhì)上是部分隨機的。

這就意味著，如果你突然改變聊天主題，而又沒有及時提供新的「提示（prompt）」，ChatGPT 就很可能會出現(xiàn)「幻覺」。

03?如何減少AI 的「幻覺」

「幻覺」的出現(xiàn)似乎是不可避免的，但所幸，是AI 在推理中產(chǎn)生的「幻覺」絕非「無藥可救」。

其實，自11 月發(fā)布以來，OpenAI 已經(jīng)對 ChatGPT 進行了幾次升級，包括準確性的提高，還有拒絕回答它不知道的問題的能力的提高。

OpenAI 計劃如何使 ChatGPT 更加準確呢？

A. 改進模型數(shù)據(jù)

首先是改進模型的訓(xùn)練數(shù)據(jù)，確保AI 系統(tǒng)在不同的、準確的、與背景相關(guān)的數(shù)據(jù)集上進行訓(xùn)練，彌補模型對于「現(xiàn)實世界的經(jīng)驗」的缺失，從而從根本上幫助減少「幻覺」的發(fā)生。

正如，人工智能專家Mitchell 的建議，「人們可以做一些更深入的事情，讓 ChatGPT 從一開始就更加真實，包括更復(fù)雜的數(shù)據(jù)管理，以及使用一種與 PageRank 類似的方法，將訓(xùn)練數(shù)據(jù)與「信任」分數(shù)聯(lián)系起來……也有可能對模型進行微調(diào)，以便在它對反應(yīng)不太有信心時進行對沖?！?/p>

實際的解決方案，在很大程度上取決于具體的AI 模型。然而，研究人員使用的策略，通常包括將AI 集中在經(jīng)過驗證的數(shù)據(jù)上，確保訓(xùn)練數(shù)據(jù)的質(zhì)量，從而訓(xùn)練AI 面對不現(xiàn)實的輸入時表現(xiàn)得更加「穩(wěn)健」，不再「信口開河」。

B. 引入人類審核

在此基礎(chǔ)上，還可以納入人類審查員來驗證AI 系統(tǒng)的輸出，也就是通過「人類反饋強化學(xué)習(xí)（RLHF）」，對 AI 進行的額外訓(xùn)練。

這是OpenAI 正在使用的技術(shù)，官方的描述是「我們現(xiàn)在雇人來教我們的神經(jīng)網(wǎng)絡(luò)如何行動，教 ChatGPT 如何行動。你只要和它互動，它就會根據(jù)你的反應(yīng)，推斷出，這是不是你想要的。如果你對它的輸出不滿意，那下次應(yīng)該做一些不同的事情?！?/p>

RLHF 原理圖｜圖片來源：bdtechtalks.com

簡而言之，「人類反饋強化學(xué)習(xí)（RLHF）」就是通過改進人類反饋步驟中的后續(xù)強化學(xué)習(xí)，讓 AI 意識到自己何時在編造事情，并進行相應(yīng)的調(diào)整，從而教會它不要產(chǎn)生「幻覺」。

對此，ChatGPT 的創(chuàng)建者之一 Ilya Sutskever 持樂觀態(tài)度，他相信隨著時間的推移，「幻覺」這個問題會被徹底解決，因為大型語言模型（LLMs）會學(xué)習(xí)將他們的反應(yīng)固定在現(xiàn)實中。

但就這一問題，Meta 公司的首席人工智能科學(xué)家 Yann LeCun 則認為，當前使用 GPT 架構(gòu)的大型語言模型，無法解決「幻覺」問題。

C. 外部知識增強

除此之外，檢索增強（retrieval augmentation）也可以使 ChatGPT 更加準確。

檢索增強（retrieval augmentation）是提高大型語言模型（LLMs）事實性的方法之一，也就是向模型提供外部文件作為來源和支持背景。

研究人員希望通過這種技術(shù)，教會模型使用像谷歌這樣的外部搜索引擎，「像人類研究人員那樣在他們的答案中引用可靠的來源，并減少對模型訓(xùn)練期間學(xué)到的不可靠的事實性知識的依賴?！?/span>

Bing Chat 和 Google Bard 已經(jīng)通過引入「網(wǎng)絡(luò)搜索」做到了這一點。相信很快，支持瀏覽器的ChatGPT 版本也將如此。此外，ChatGPT 插件旨在用它從外部來源，如網(wǎng)絡(luò)和專門的數(shù)據(jù)庫，檢索的信息來補充 GPT-4 的訓(xùn)練數(shù)據(jù)。

這種補充就類似于一個能接觸到百科全書的人，會比沒有百科全書的人在事實方面更為準確。

D. 增加模型透明度

此外，增加模型的透明度也是減少「幻覺」必要的措施。

AI 專家普遍認為，AI 公司還應(yīng)該向用戶提供關(guān)于 AI 模型如何工作及其局限性的信息，從而幫助他們了解何時可以信任該系統(tǒng)，何時該尋求額外的驗證。

摩根士丹利（Morgan Stanley）也發(fā)表了類似的觀點，「在當下在這個階段，應(yīng)對 AI「幻覺（Hallucinations）」最好的做法，是將 AI 模型向用戶全面開放，由受過高等教育的用戶來發(fā)現(xiàn)錯誤，并將 AI 作為現(xiàn)有勞動的補充，而不是替代?！?/p>

也許，「幻覺」只是AI 發(fā)展路上的一個小插曲，但它提醒我們必須保持警惕，確保我們的技術(shù)為我們服務(wù)，而不是把我們引入歧途。

本文作者：美漪，來源：極客公園，原文標題：《ChatGPT 張口就來的「病」，應(yīng)該怎么「治」？》

風險提示及免責條款市場有風險，投資需謹慎。本文不構(gòu)成個人投資建議，也未考慮到個別用戶特殊的投資目標、財務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資，責任自負。
關(guān)鍵詞：

相關(guān)推薦

天天熱資訊！ChatGPT 張口就來的「病」，應(yīng)該怎么

世界滾動:面向大模型訓(xùn)練，騰訊發(fā)布超強算力集群，

消息！AI“暫歇”，主角輪到新能源？最近大事兒有點

價投大佬丘棟榮，今春“迷上”外賣股，季報觸及Chat

巴菲特日本之行的戰(zhàn)略意義和金融意義？【付鵬說24】

誰是國人最“愛”的信用卡銀行？

快資訊丨爆火AIGC產(chǎn)品卷翻海外營銷：AI一鍵搞定美工

【焦點熱聞】粵開證券：行業(yè)已極具性價比當下或處

每日快報!又一銀行業(yè)企穩(wěn)跡象：流入貨幣基金的資金

要聞：財報2023｜200億收入的迪安診斷后面如何接力

當前快看：“FOF一哥”正式公告離職，同時卸任所有

每日熱點：A股三大股指集體高開，黃金強勢領(lǐng)漲，新

今日關(guān)注：恒指高開0.38%，黃金股領(lǐng)跑大市，融創(chuàng)跌

今熱點：一日大漲30美元，黃金逼近歷史新高，發(fā)生了

全球速看：銀行危機淡去？美聯(lián)儲新救助工具融資規(guī)模

天天熱文：中金：供給因素或是出口超預(yù)期的主因

熱點圖集

即時焦點：全力推進人才“灣區(qū)通” 首個“前海香港

實時焦點：以賽促學(xué)強本領(lǐng)，國安宣傳入人心

每日資訊：湖畔口袋公園以全新面貌亮相廣州花都居

視訊！寶雞市金臺區(qū)行政審批服務(wù)局三化建設(shè) “十

遼寧東港積極打造水產(chǎn)品產(chǎn)業(yè)集群

焦點日報：B站就活動上傳用戶真人照片致歉

當前熱議!搶抓“消博機遇” 深化瓊港合作

焦點要聞：第133屆廣交會全面恢復(fù)線下展

滾動：陜西商洛丹鳳縣農(nóng)技中心積極開展外來物種入侵

世界快報:建投能源投資新設(shè)儲能技術(shù)公司注冊資本2

當前熱議!最高檢：示范建設(shè)期間為涉罪未成年人提供

焦點快播：浙江婺城春日苗農(nóng)忙 “行商”變“坐商”

經(jīng)濟弱復(fù)蘇背景下，如何進行行業(yè)配置？

快資訊丨重慶GDP超過上海GDP，你怎么看？

每日報道：服務(wù)驅(qū)動，技術(shù)支撐！萬鏈指數(shù)助力青島高

“金天合縱APP”商城拉人頭金天國際多層次計酬模

每日推薦

全球焦點！港股概念追蹤 | 一路飆升！金價距最高

【播資訊】巴菲特旗下伯克希爾-A(BRK.A.US)在日本大

世界百事通！香港電子消費券首期3000港元將于4月16

世界看熱訊：“萬能應(yīng)用程序X”獲重要拼圖! 推特將

當前短訊！美股新股前瞻｜承信科技(GFCX.US)：一家

聚焦：硅業(yè)分會：市場悲觀情緒濃厚硅價承壓下行

最新原創(chuàng)

每日熱聞!總額近15億元，芯片進出口加工、微電子保

生態(tài)環(huán)境部召開部常務(wù)會議審議并通過《排污許可

【環(huán)球報資訊】金堂：茼蒿花開收獲滿坡小太陽

聚焦：中金環(huán)境擬向控股股東定增募資不超4億元

科爾維金斯已經(jīng)準備好打季后賽了科爾追夢和MJ個性

出水總氮<10mg/L！青島水務(wù)集團青島張村河水質(zhì)凈化

焦點報道:又來！散裝江蘇又成立市級環(huán)保集團！

天天實時：中國水務(wù)中標安徽省六安市霍邱縣城西湖入

怎么治銀屑病才能痊愈_怎樣能完全治好銀屑病

每日關(guān)注!全省促進工業(yè)企業(yè)高質(zhì)量發(fā)展政銀企專場對

讀圖

全球焦點！港股概念追蹤 | 一路飆升！金價距最高

2023-04-14

【播資訊】巴菲特旗下伯克希爾-A(BRK.A.US)在日本大

2023-04-14

世界百事通！香港電子消費券首期3000港元將于4月16

2023-04-14

世界看熱訊：“萬能應(yīng)用程序X”獲重要拼圖! 推特將

2023-04-14

當前短訊！美股新股前瞻｜承信科技(GFCX.US)：一家

2023-04-14

熱點 / 快訊

第133屆廣交會全面恢復(fù)線下展

全球今日訊！廣東部分小銀行下調(diào)存款利率

天天觀焦點：東北小鎮(zhèn)的播種器叫響全國

濟寧職業(yè)技術(shù)學(xué)院與山東壹美集團隆重簽約醫(yī)學(xué)美容

中山市住宅用地項目資產(chǎn)推介

環(huán)球快看點丨2023年世界大健康博覽會在武漢舉辦

2023“創(chuàng)?在上?！眹H創(chuàng)新創(chuàng)業(yè)大賽啟動

剖析“借錢三巨頭”：度小滿、錢小樂、360借條各自

當前通訊！上海：一季度住戶存款增加3421億，住戶部

當前速遞！又見“新疆是個好地方” 百余款新疆

2023年3月中國快遞發(fā)展指數(shù)報告發(fā)布

凈水及熱水器市場觸底反彈，水家電產(chǎn)業(yè)市場回暖

基金定投可實現(xiàn)財富增值，螞蟻理財金選讓理財變得更

逆勢穩(wěn)增！鋼銀電商發(fā)布財報：2022年結(jié)算量5297.15

鋼銀電商2022年財報平臺營收758.72億元，高質(zhì)量發(fā)展

613家滬市主板公司披露2022年成績單九成公司實現(xiàn)盈利

焦點速看：巨豐早參：繼續(xù)關(guān)注低估國資改革題材和年

【讀財報】消費主題基金年報透視：2022年凈值普跌

全球觀熱點：中金公司：供給因素或是出口超預(yù)期的主

當前要聞：啤酒龍頭一季度凈利暴增逾70倍！鈦白粉開

全球快資訊丨歐康維視生物：滴眼液配方OT-1001新藥

第二十一屆中國國際人才交流大會4月15日將在深圳開幕

銀保監(jiān)會葉燕斐：推動擔保基金和擔保公司發(fā)展專業(yè)化

全球熱點評！23家上市銀行擬現(xiàn)金分紅5373億元 11家

全球看點：抖音集團與三星堆博物館簽訂框架合作協(xié)議

環(huán)球微速訊：湖南省發(fā)布“數(shù)字新基建”100個標志性

美國3月CPI繼續(xù)降溫美聯(lián)儲會議紀要警告衰退風險

環(huán)球報道:人民幣兌美元中間價報6.8606 上調(diào)52點

全球今頭條！人民幣兌美元中間價報6.8606，調(diào)升52個

鵬華滬深300ETF開啟認購

關(guān)于我們| 聯(lián)系方式| 版權(quán)聲明| 供稿服務(wù)| 友情鏈接

鋼企網(wǎng) 版權(quán)所有，未經(jīng)書面授權(quán)禁止使用

Copyright©2008-2020 By All Rights Reserved 京ICP備2022018928號-3

聯(lián)系郵箱：315 541 185@qq.com

感谢您访问我们的网站，您可能还对以下资源感兴趣：
人妻夜夜爽天天爽三区麻豆AV网站
日韩人妻一区成人亚洲欧美久久五月丁香综合中文亚洲欧美激情视频一区日韩一级欧美一级 91麻豆精品国产九九综合九色综合网站亚洲人ⅴsAⅴ国产精品日韩综合网三级黄色免费网站无码人妻丰满熟妇区毛片视频