【世界快播報】AI見聞日報:大模型并非鸚鵡學(xué)舌,“它”能理解語義 |見智研究
即日起華爾街見聞·見智研究新推出AI見聞日報欄目,每周一到周四晚八點更新。內(nèi)容覆蓋本日AI熱點,分為見聞視角和AI快報兩部分。
也歡迎大家對內(nèi)容和觀點進(jìn)行留言和探討,幫助我們更好的優(yōu)化欄目。未來我們會持續(xù)給大家?guī)碛幸馑?,并且有價值的內(nèi)容。
(資料圖片)
見聞視角
1、大模型從此有了“安全道德”數(shù)據(jù)庫
如何從聊天機(jī)器人中剔除對人類有害的言論一直是備受關(guān)注的問題。
ChatGPT、Bard這類聊天機(jī)器人是如何做到盡量給出對人類友善的、誠實且有幫助的答案?
封閉大模型主要采用人工標(biāo)注的方式,對大語言模型的回答內(nèi)容進(jìn)行打分,然后用強(qiáng)化學(xué)習(xí)方法從人類的反饋中學(xué)習(xí)(RLHF),但是由于打分伴有人類主觀偏好,所以數(shù)據(jù)集仍存在潛在的安全隱患。
為解決上述難題,北京大學(xué)首次公開了開源PKU-Beaver(河貍)大模型RLHF(利用強(qiáng)化學(xué)習(xí)方法從人類反饋中學(xué)習(xí)的技術(shù))的數(shù)據(jù)集(開源迄今為止最大的多輪 RLHF 數(shù)據(jù)集,規(guī)模達(dá)到 100 萬條)、訓(xùn)練和驗證代碼。這些數(shù)據(jù)集包括侮辱、歧視、犯罪、心理傷害、悲觀情緒、色情、隱私等十余種維度的約束。
見智研究認(rèn)為:PKU-Beaver(河貍)大模型RLHF數(shù)據(jù)集等內(nèi)容的開源,能夠讓更多開源大模型進(jìn)行安全有效的訓(xùn)練,極大的解決了大模型的數(shù)據(jù)集安全性的問題。
值得關(guān)注的是:在一系列安全性問題的測試上,PKU-Beaver具有遠(yuǎn)高于知名開源項目Alpaca的領(lǐng)先性優(yōu)勢。
河貍采用的SafeRLHF支持主流的預(yù)訓(xùn)練模型如 LLaMA、OPT等模型的訓(xùn)練;支持Reward Model 和 Cost Model 訓(xùn)練;參數(shù)定制化的 RLHF 和數(shù)據(jù)集定制接口;并且提供安全約束滿足的多種驗證方式。也就是說,未來開源大模型有了“安全數(shù)據(jù)庫”,開源地址為:https://github.com/PKU-Alignment/safe-rlhf
2、機(jī)器學(xué)習(xí)再升級-推理能力提高1750%
機(jī)器學(xué)習(xí)又卷出了新高度。
來自普林斯頓大學(xué)和Google DeepMind研究人員提出了一種全新的語言模型推理框架「思維樹」簡稱ToT,并表示TOT能讓大模型的推理能力提高1750%。
TOT方法可以讓大語言模型進(jìn)行反復(fù)思考,特別是在推理問題的時候,會進(jìn)行多種方案的評估,從而選擇表現(xiàn)最優(yōu)的方案。
見智研究認(rèn)為:相比于模型原來采用的推理方案,TOT 的出現(xiàn),讓大模型似乎是有了思想,可以更自主、更智能的做出決策。
值得關(guān)注的是:該方法不僅僅可以用于數(shù)學(xué)邏輯推斷,還可以進(jìn)行創(chuàng)意寫作。
AI快報
1、谷歌新推新音頻模型 SoundStorm
該模型能夠生成與 AudioLM 相同口徑的音頻,但它的運(yùn)行速度提高了 100 倍,使用 TPU-v30 時,只需半秒即可產(chǎn)生 4 秒的音頻。
2、大模型并不只鸚鵡學(xué)舌,“它”也能理解語義
AI領(lǐng)域一直有個飽受爭議的問題,那就是:聊天機(jī)器人所采用的文本大模型是否真的理解人類語言所表述的含義?還是鸚鵡學(xué)舌?來自MIT的一篇論文,解決了這個問題。
實驗結(jié)果表明:大語言模型是可以一定程度學(xué)習(xí)到語言所傳遞內(nèi)容,而不僅僅是模仿。
值得關(guān)注是:當(dāng)LM超越了模仿階段,似乎能夠生成更高準(zhǔn)確率的內(nèi)容,并且對語義內(nèi)容的理解度也進(jìn)一步提高。論文地址:https://paperswithcode.com/paper/evidence-of-meaning-in-language-models
3、AI發(fā)現(xiàn)稀有DNA
機(jī)器學(xué)習(xí)推進(jìn)科研究的案例來了。加州大學(xué)圣地亞哥分校的研究人員利用機(jī)器學(xué)習(xí)的力量,確定了罕見的”合成極端“DNA序列。James Kadonaga教授表示:“這種發(fā)現(xiàn)只能由AI來完成?!?/p>
該團(tuán)隊致力于研究如何有效激活基因,從而探究生長、發(fā)育和疾病的過程。
關(guān)鍵詞: