AI大事件,GPT-4下周就來(lái)了?
大家都在猜 GPT-4 發(fā)布時(shí)間,現(xiàn)在有人提前公布答案了,還是微軟自己的 CTO。
我們知道,引爆如今科技界軍備競(jìng)賽的 ChatGPT 是在 GPT-3.5 上改進(jìn)得來(lái)的,OpenAI 很早就預(yù)告 GPT-4 將會(huì)在今年發(fā)布。最近各家大廠爭(zhēng)相入局的行動(dòng)似乎加快了這個(gè)進(jìn)程。
最新消息是,萬(wàn)眾期待的 GPT-4 下周就要推出了:在 3 月 9 日舉行的一場(chǎng)名為「AI in Focus - Digital Kickoff」的線下活動(dòng)中,四名微軟德國(guó)員工展示了 GPT 系列等大型語(yǔ)言模型(LLM)的顛覆性力量,以及 OpenAI 技術(shù)應(yīng)用于 Azure 產(chǎn)品的詳細(xì)信息。
(相關(guān)資料圖)
在活動(dòng)中,微軟德國(guó)首席技術(shù)官 Andreas Braun 表示 GPT-4 即將發(fā)布,自從 3 月初多模態(tài)模型 Kosmos-1 發(fā)布以來(lái),微軟一直在測(cè)試和調(diào)整來(lái)自 OpenAI 的多模態(tài)模型。
GPT-4,下周就出
「我們將在下周推出 GPT-4,它是一個(gè)多模態(tài)的模型,將提供完全不同的可能性 —— 例如視頻(生成能力),」Braun 說(shuō)道,他將語(yǔ)言大模型形容為游戲規(guī)則改變者,因?yàn)槿藗冊(cè)谶@種方法之上讓機(jī)器理解自然語(yǔ)言,機(jī)器就能以統(tǒng)計(jì)方式理解以前只能由人類閱讀和理解的內(nèi)容。
與此同時(shí),這項(xiàng)技術(shù)已經(jīng)發(fā)展到基本上「適用于所有語(yǔ)言」:你可以用德語(yǔ)提問(wèn),然后用意大利語(yǔ)得到答案。借助多模態(tài),微軟和 OpenAI 將使「模型變得全面」。
微軟德國(guó) CTO Andreas Braun
改變業(yè)界
微軟德國(guó)公司首席執(zhí)行官 Marianne Janik 全面談到了人工智能對(duì)業(yè)界的顛覆性影響。Janik 強(qiáng)調(diào)了人工智能的價(jià)值創(chuàng)造潛力,并表示,當(dāng)前的人工智能發(fā)展和 ChatGPT 是「iPhone 發(fā)布一樣的時(shí)刻」。她表示,這不是要代替人類工作,而是幫助人們以不同于以往的方式完成重復(fù)性任務(wù)。
改變并不一定意味著失業(yè)。Janik 強(qiáng)調(diào)說(shuō),這意味著「許多專家會(huì)開始利用 AI 實(shí)現(xiàn)價(jià)值增長(zhǎng)」。傳統(tǒng)的工作行為正在發(fā)生變化,由于新的可能性出現(xiàn),也會(huì)產(chǎn)生全新的職業(yè)。她建議公司成立內(nèi)部「能力中心」,培訓(xùn)員工使用人工智能并將想法整合到項(xiàng)目中。?
此外,Janik 還強(qiáng)調(diào),微軟不會(huì)使用客戶的數(shù)據(jù)來(lái)訓(xùn)練模型(但值得注意是,根據(jù) ChatGPT 的政策,這不會(huì)或至少不會(huì)適用于他們的研究合作伙伴 OpenAI)。
微軟德國(guó) CEO Marianne Janik
實(shí)際用例
微軟的兩位 AI 技術(shù)專家 Clemens Sieber 和 Holger Kenn 提供了關(guān)于 AI 實(shí)際使用的一些信息。他們的團(tuán)隊(duì)目前正在處理具體的用例,他們講解了用例涉及的技術(shù)。?
Kenn 解釋了什么是多模態(tài)人工智能,它不僅可以將文本相應(yīng)地翻譯成圖像,還可以翻譯成音樂(lè)和視頻。除了 GPT-3.5 模型之外,他還談到了嵌入,用于模型中文本的內(nèi)部表征。根據(jù) Kenn 的說(shuō)法,「負(fù)責(zé)任」的 AI 已經(jīng)內(nèi)置到微軟的產(chǎn)品中,并且可以通過(guò)云將數(shù)百萬(wàn)個(gè)查詢映射到 API 中。
Clemens Siebler 則用用例說(shuō)明了今天已經(jīng)成為可能的事情,例如可以把電話呼叫的語(yǔ)音直接記錄成文本。根據(jù) Siebler 的說(shuō)法,這可以為微軟在荷蘭的一家大型客戶每天節(jié)省 500 個(gè)工作小時(shí)。
該項(xiàng)目的原型是在兩個(gè)小時(shí)內(nèi)創(chuàng)建的,一個(gè)開發(fā)人員在兩周內(nèi)完成了該項(xiàng)目。據(jù)他介紹,三個(gè)最常見(jiàn)的用例是回答只有員工才能訪問(wèn)的公司信息、AI 輔助文檔處理和在呼叫中心處理口語(yǔ)的半自動(dòng)化。
微軟表示人們很快就會(huì)與其全新的 AI 工具見(jiàn)面。特別是在編程領(lǐng)域,Codex 和 Copilot 等模型可以更輕松地創(chuàng)建代碼,令人期待。
當(dāng)被問(wèn)及操作可靠性和事實(shí)保真度時(shí),Siebler 表示 AI 不會(huì)總是正確回答,因此有必要進(jìn)行驗(yàn)證。微軟目前正在創(chuàng)建置信度指標(biāo)來(lái)解決此問(wèn)題。通常,客戶僅在自己的數(shù)據(jù)集上使用 AI 工具,主要用于閱讀理解和查詢庫(kù)存數(shù)據(jù),在這些情況下,模型已經(jīng)相當(dāng)準(zhǔn)確。
然而,模型生成的文本仍然是生成性的,因此不容易驗(yàn)證。Siebler 表示微軟圍繞生成型 AI 建立了一個(gè)反饋循環(huán),包括贊成和反對(duì),這是一個(gè)迭代的過(guò)程。
看來(lái)在 AI 大模型的競(jìng)爭(zhēng)中,領(lǐng)先的一方也加快了腳步。微軟在過(guò)去一周左右接連發(fā)布了展示多模態(tài)的語(yǔ)言大模型論文 Kosmos-1 和 Visual ChatGPT,這家公司顯然非常支持多模態(tài),希望能夠做到使感知與 LLM 保持一致,如此一來(lái)就能讓單個(gè) AI 模型看文字圖片,也能「說(shuō)話」。
微軟的下次 AI 活動(dòng)選在了 3 月 16 日,CEO 薩蒂亞?納德拉將親自上臺(tái)演講,不知他們是否會(huì)在這次活動(dòng)上發(fā)布 GPT-4。有趣的是,微軟的活動(dòng)和百度推出文心一言選在了同一天。
距離 3 月 16 日百度推出類 ChatGPT 聊天機(jī)器人還有一周時(shí)間,最近有報(bào)道稱,百度正在抓緊時(shí)間趕在發(fā)布最后期限前完成任務(wù)。目前看來(lái),百度打算分階段推出文心一言的各項(xiàng)功能,并首先向部分用戶開放公測(cè)。
知情人士稱,在春節(jié)假期過(guò)后,李彥宏就要求包括自動(dòng)駕駛部門在內(nèi)的全公司 AI 研究團(tuán)隊(duì)將英偉達(dá) A100 支援給文心一言的開發(fā)。
我們期待下周各家科技公司能帶來(lái)驚喜。
本文作者:小舟、澤南,來(lái)源:機(jī)器之心,原文標(biāo)題:《微軟:多模態(tài)大模型GPT-4就在下周,撞車百度?》
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: