人妻夜夜爽天天爽三区麻豆AV网站,水中色av综合,中国浓毛少妇毛茸茸,国产精品国产三级国产av剧情

全球新動態(tài):三個月誕生79個基礎大模型,中國到底需要什么大模型?

去年年底ChatGPT發(fā)布后,中國企業(yè)至少已經(jīng)發(fā)布了79個基礎大模型。但其中絕大部分大模型都被外界認為技術上和ChatGPT存在差距。大模型商用箭在弦上,中國到底需要什么大模型?


(資料圖片)

2022年12月,微軟投資的AI創(chuàng)業(yè)公司OpenAI推出了對話式AI ChatGPT。ChatGPT本質(zhì)是OpenAI自主研發(fā)的GPT語言大模型,該大模型包含近1800億個參數(shù)。今年2月英偉達CEO黃仁勛評價稱,“ChatGPT讓AI迎來了iPhone時刻”。黃仁勛認為,大模型正在降低應用開發(fā)門檻,所有應用都值得用大模型重做一次。

這并不是黃仁勛的一家之言,所有人都看到了機會。

今年3月開始,中國企業(yè)也在競相發(fā)布大模型產(chǎn)品。其中包括頭部企業(yè),如百度的文心大模型、阿里的通義大模型、騰訊的行業(yè)大模型,還包括訊飛、商湯科技等行業(yè)企業(yè)以及一批創(chuàng)業(yè)公司。5月科技部下屬的中國科學技術信息研究所發(fā)布了《中國人工智能大模型地圖研究報告》。報告顯示,截至5月28日,國內(nèi)10億級參數(shù)規(guī)模以上基礎大模型至少已發(fā)布79個。

模型的參數(shù)量很重要。目前,百度、阿里等頭部公司公布文心、通義參數(shù)量通常在1000億級別,如文心大模型參數(shù)量為2600億。其他企業(yè)或創(chuàng)業(yè)公司大模型參數(shù)量通常在100億、10億級別。? ? ? ?

雖然目前市場上發(fā)布的AI模型都叫“大模型”,但參數(shù)量被默認為是大模型、小模型的界定因素之一。百度集團副總裁侯震宇對《財經(jīng)》記者表示,2022年10億參數(shù)的模型,就叫大模型。但現(xiàn)在的大模型參數(shù)動輒上千億。因為千億參數(shù)以上才會出現(xiàn)“智能涌現(xiàn)”效應,才會形成泛化能力,才能在各個場景下具備通用能力?;谶@種大模型精調(diào)出來的模型才具備更好的產(chǎn)業(yè)應用效果。

“智能涌現(xiàn)”效應,指的是模型規(guī)模、算力水平超過某個參數(shù)閾值后,AI效果將不再是隨機概率事件。在通用領域,參數(shù)量越大,智能通常涌現(xiàn)的可能性就越大,AI準確率也會更高。在專用垂直領域,大參數(shù)模型裁剪優(yōu)化后更容易獲得精確的效果。

雖然中國至少已經(jīng)出現(xiàn)了79個大模型,但多位接受《財經(jīng)》記者采訪的行業(yè)人士認為,大模型需要算力、算法、數(shù)據(jù)積累。由于高性能GPU芯片短缺,硬件采購成本、運營成本高昂,中國具備資金儲備、戰(zhàn)略意志和實際能力跑通大模型商業(yè)化的企業(yè)寥寥無幾?!鞍倌4髴?zhàn)”中,絕大部分產(chǎn)品和ChatGPT確實存在差距。

經(jīng)歷喧囂后,大模型狂熱正在逐漸回歸現(xiàn)實。國內(nèi)外大模型市場正在出現(xiàn)更多理智思考——無法落地商用的ChatGPT只能是玩具,能成為企業(yè)應用的大模型才有產(chǎn)業(yè)價值。

蘋果、三星、摩根大通等企業(yè)因為安全考慮禁止員工使用ChatGPT。另一方面,ChatGPT用戶增長、留存也已到瓶頸。網(wǎng)站分析工具SimilarWeb數(shù)據(jù)顯示,ChatGPT在1-5月流量環(huán)比增速分別為131.6%、62.5%、55.8%、12.6%、2.8%。6月初,摩根士丹利調(diào)查顯示,只有19%的受訪者表示使用過ChatGPT,只有4%的人表示依賴ChatGPT。

侯震宇說,“今年3月,客戶剛開始跟我們聊大模型需求時,都在發(fā)揮想象力,提的需求要多科幻有多科幻。但4月后,大模型的局限性顯露,大家才慢慢看到了更多實際需求?!敝骺陀^因素影響下,全球基礎大模型均主要面向To B行業(yè)市場。

大模型在To C端商業(yè)化進程緩慢。目前面臨算力成本高昂,用戶規(guī)模越大企業(yè)虧損越多等問題。也無法避免輸出錯誤“噪音”,甚至還有信息泄密、政策監(jiān)管等倫理挑戰(zhàn)。即使微軟,也只是在工具類產(chǎn)品(office辦公套件、網(wǎng)頁瀏覽器、Photoshop等修圖工具)中部署大模型。微軟向工具類企業(yè)賣服務,其本質(zhì)仍是To B商業(yè)化。

大模型面向To B端企業(yè)客戶落地才是務實做法。在行業(yè)市場,客戶需求蓬勃且明確。在全球,零售、金融、制造、政府等領域都在靠大模型進行智能化升級。行業(yè)共識是,在大模型基礎上經(jīng)過行業(yè)知識精調(diào)的模型,其特定工作表現(xiàn),會優(yōu)于未經(jīng)優(yōu)化的通用基礎大模型。

市場調(diào)研機構IDC在今年5月公布的數(shù)據(jù)顯示,2022年中國人工智能市場總規(guī)模為122億美元,其中硬件81.3億美元,軟件26.9億美元,服務14.1億美元。IDC預測稱,2026年中國人工智能市場規(guī)模將達到269億美元,其中硬件148.5億美元,軟件76.9億美元,服務38.9億美元。硬件、軟件、服務的年復合增長率分別為15.1%、 32.0%、28.5%。

狂熱總要回歸現(xiàn)實?!敦斀?jīng)》6月與百度集團副總裁侯震宇、百度智能云副總裁朱勇展開了一場主題名為“中國到底需要什么大模型”的對話,侯震宇和朱勇深度參與了百度文心千帆大模型平臺的打造和商用生態(tài)的塑造,在這場談話中,我們探討了三大問題:大模型是不是豪華游戲?企業(yè)到底需要何種大模型?大模型市場是否出現(xiàn)了泡沫?

對話人簡介:

百度集團副總裁 侯震宇(負責百度智能云事業(yè)群組云計算產(chǎn)研團隊和基礎技術工程團隊)

百度智能云副總裁 朱勇(負責百度智能云應用產(chǎn)品中心)

主持人:《財經(jīng)》雜志副主編 謝麗容

以下是對話實錄精華版:

大模型是不是豪華游戲?

《財經(jīng)》謝麗容:中國掀起了大模型創(chuàng)業(yè)潮,大模型的門檻很高,但從入局速度和規(guī)??粗袊袌霈F(xiàn)狀似乎并非如此?

朱勇:大模型門檻是相對的,其中會有不同類型的玩家。第一類和百度一樣,從零開始做基礎大模型。這對算力、算法、數(shù)據(jù)、人才的要求都非常高。

以數(shù)據(jù)為例,基礎大模型需要海量數(shù)據(jù)訓練,其中包括互聯(lián)網(wǎng)數(shù)據(jù)、專業(yè)領域數(shù)據(jù)、新聞資訊數(shù)據(jù),以及經(jīng)過高質(zhì)量的專業(yè)標注的數(shù)據(jù)。以算力為例,ChatGPT這樣的千億級參數(shù)大模型,需要英偉達最高端的A100/H100 GPU連續(xù)訓練100天才能得到。算法、人才也是關鍵。工程師訓練手法不同,就像不同廚師基于同樣原材料做的菜口味都不一樣。這需要長期實踐經(jīng)驗積累,所以門檻很高。

第二類是行業(yè)大模型,基于基礎大模型能力做一些微調(diào)、針對性定制。這比過去從零開始數(shù)據(jù)標注、算法精調(diào)的成本大大降低。第三類基于前兩類大模型開發(fā)應用,百度、其他企業(yè)甚至是一些開源平臺都提供了開發(fā)工具,讓軟件開發(fā)門檻變得更低。

《財經(jīng)》謝麗容:中國的大模型在全球市場究竟是什么水平?

侯震宇:個人覺得中國的大模型在全球市場還是領先的。大模型研發(fā)和搜索引擎研發(fā)其實類似,都需要非常深的技術積累。從全球來看,擁有獨立研發(fā)搜索引擎技術的國家就那么幾個。目前能完全獨立研發(fā)大模型技術的,可能也只有中美兩個國家。

《財經(jīng)》謝麗容:大模型有沒有絕對的先進和落后?

侯震宇:大模型沒有絕對好、壞。盡管它在不同領域可能會有一定的差別,但就像選擇智能手機一樣。有人用蘋果,有人用安卓,最適合的才是好的。大模型剛推出時,經(jīng)常會有人考它一些刁鉆的問題。但事實上,在真正嚴肅的企業(yè)級環(huán)境里面,不太會有這樣的場景。企業(yè)需要針對業(yè)務場景選擇更適合自己的大模型。特別是中國企業(yè),需要選擇中文理解力更好,適合中國企業(yè)特點的產(chǎn)品。

《財經(jīng)》謝麗容:百度在大模型方向究投入了多少資源,多少人才?

侯震宇:AI大模型是百度核心戰(zhàn)略,它需要持續(xù)全方位高強度投入。以算力為例,我們過去GPU數(shù)量的積累,是以萬為單位計量,這一筆巨大的投資。百度經(jīng)過多年還開發(fā)出了一整套工具鏈,能夠更快更好地訓練模型。

過去10年,百度在AI方向投入已超過1000億元。百度作為一家技術公司,每年研發(fā)投入的營收占比都超過20%。(備注:2019年后,百度核心研發(fā)支出的營收占比長期超過20%。2022年百度研發(fā)支出率為24%,在中國科技企業(yè)中僅次于華為的25%。百度核心指剔除愛奇藝后的百度自有業(yè)務)但大模型也不是投一筆錢、做一個模型那么簡單,它需要有算力、有數(shù)據(jù)、有經(jīng)驗豐富的AI工程師在好的研發(fā)平臺上長期積累。

《財經(jīng)》謝麗容:創(chuàng)業(yè)公司做基礎大模型,除了要有錢、要有卡、要有數(shù)據(jù),還有哪些挑戰(zhàn)?

侯震宇:錢、卡、數(shù)據(jù),本身就很有挑戰(zhàn)。創(chuàng)業(yè)公司做基礎大模型,除了起碼的算力,足夠多、質(zhì)量好的數(shù)據(jù),有經(jīng)驗的AI研發(fā)人員,還需要能夠把模型、算力管理好的AI開發(fā)平臺。目前大公司會把這些平臺以云的形式對外提供服務。比如,百度智能云通過文心千帆大模型平臺對外提供服務。但是從零開始訓練出基礎大模型門檻依然很高。因為大模型不是訓出來就行,還需要后續(xù)持續(xù)敏捷迭代,大公司相對會更成熟。

《財經(jīng)》謝麗容:一些企業(yè)正在開始自建大模型。自建大模型是不是必須的選擇?2014年公有云剛剛興起時,某些客戶會擔心數(shù)據(jù)安全,它們使用大模型時,是否也會擔心這個問題?

侯震宇:每一家公司都一定要用大模型,但每一個企業(yè)是否都需要自己做一個大模型?我覺得不一定。自己從頭開始去做一個基礎大模型成本非常高。企業(yè)拿自己的數(shù)據(jù)在別人的基礎大模型做精調(diào),一樣可以獲得非常好的效果。

朱勇:我覺得企業(yè)更多應該去想怎么用上大模型,怎么用好大模型。每個企業(yè)都可以擁有自己的大模型,但沒必要重新開始做。因為百度這樣的企業(yè)已經(jīng)提供了很好的技術底座。可以依靠百度做一些定制化產(chǎn)品,這對客戶來說是性價比更好的選擇。數(shù)據(jù)安全問題并不是大模型出現(xiàn)才帶來的新問題。如果類比云計算的話,有公有云、私有云、托管等方式。在大模型商業(yè)模式上,我們已經(jīng)充分考慮過相應的產(chǎn)品和解決方案。

《財經(jīng)》謝麗容:智能手機、云的普及都是因為價格足夠低。中國大模型什么時候才能進入普遍應用階段?

侯震宇:大模型本身就帶來了大量成本節(jié)省。過去,企業(yè)研發(fā)AI應用時,需要根據(jù)應用場景做數(shù)據(jù)清洗、標注,對模型訓練、推理、優(yōu)化。不管場景有多小,都得做全流程的工作,成本很高。但基于大模型,不需要過去那么多數(shù)據(jù)、時間、資源、人力。我建議企業(yè)盡早關注、使用大模型技術,因為它本身就能大幅度降低AI應用門檻。

中國企業(yè)需要什么大模型?

《財經(jīng)》謝麗容:百度的文心大模型3月開始內(nèi)測。內(nèi)測中,企業(yè)是否可以清晰地提出自己的需求?他們的需求集中在哪些層面?

朱勇:距離3月份內(nèi)測以來,我們已經(jīng)陸續(xù)接到了超過15萬家客戶的接入請求。同時也有幾百家合作伙伴跟我們在場景中進行研發(fā)測試。這覆蓋了互聯(lián)網(wǎng)、制造、金融等不同行業(yè),里面很多場景是高價值的??偨Y一下,比較高頻出現(xiàn)的場景有幾大類——知識管理、內(nèi)容創(chuàng)作(包括營銷文案、媒體資訊)、智能客服、代碼生成和辦公提效。

《財經(jīng)》謝麗容:數(shù)字化轉(zhuǎn)型市場長期存在一個問題,很多客戶不知道自己想要什么。在大模型領域,這個矛盾是不是也存在?

朱勇:不同行業(yè)、不同客戶確實存在差別。大模型出來后,互聯(lián)網(wǎng)行業(yè)高度關注它的最新進展,他們的技術理解、產(chǎn)品認知都非常領先,因此我們能很快在一起進行研發(fā)測試,做出Demo和產(chǎn)品創(chuàng)新。

一些傳統(tǒng)產(chǎn)業(yè)的數(shù)字化基礎相對薄弱一些,所以百度會有大量工程師跟客戶一起共創(chuàng),將AI能力跟他們的行業(yè)痛點相結合,產(chǎn)生很多很新穎的產(chǎn)品理念。AI技術跟行業(yè)相結合時,一方面要懂技術、懂AI,另一方面要懂行業(yè)。所以我們跟客戶、合作伙伴對接時,經(jīng)常需要雙方在一起共創(chuàng)。

《財經(jīng)》謝麗容:百度怎么給不同行業(yè)、不同類型的客戶提供大模型服務?從客戶角度如何評估性價比?

朱勇:在價格層面,如果企業(yè)剛開始嘗試且對價格敏感,可以使用公有云服務,根據(jù)調(diào)用量,Pay-as-you-go?(用多少花多少),不需要一次性基礎設施投入,這也是公有云的優(yōu)勢。一些企業(yè)愿意進行較大基礎設施投入,并建立自己智能化的應用,百度可以提供一整套AI模型和AI底座,企業(yè)可以基于AI模型和AI底座開發(fā)應用。

《財經(jīng)》謝麗容:企業(yè)怎么選擇適合自己的大模型?

侯震宇:第一,肯定是模型效果,這是選擇大模型的基礎。企業(yè)需要評估大模型在使用場景中能夠發(fā)揮的價值。第二,要關注迭代速度。既要看基礎大模型本身是否有生命力,也要看平臺是否有完善的工具鏈,支持便捷的二次開發(fā)和模型再訓練,支撐大模型更好迭代。第三,大模型的實際落地成本和交付形態(tài)。企業(yè)可以根據(jù)需要選擇公有云、私有云的交付模式。

《財經(jīng)》謝麗容:文心千帆被定位為一站式企業(yè)級大模型平臺,怎么去理解“一站式”、“企業(yè)級”?

侯震宇:首先說“一站式”, AI是由數(shù)據(jù)驅(qū)動的技術。AI從誕生之初就要做數(shù)據(jù)收集、清理、標注,再根據(jù)現(xiàn)有模型做訓練,訓練結束后要對精調(diào)數(shù)據(jù)、模型版本做管理,最后將其投放到業(yè)務中使用。這是一整套流程。百度提供了這些能力,而且很易用,客戶在AI研發(fā)到應用的全生命周期中的需求都可以滿足。

再說“企業(yè)級”,企業(yè)級應用不是個人應用,不是上傳照片那么簡單。企業(yè)級應用會更精細、復雜,需要考慮規(guī)?;?、擴展性、實施成本、穩(wěn)定健壯等因素。

《財經(jīng)》謝麗容:百度對外稱,文心千帆大模型平臺有六大特點——易用、安全、全面、高效、開放、集成。易用為什么要擺在第一個?是不是只有好用的技術才會被普及?

侯震宇:易用非常重要。自然語言大模型可以給客戶提供更易用的接口,方便大家和機器來做交互?!霸浦且惑w,AI普惠”是百度智能云的戰(zhàn)略,“AI普惠”也一直是我們的一個理想。AI不能只是象牙塔里高高在上的技術,必須要降低AI使用的門檻,其中包括數(shù)據(jù)使用門檻、資源使用門檻、以及人使用AI的門檻,所以易用非常關鍵。

《財經(jīng)》謝麗容:過去三個月,公眾已經(jīng)被很好地普及了人工智能大模型。對千行百業(yè)來說,大模型的商用時機是否已經(jīng)到了?好的商用節(jié)奏應該是怎樣的?

朱勇:人工智能大模型對研發(fā)和應用范式的變革非常明確。越早擁抱大模型、理解大模型,越會讓它對業(yè)務產(chǎn)生作用。這不是Yes or NO的問題。談到節(jié)奏,不同企業(yè)擁抱大模型的方式不一樣。有的企業(yè)可以從單點應用嘗試開始,利用公有云調(diào)用服務,這樣可以更低成本地快速驗證做Demo開發(fā)。

另外一方面,無論是大小企業(yè),都要培養(yǎng)AI原生思維。比如一些應用可以通過漸進式的方式進行改造升級。另一種做法叫重構,按照百度公司內(nèi)部的說法,未來所有的產(chǎn)品都會基于大模型重新做一遍。

大模型市場出現(xiàn)泡沫了嗎?

《財經(jīng)》謝麗容:在面向企業(yè)的B端市場真的需要那么多大模型嗎?

侯震宇:我個人看法是,基礎大模型其實不需要那么多。當然,這只是從終局往前看。但在任何一個行業(yè)發(fā)展早期,市場會變得繁榮且存在泡沫。從產(chǎn)業(yè)發(fā)展的角度來看,我們應該允許現(xiàn)在有一定的泡沫。我們也應該正視這一點。但我仍然相信,在大浪淘沙之后,最終提供基礎模型服務的,仍然是為數(shù)不多的幾個企業(yè)。

朱勇:基礎大模型方向,雖然現(xiàn)在有很多玩家,但是真正能夠保持快速迭代,不斷開發(fā)更全面、更完整工具鏈,不斷基于客戶反饋來提升產(chǎn)品能力,這是一件挺難的事情。所以大模型雖然現(xiàn)在可能很熱,但這是長跑,最后會像今天的云計算格局一樣,市場會逐漸收斂。

《財經(jīng)》謝麗容:很多做服務器硬件的企業(yè)也要做行業(yè)大模型。百度曾經(jīng)是他們的客戶,現(xiàn)在變成互相競爭。我們應該怎樣和平共處?

侯震宇:我覺得不能直接說競爭,我們首先還是合作關系。雙方的確會有相近的服務,同時面對相近的行業(yè),但我們和傳統(tǒng)硬件廠商更多還是互補關系。百度是一家互聯(lián)網(wǎng)基因的AI公司,積累了大量通用數(shù)據(jù),有通用大模型,優(yōu)勢在AI、軟件、科技等領域。傳統(tǒng)硬件廠商積累了行業(yè)數(shù)據(jù),在傳統(tǒng)政企行業(yè)等垂直領域打磨出了Know-how。雙方在建大模型時的擅長點不一樣。百度和新華三等企業(yè),既是服務器、交換機采買的合作伙伴,同時也會共建大模型。

《財經(jīng)》謝麗容:百度平時會關注競爭對手的大模型在哪些方面的進展?

朱勇:第一,技術和整體效果。第二,配套工具。第三,商業(yè)模式。如果你再回到三四年前,人工智能市場還是比較遙遠,但今天深度學習的技術、產(chǎn)品商業(yè)化、投資、開源生態(tài),都在加速發(fā)展。

《財經(jīng)》謝麗容:未來幾年,大模型會是百度核心的重點方向嗎?為什么?

侯震宇:大模型會是百度的核心重點方向。百度是一家AI公司,大模型是AI的重要發(fā)展方向。不管是在To C端,還是在To B端,它都將會給百度的產(chǎn)品、服務帶來巨大變化。對于百度來說,大模型讓人非常興奮,這既是機遇,也是挑戰(zhàn)。百度對大模型會持續(xù)投入,我相信大模型會讓云計算加速進入AI時代,會重塑云計算格局,MaaS(Model as a Service)的地位會變的越來越重要,也會加速實現(xiàn)百度智能云提出的“云智一體”戰(zhàn)略和“AI普惠”理想。

《財經(jīng)》謝麗容:2016年開始的上一輪人工智能商業(yè)化出現(xiàn)了一些問題,AI企業(yè)不得不做很多繁瑣細碎的定制化項目。大模型要如何規(guī)避上一輪人工智能商業(yè)化遇到的問題?

侯震宇:這一輪大模型產(chǎn)業(yè)落地,和十年前以深度學習為代表的AI產(chǎn)業(yè)落地是不一樣的。這是AI研發(fā)的新范式,和以前的投入不一樣。大模型出現(xiàn)之前,AI最被詬病、落地最難的是,實際產(chǎn)業(yè)環(huán)境場景碎片化。比如閘機的人臉識別、支付的人臉識別都不一樣。因為光線、環(huán)境不一樣,需要面向不同應用,根據(jù)客戶積累的數(shù)據(jù)從頭做訓練,再去拿到場景里做適配。這種定制化交付非常煩瑣。

但在基礎大模型下,不需要太多精調(diào)數(shù)據(jù),不需要訓練太多輪數(shù),就可以獲得非常好的結果。基礎大模型解決眾多場景比以前容易很多。大模型的泛化能力比以前強很多。這和上一輪的AI落地不一樣。去年10億參數(shù)的模型,就叫大模型,但現(xiàn)在的模型參數(shù)動輒上千億。在千億參數(shù)以上,才會有智能涌現(xiàn),才會有更強的泛化能力,才能在各個場景下具備通用能力。

《財經(jīng)》謝麗容:當很多人都涌入到一個行業(yè)里的時候,泡沫可能不可避免。大模型如果要良性發(fā)展,有哪些建議?

侯震宇:對大模型從業(yè)者的建議是,量力而行。不一定全部都由自己去做。而是考慮AI商業(yè)化落地,找到最適合自身能力的場景和鏈條。我們希望行業(yè)在早期快速發(fā)展時,允許有一定的泡沫。但政策對技術運用的監(jiān)管、行業(yè)評價技術好壞的標準能達成共識。有標準可循,有規(guī)矩可依,這樣才能良性發(fā)展。

朱勇:還要轉(zhuǎn)變思維方式。大模型是分水嶺式的技術、顛覆式的技術。要保持開放心態(tài)、持續(xù)學習。

本文作者:吳俊宇,來源:財經(jīng)十一人,原文標題:《三個月誕生79個基礎大模型,中國到底需要什么大模型?》

風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據(jù)此投資,責任自負。

關鍵詞: