大模型的下一次躍進(jìn):私有化 | 見(jiàn)智研究
華爾街見(jiàn)聞·見(jiàn)智研究特邀瀾碼科技創(chuàng)始人&CEO【周健】來(lái)為大家?guī)?lái)最核心的解讀:AI浪潮的下一個(gè)重要賽道,如何突破企業(yè)應(yīng)用,找到盈利秘籍??
【資料圖】
核心觀點(diǎn)
1、大模型應(yīng)用側(cè)關(guān)注重點(diǎn)有所不同:ToC端的用戶更關(guān)注情感訴求,而ToB端的用戶更關(guān)注效率需求。
2、企業(yè)如何結(jié)合自身業(yè)務(wù)應(yīng)用大模型,存在應(yīng)用的預(yù)期差:企業(yè)在應(yīng)用大模型上面臨很多困難,當(dāng)前可選大模型很多評(píng)估標(biāo)準(zhǔn)多樣化,找到適合企業(yè)自身業(yè)務(wù)的模型不容易,會(huì)存在應(yīng)用的預(yù)期差。
3、通用大模型的劣勢(shì):不足以滿足各行各業(yè)的對(duì)口業(yè)務(wù),無(wú)法解決特定領(lǐng)域的專(zhuān)業(yè)問(wèn)題。
4. 私域數(shù)據(jù)價(jià)值高:企業(yè)私有化AI部署需求潛力巨大,特別是有保護(hù)敏感數(shù)據(jù)需求的企業(yè),比如金融、通信、政務(wù)等領(lǐng)域。
5、大模型應(yīng)用將改變軟件行業(yè)的范式:開(kāi)放式的接口的服務(wù)能夠加速企業(yè)AI應(yīng)用的開(kāi)發(fā)進(jìn)度,AI軟件中臺(tái)的出現(xiàn)能夠幫助垂類(lèi)企業(yè)避免重復(fù)開(kāi)發(fā)和重復(fù)造輪子,從而節(jié)省開(kāi)發(fā)時(shí)間和成本。
正文
見(jiàn)智研究:國(guó)內(nèi)大模型市場(chǎng)格局情況如何?
周?。?/strong>
從去年11月30號(hào)開(kāi)始,大語(yǔ)言模型被視為重要的基礎(chǔ)設(shè)施。目前市場(chǎng)上主要有三類(lèi)玩家。
一類(lèi)是原來(lái)就在這個(gè)賽道的,例如智譜AI和MiniMax,他們?cè)谘邪l(fā)方面已經(jīng)有了兩到三年或更長(zhǎng)的時(shí)間。GPT 3從2020年就出來(lái),所以他們有足夠的時(shí)間沉淀數(shù)據(jù),準(zhǔn)備算力,現(xiàn)在可能略微領(lǐng)先。
第二類(lèi)是大廠,如百度、阿里、騰訊、字節(jié)跳動(dòng),他們資源多,可能只需要在原有研發(fā)方向上稍微調(diào)整一下,他們還有大量的應(yīng)用場(chǎng)景,所以他們是另一類(lèi)重要的玩家。
第三類(lèi)是新生代,如王慧文的光年之外、王小川的百川智能,他們因?yàn)楸旧碜詭Ч猸h(huán),也非常值得期待。如最近王小川的公司新發(fā)布了一個(gè)baichuan-7B模型。
這三類(lèi)玩家,他們的資源、當(dāng)前狀況和適用場(chǎng)景各不相同,都非常有趣。
見(jiàn)智研究:?大模型對(duì)?ToB和?ToC 端的用戶所關(guān)注的重點(diǎn)有何不同?
周健:
首先,大語(yǔ)言模型帶來(lái)的變化是,過(guò)去是圖形界面,現(xiàn)在可能會(huì)用自然語(yǔ)言作為界面,從另一個(gè)角度來(lái)說(shuō),很多應(yīng)用可能會(huì)被合并,未來(lái)我們可能不再需要有100個(gè)應(yīng)用。
但在ToB和ToC這兩個(gè)方向上,關(guān)注點(diǎn)其實(shí)很不一樣。ToB這邊,由于往往涉及專(zhuān)業(yè)場(chǎng)景和多人協(xié)同工作,所以他們可能更關(guān)注協(xié)同辦公場(chǎng)景和數(shù)據(jù)的私有性。而ToC端,由于涉及多種設(shè)備和場(chǎng)景,比如電視、手機(jī)、筆記本電腦,甚至家中的物聯(lián)網(wǎng)設(shè)備等,他們的需求更加分散,可能需要更具體的場(chǎng)景設(shè)計(jì)。
例如,電視是一個(gè)被動(dòng)性的場(chǎng)景,用戶可能在觀看時(shí)并不會(huì)主動(dòng)做太多操作;而手機(jī)是一個(gè)個(gè)人的場(chǎng)景,用戶可能會(huì)主動(dòng)進(jìn)行各種操作。這種區(qū)別會(huì)影響到最后哪些應(yīng)用會(huì)被合并,以及底層的大語(yǔ)言模型是否需要進(jìn)行不同的設(shè)計(jì)。
另外,從需求上來(lái)看,ToC端的用戶可能更關(guān)注情感訴求,而ToB端的用戶可能更關(guān)注效率需求。所以從原始點(diǎn)開(kāi)始,ToB和ToC的需求就已經(jīng)存在很大的區(qū)別。這就是我認(rèn)為T(mén)oB和ToC在大模型關(guān)注重心上的主要差異。
見(jiàn)智研究:企業(yè)如何將大模型與自身業(yè)務(wù)相結(jié)合,會(huì)遇到哪些問(wèn)題?
周?。?/strong>
當(dāng)前企業(yè)在將大模型與自身業(yè)務(wù)結(jié)合時(shí),首要問(wèn)題是如何選擇模型。在國(guó)外,大部分企業(yè)可能會(huì)直接選擇OpenAI,但在國(guó)內(nèi),選擇更為豐富。然而,目前學(xué)術(shù)界對(duì)于如何評(píng)估通用大語(yǔ)言模型還沒(méi)有達(dá)成共識(shí),企業(yè)在這個(gè)問(wèn)題上尤其困難,因?yàn)樗麄兺狈σ粋€(gè)基本的數(shù)據(jù)集來(lái)決定在其特定場(chǎng)景下應(yīng)選擇哪種大模型。
另外一個(gè)問(wèn)題來(lái)自AI的實(shí)際應(yīng)用,有時(shí)候?qū)嶋H的落地效果與期望有很大的差距。例如,在AI 1.0時(shí)代,我們通常會(huì)以人臉識(shí)別為例,但其實(shí)際應(yīng)用過(guò)程中,會(huì)存在很大的差異。
當(dāng)前的大語(yǔ)言模型在客戶端的直接體驗(yàn)上有一定的優(yōu)勢(shì),但在穩(wěn)定性、質(zhì)量和安全性方面,還存在很大的差距。我們可以預(yù)期未來(lái)大語(yǔ)言模型的水平會(huì)逐步提高,但這個(gè)提升速度在企業(yè)內(nèi)部是不一致的。因此,如何評(píng)估在哪里先進(jìn)行落地,哪里可能是最難落地的,這是一個(gè)需要考慮的問(wèn)題。
此外,企業(yè)還需要考慮自身的基礎(chǔ)設(shè)施建設(shè)。大語(yǔ)言模型只是一個(gè)通用基礎(chǔ)設(shè)施,其訓(xùn)練語(yǔ)料主要是通用的公開(kāi)數(shù)據(jù)。然而,企業(yè)內(nèi)部一定會(huì)有自己的私有數(shù)據(jù),這些數(shù)據(jù)的規(guī)整性也非常關(guān)鍵,因?yàn)锳I,包括大語(yǔ)言模型,都需要大量規(guī)整的數(shù)據(jù)進(jìn)行訓(xùn)練。
我們是AI原生的企業(yè),因此對(duì)于垂直企業(yè)內(nèi)部專(zhuān)有模型的構(gòu)建和fine-tuning有著高要求,特別是在企業(yè)內(nèi)部數(shù)據(jù)基礎(chǔ)設(shè)施的條件下。
在與許多客戶會(huì)面時(shí),我們注意到他們都感到焦慮,因?yàn)楹茈y確定從何處開(kāi)始。試驗(yàn)是他們的一種選擇,但往往只能得出戰(zhàn)術(shù)層面的結(jié)果。對(duì)于大型語(yǔ)言模型的能力,他們可能無(wú)法得出結(jié)論,可能很快就會(huì)因?yàn)樵谂笥讶Πl(fā)的文章而被質(zhì)疑。
在戰(zhàn)略層面上,變革組織是大家的共識(shí),但最困難的是從哪里開(kāi)始,誰(shuí)應(yīng)該先來(lái)嘗試。這需要對(duì)事物的認(rèn)知,以幫助作出決策。在戰(zhàn)術(shù)層面上,他們不斷被打臉,而戰(zhàn)略層面上的問(wèn)題則無(wú)法解決。因此,這是一個(gè)混亂的過(guò)程。
對(duì)于他們來(lái)說(shuō),這是當(dāng)前最大的難題,即使我們專(zhuān)注于這一領(lǐng)域,變化仍然是日新月異的,可能每天都有微小變化,每周都有重大變化,甚至每個(gè)月都可能面臨重大變革。對(duì)于那些核心業(yè)務(wù)不在這方面的企業(yè)來(lái)說(shuō),這是一個(gè)巨大的困難。
見(jiàn)智研究:企業(yè)需要怎樣的模型?
周健:
定制企業(yè)的私有化大模型需要從以下幾個(gè)方面考慮。
從現(xiàn)有的技術(shù)手段來(lái)看,定制化的成本是很高的。其次,基本上只有在類(lèi)似于智能客服或者文本到SQL等確定性場(chǎng)景中進(jìn)行微調(diào)或定制模型才是劃算的。比如,像Bloomberg這樣擁有大量規(guī)整化金融數(shù)據(jù)的企業(yè),定制模型的性價(jià)比較高。
其中客服領(lǐng)域沉淀了大量的人機(jī)對(duì)話數(shù)據(jù),通用性模型不適合。定制企業(yè)私有化模型是最適合的選擇。然而,在其他領(lǐng)域選擇定制化還存在許多問(wèn)題。比如選擇開(kāi)源模型還是閉源模型進(jìn)行共建,采用多少參數(shù)的模型,選擇何種架構(gòu)等。
這些選擇都帶來(lái)了成本,微調(diào)的成本可能在百萬(wàn)級(jí)別,甚至可能要上升到千萬(wàn)級(jí)別,特別是在希望做出有壁壘的企業(yè)定制模型的情況下。
此外,在當(dāng)前階段,大家都在談?wù)撎崾竟こ處煹氖褂谩5?,很多現(xiàn)實(shí)情況下,還并沒(méi)有充分發(fā)揮提示工程師的潛力,而選擇了更昂貴的方式。
因此,只有在明確能產(chǎn)生價(jià)值的場(chǎng)景下,如智能客服和文本到SQL等,花費(fèi)高成本可能是劃算的。而其他領(lǐng)域可能只能讓研發(fā)獲得一些經(jīng)驗(yàn),而企業(yè)其實(shí)是無(wú)法得到有價(jià)值的回報(bào)的。
見(jiàn)智研究:如何看待百萬(wàn)成本微調(diào)的垂直行業(yè)大模型和低成本建立企業(yè)專(zhuān)屬知識(shí)庫(kù)這兩種方案之間的差異性和真實(shí)有效性?
周?。?/strong>
在當(dāng)前的項(xiàng)目中,我們探索了如何基于大語(yǔ)言模型開(kāi)發(fā)新一代的軟件,以實(shí)現(xiàn)更智能的程序模式。舉個(gè)簡(jiǎn)單的例子,大語(yǔ)言模型只是對(duì)數(shù)據(jù)的壓縮,而fine-tuning則是在該模型上添加特定的數(shù)據(jù)集,并對(duì)某些層進(jìn)行參數(shù)修改。然而,它仍然無(wú)法擺脫對(duì)數(shù)據(jù)的壓縮,因此在某種程度上它是昂貴的。
從客戶和供應(yīng)商的角度來(lái)看,它可能能說(shuō)服客戶愿意為高價(jià)值的項(xiàng)目付費(fèi)。然而,從實(shí)際效果來(lái)看,比如對(duì)于法律場(chǎng)景,大語(yǔ)言模型無(wú)法處理大陸法系和英美法系的差異,因?yàn)樗鼈冇胁煌姆蛇壿嫼驼軐W(xué)基礎(chǔ)。
同樣的100個(gè)案例和10份法律文檔,在英美法系和大陸法系的視角下,得出的結(jié)論可能不同。因此,從這個(gè)角度來(lái)看,純粹使用大語(yǔ)言模型可能無(wú)法實(shí)現(xiàn)這一目標(biāo)。我們應(yīng)該在頂層由律師建立一個(gè)知識(shí)庫(kù)來(lái)回答這些問(wèn)題。
因此,通過(guò)使用這些領(lǐng)域的知識(shí),我們可以通過(guò)代碼更快地回答這些專(zhuān)業(yè)問(wèn)題。如果我們使用fine-tuning的方法,即使將所有法律和審判判例放在一起,我們也無(wú)法預(yù)測(cè)ChatGPT這樣的智能體會(huì)如何回答。
因此,在解決企業(yè)應(yīng)用場(chǎng)景問(wèn)題時(shí),我們不能僅僅依賴(lài)大語(yǔ)言模型,fine-tuning只是對(duì)大語(yǔ)言模型的一種改變,沒(méi)有從端到端的視角來(lái)看待問(wèn)題。
見(jiàn)智研究:什么類(lèi)型的企業(yè)需要私有化AI?如何看待這個(gè)領(lǐng)域的需求?
周?。?/strong>
企業(yè)需要定制化或私有化AI,因?yàn)樗鼈儞碛刑貏e敏感且價(jià)值高的數(shù)據(jù)。
例如,我們?cè)龅竭^(guò)一家從事工程報(bào)價(jià)軟件的公司,他們絕對(duì)不愿意將報(bào)價(jià)信息提供給公有的大模型。同樣的情況也適用于半導(dǎo)體等公司,以及涉及醫(yī)療領(lǐng)域中的隱私數(shù)據(jù),如病例數(shù)據(jù),以及整車(chē)廠擁有大量汽車(chē)零配件BOM數(shù)據(jù)。這些企業(yè)都不愿意將這些高價(jià)值的數(shù)據(jù)提供給公有的大型模型,因此它們需要建立企業(yè)私有的模型。
剛才提到的這些行業(yè)都是大型行業(yè),市場(chǎng)潛力巨大,雖然難以準(zhǔn)確判斷市場(chǎng)規(guī)模是千億還是萬(wàn)億,但我認(rèn)為它是一個(gè)極大的市場(chǎng)。
在許多領(lǐng)域中,僅僅依賴(lài)通用大型模型可能無(wú)法實(shí)現(xiàn)落地推進(jìn),特別是在企業(yè)的安全和金融、政務(wù)等方面。
見(jiàn)智研究:為什么寫(xiě)好?Prompt 很難?如何實(shí)現(xiàn)復(fù)雜問(wèn)題智能化解決?
周?。?/strong>
生成模型只是試圖預(yù)測(cè)下一個(gè)要說(shuō)的單詞,這是它的工作原理。從技術(shù)實(shí)現(xiàn)的角度來(lái)看,它也有類(lèi)似于人類(lèi)短時(shí)記憶的限制。我們知道人類(lèi)最多可以記住7個(gè)單詞,對(duì)于大型模型來(lái)說(shuō)存在成本問(wèn)題,所以它也有一些限制。
因此,如何與生成模型進(jìn)行對(duì)話變得非常重要。雖然今天已經(jīng)存在技術(shù)上的突破,但當(dāng)前的大語(yǔ)言模型還沒(méi)有達(dá)到具備數(shù)據(jù)庫(kù)那樣穩(wěn)定可靠的程度,人們還不知道如何正確使用它,才會(huì)出現(xiàn)prompt工程師這樣的職位。
比如,在微軟的評(píng)估中提到了這樣一個(gè)案例,即使是像GPT-4這樣強(qiáng)大的模型,如果你直接讓它計(jì)算150到250之間有多少個(gè)質(zhì)數(shù),它可能會(huì)算錯(cuò)。但如果你讓它計(jì)算150到250之間的質(zhì)數(shù),并逐個(gè)列出并統(tǒng)計(jì)它們的數(shù)量,它就能做對(duì)。
這相當(dāng)于人類(lèi)在面對(duì)問(wèn)題時(shí)會(huì)決定是心算還是拿筆寫(xiě)下來(lái)。因?yàn)樗拇竽X記憶能力是有限的,所以它可能還沒(méi)有學(xué)會(huì)如何處理這種情況,因?yàn)槟壳斑€沒(méi)有給它配備數(shù)據(jù)庫(kù)。未來(lái)大模型背后若有一個(gè)數(shù)據(jù)庫(kù),可能會(huì)開(kāi)發(fā)出新的算法。
此外,今天也有很多人在討論,說(shuō)它在處理數(shù)學(xué)方面不太擅長(zhǎng),所以包括OpenAI自己也在探索如何將一些簡(jiǎn)單的工具,如計(jì)算器功能整合進(jìn)去,以便更好地回答這類(lèi)問(wèn)題。
如今整個(gè)行業(yè)都在探索挖掘大模型的潛力,對(duì)于Prompt的理解可能需要更深入一些。像編程很多時(shí)候是復(fù)雜的,有架構(gòu)、面向?qū)ο蟆㈩?lèi)設(shè)計(jì)、函數(shù)設(shè)計(jì)等。未來(lái),Prompt也可能如此。
舉個(gè)例子,在瀾碼科技的探索中,當(dāng)我們的軟件回答用戶問(wèn)題時(shí),會(huì)將其分解成復(fù)雜的工作流程。一開(kāi)始可能是提示a,扮演產(chǎn)品經(jīng)理的角色,然后將用戶需求拆分成幾個(gè)部分。
在向大語(yǔ)言模型提問(wèn)后,根據(jù)其回答,我們決定是將其第一段作為提示b輸入,還是作為提示c的輸入,或者第二段作為提示d的輸入。
因此,就像30年前我們只有程序員,而現(xiàn)在有前端程序員、后端程序員、數(shù)據(jù)庫(kù)管理員等。未來(lái),Prompt也可能細(xì)分為許多不同的工種,可能還會(huì)有?Prompt Architecture、?Prompt ?Designer。
見(jiàn)智研究:如何看待大模型對(duì)軟件行業(yè)帶來(lái)的影響?可能會(huì)出現(xiàn)哪些行業(yè)發(fā)展機(jī)會(huì)?
周健:
大型模型實(shí)際上代表了技術(shù)的平等,它讓自然語(yǔ)言處理的能力“平民化”。對(duì)于像瀾碼這樣的初創(chuàng)公司來(lái)說(shuō),我們就可以像OpenAI一樣,將300人的自然語(yǔ)言處理團(tuán)隊(duì)視為公司內(nèi)部的資源,直接利用。它所帶來(lái)的一個(gè)變化是,在軟件的邊界上變得更加靈活,可以使用自然語(yǔ)言進(jìn)行交互。
舉個(gè)例子,我們內(nèi)部開(kāi)發(fā)了一個(gè)行程安排助手,以前,我的行程安排可能在微信、郵件上有往來(lái)。現(xiàn)在,我可以簡(jiǎn)單地要求我的軟件助手,分析我的郵件、微信聊天記錄,給出我下周的行程安排。
以前也可以做到這一點(diǎn),但成本很高,可能需要花費(fèi)幾十萬(wàn)甚至上百萬(wàn)。而今天,我們只需要一些prompt,就可以實(shí)現(xiàn)這個(gè)功能,成本只是在每次軟件使用時(shí)支付給OpenAI 1000個(gè)token 0.2美分。以前你不會(huì)愿意把NLP工程師浪費(fèi)在這上面,而現(xiàn)在完全成為可能。
這是軟件范式上的一種改變,手機(jī)上原來(lái)有100個(gè)應(yīng)用,這100個(gè)應(yīng)用彼此之間無(wú)法互通的,為什么呢?因?yàn)檫@100個(gè)應(yīng)用原來(lái)只能通過(guò)API對(duì)接,不同的軟件不斷迭代。有100個(gè)軟件就得進(jìn)行1萬(wàn)次對(duì)接,一次升級(jí)就白接了,然后重新開(kāi)始。
其實(shí)今天所有的系統(tǒng),它其實(shí)都是一個(gè)記錄系統(tǒng),是為了負(fù)責(zé)去記錄整個(gè)物理世界的一些事情的。比如ERP、CRM,HR 系統(tǒng),財(cái)務(wù)系統(tǒng),它其實(shí)都是對(duì)于物理世界的一些事情的一些事件的記錄,然后現(xiàn)在突然新出來(lái)了一類(lèi),叫做?system of model 就是大語(yǔ)言模型,他們其實(shí)負(fù)責(zé)思考。
我覺(jué)得還有第三類(lèi)系統(tǒng)叫做?system of action,?就是像瀾碼做的事情,好比是神經(jīng)中樞的功能。
這個(gè)過(guò)去是需要程序員負(fù)責(zé)去做,成本很高,但現(xiàn)在有了自然語(yǔ)言,這個(gè)就變得容易多了。這可能是今天一個(gè)很大的范式轉(zhuǎn)變。
見(jiàn)智研究:瀾碼科技為什么看準(zhǔn)自動(dòng)化平臺(tái)、AI 應(yīng)用賽道?
周?。?/strong>
自動(dòng)化是一個(gè)古老的賽道,起源于工業(yè)自動(dòng)化的生產(chǎn)線。隨著信息系統(tǒng)和信息化的發(fā)展,物理世界的數(shù)據(jù)被記錄到虛擬世界中,信息化逐漸成熟。下一步的關(guān)鍵是如何在信息化中實(shí)現(xiàn)自動(dòng)化。在各行各業(yè)中,甚至包括餐飲業(yè),信息化已經(jīng)成為現(xiàn)實(shí),例如通過(guò)美團(tuán)等企業(yè)的信息化實(shí)踐。
自動(dòng)化的目標(biāo)是解放人們,使人們從重復(fù)性的勞動(dòng)中解放出來(lái)。它的本質(zhì)是提升人類(lèi)工作的層次,避免人們成為數(shù)據(jù)的搬運(yùn)工或系統(tǒng)的奴隸。人類(lèi)不應(yīng)該為機(jī)器服務(wù),而是機(jī)器應(yīng)該為人類(lèi)服務(wù)。這是自動(dòng)化的初衷,讓人們能夠從繁瑣的工作中解放出來(lái),擔(dān)負(fù)起更高級(jí)的工作任務(wù),實(shí)現(xiàn)人機(jī)協(xié)作的最佳效果。
從現(xiàn)在的應(yīng)用場(chǎng)景上來(lái)看,今天有大量的煙囪式的系統(tǒng)在那邊,其實(shí)有大量的人被浪費(fèi)在了里邊,我們實(shí)際上是可以幫他解放出來(lái)。其實(shí)這里已經(jīng)有第一層的價(jià)值了。
第二層的價(jià)值是說(shuō)當(dāng)達(dá)到了部分自動(dòng)化之后,實(shí)際上有一個(gè)很大的附帶效應(yīng),它把很多的專(zhuān)家的那些數(shù)據(jù)其實(shí)是拿到了。比如說(shuō)過(guò)去假設(shè)是一個(gè)高級(jí)的招聘專(zhuān)家,他可能對(duì)于很多簡(jiǎn)歷、很多東西的一些判斷,比如說(shuō)他整了一個(gè)表格,一個(gè)word 文檔,他可能發(fā)了一些郵件,然后他的經(jīng)驗(yàn)被沉淀下來(lái)了。
但是今天我們已有的BI軟件、數(shù)據(jù)倉(cāng)庫(kù)、?AI應(yīng)用能用到這些數(shù)據(jù)嗎?
用不到,因?yàn)檫@些數(shù)據(jù)可能分散在了各個(gè)應(yīng)用當(dāng)中,可能在微信、騰訊會(huì)議、視頻以及郵件里,但沒(méi)有被關(guān)聯(lián)起來(lái)。但是當(dāng)我們幫它做好智能化之后,會(huì)有一個(gè)大腦負(fù)責(zé)分配。
在這個(gè)過(guò)程當(dāng)中,其實(shí)是機(jī)器人去收集各種各樣的數(shù)據(jù),最后把結(jié)果呈現(xiàn)在面前。
系統(tǒng)可以提供觀點(diǎn)和反饋信息,幫助人們完成任務(wù),例如編寫(xiě)職位描述和審核簡(jiǎn)歷。智能化系統(tǒng)還能記錄專(zhuān)家的見(jiàn)解和洞察,并將其用于培訓(xùn)新手。此外,通過(guò)自動(dòng)化和推薦算法的結(jié)合,系統(tǒng)能夠提供前所未有的決策支持,例如告知在特定情境下專(zhuān)家通常采取的行動(dòng)。這些這些特點(diǎn)使得智能化系統(tǒng)具備巨大的潛力和價(jià)值。
見(jiàn)智研究:基于大語(yǔ)言模型的新一代自動(dòng)化平臺(tái)能夠幫助企業(yè)解決哪些核心問(wèn)題??
周?。?/strong>
雖然人們對(duì)于人工智能可能替代白領(lǐng)工作感到焦慮,但實(shí)際上這種替代可能是有先后順序的。目前大語(yǔ)言模型主要應(yīng)用于純文本類(lèi)的工作,解決一些基礎(chǔ)任務(wù)和重復(fù)性工作,比如簡(jiǎn)歷審核、法務(wù)合同比對(duì)等。這些工作本身并不受歡迎,但它們的關(guān)鍵信息是可以通過(guò)算法進(jìn)行提取和處理的。
對(duì)企業(yè)來(lái)說(shuō),可以帶來(lái)兩個(gè)方面的變化。首先,在企業(yè)內(nèi)部的組織結(jié)構(gòu)上,可能從金字塔型變?yōu)殂@石型,即減少低端員工的數(shù)量。其次,可以提高工作質(zhì)量,例如在簡(jiǎn)歷審核中,可以根據(jù)設(shè)定的屬性和規(guī)則進(jìn)行篩選,加速招聘流程。類(lèi)似地,在財(cái)務(wù)報(bào)表整理方面,可以減少錯(cuò)誤和漏洞,并揭示隱藏的問(wèn)題。
因此,基于大語(yǔ)言模型的新一代自動(dòng)化不僅僅是簡(jiǎn)單替代低端工作,它可以通過(guò)增加計(jì)算力來(lái)免費(fèi)提高頻率和工作量。對(duì)于企業(yè)來(lái)說(shuō),這意味著可以用不同的視角來(lái)管理團(tuán)隊(duì)和控制質(zhì)量,從而帶來(lái)全新的機(jī)會(huì)和挑戰(zhàn)。
見(jiàn)智研究:海內(nèi)外這部分市場(chǎng)空間是否還處于空白時(shí)期??
周?。?/strong>
在硅谷,有一些公司在人工智能領(lǐng)域具有領(lǐng)先優(yōu)勢(shì)。例如,Adapt.ai是由OpenAI的前工程副總裁和Google Transformer論文的第一作者和第三作者共同創(chuàng)立的一家公司。他們開(kāi)發(fā)了獨(dú)特的基準(zhǔn)模型,并創(chuàng)建了一個(gè)瀏覽器插件,用于收集Salesforce用戶的自然語(yǔ)言需求,例如訂機(jī)票和訂酒店。他們還將鍵盤(pán)和鼠標(biāo)的輸入信息作為多模態(tài)輸入進(jìn)行訓(xùn)練,挑戰(zhàn)傳統(tǒng)多模態(tài)的概念,以圖超越OpenAI。
另一個(gè)公司是Fixie.ai,由哈佛大學(xué)的計(jì)算機(jī)系教授創(chuàng)建,他們?cè)诠雀韬吞O(píng)果擔(dān)任過(guò)高級(jí)研發(fā)職位。他們正在建立一個(gè)基于大型語(yǔ)言模型的企業(yè)平臺(tái),可以構(gòu)建基于人工智能的代理(Agent)系統(tǒng)。
在國(guó)內(nèi),SOFA已經(jīng)是一個(gè)開(kāi)源項(xiàng)目,并且已有約6000個(gè)用戶在使用。然而,硅谷在人工智能領(lǐng)域具有細(xì)分工的優(yōu)勢(shì),他們專(zhuān)門(mén)開(kāi)發(fā)了中間層的空間,用于構(gòu)建原生的人工智能應(yīng)用。國(guó)內(nèi)的目標(biāo)是構(gòu)建一個(gè)類(lèi)似的中間平臺(tái),但需要找到適合的場(chǎng)景并確保能夠落地實(shí)施。
再有就是瀾碼科技。瀾碼是數(shù)據(jù)飛輪公司,基于底層的大語(yǔ)言模型,通過(guò)提供自動(dòng)化平臺(tái),在效率場(chǎng)景下學(xué)習(xí)人們?cè)赑C/手機(jī)/會(huì)議等場(chǎng)景下的技能,從而建構(gòu)出自己獨(dú)特的多模態(tài)基礎(chǔ)大模型。
見(jiàn)智研究:如何看待?AI 智能助手未來(lái)市場(chǎng)的空間和競(jìng)爭(zhēng)格局?公司在這方面做了哪些準(zhǔn)備?
周?。?/strong>
在智能助手領(lǐng)域,眾多企業(yè)都希望搶占這一入口,如蘋(píng)果的Siri。
從2008年開(kāi)始,人們就一直在思考智能助手的問(wèn)題。在企業(yè)端,像釘釘、飛書(shū)和企業(yè)微信等已經(jīng)具備了大量用戶,因此它們開(kāi)發(fā)企業(yè)協(xié)同助手是非常自然的事情。在消費(fèi)者端,微信無(wú)疑是一個(gè)很好的入口。
此外,不同設(shè)備上也存在智能助手的應(yīng)用場(chǎng)景,比如電視,例如百度的小度和科大訊飛的不同設(shè)備。這些公司都會(huì)利用自己的優(yōu)勢(shì)去開(kāi)發(fā)智能助手。
在技術(shù)方面,大語(yǔ)言模型仍在不斷演進(jìn),尚未達(dá)到技術(shù)天花板。因此,在當(dāng)前的互聯(lián)網(wǎng)環(huán)境下,仍然以流量為王的思路可能并不適用。在移動(dòng)互聯(lián)網(wǎng)發(fā)展的早期階段,開(kāi)發(fā)一個(gè)手機(jī)相冊(cè)應(yīng)用就能輕松獲得上千萬(wàn)的流量,可以同時(shí)開(kāi)發(fā)100個(gè)應(yīng)用,然后通過(guò)數(shù)據(jù)分析決定哪個(gè)應(yīng)用更成功。但現(xiàn)在情況已經(jīng)有所改變,盡管在兩三年內(nèi)仍可能存在這種情況。
然而,從5到10年的時(shí)間尺度來(lái)看,大語(yǔ)言模型甚至可能改變ToB(企業(yè)對(duì)企業(yè))和ToC(企業(yè)對(duì)消費(fèi)者)的邊界。它可能變成與人交互和與人工智能交互的兩個(gè)端口,即與人接近或與人工智能接近。接近人意味著可以獲得人的數(shù)據(jù),就像習(xí)慣使用個(gè)人秘書(shū)一樣,人們肯定不愿意隨意更換。因此,智能助手的智能程度是非常重要的。
從這個(gè)角度來(lái)看,在技術(shù)尚未成熟的情況下,即使在消費(fèi)者端搶占了市場(chǎng),做出了現(xiàn)象級(jí)產(chǎn)品,如果沒(méi)有深度技術(shù)支持,很容易被大公司通過(guò)運(yùn)營(yíng)手段超越。
因此,我認(rèn)為在 ToB領(lǐng)域更為合適。另外,OpenAI的CEO也提到過(guò)未來(lái)人工智能的應(yīng)用分為三種:大語(yǔ)言模型、數(shù)據(jù)循環(huán)和人工智能應(yīng)用。
對(duì)于消費(fèi)者端來(lái)說(shuō)很難說(shuō),之前提到的設(shè)備可能具有一定的數(shù)據(jù)意義。而對(duì)于企業(yè)端來(lái)說(shuō),核心有價(jià)值的數(shù)據(jù)是非常重要的,比如人、財(cái)務(wù)和物流等。如果我能搶占到一個(gè)人,例如獲得全中國(guó)所有白領(lǐng)的簡(jiǎn)歷數(shù)據(jù)以及其薪資和績(jī)效數(shù)據(jù),甚至更重要的是共享的數(shù)據(jù),即招聘專(zhuān)員在使用我的助手時(shí)的數(shù)據(jù),這些數(shù)據(jù)具有價(jià)值。
這些數(shù)據(jù)可以幫助我們進(jìn)一步錘煉技術(shù)能力。當(dāng)技術(shù)能力達(dá)到更高水平時(shí),例如通過(guò)與智能助手聊天生成的代碼行數(shù)作為衡量智能程度的指標(biāo),比其他公司高一個(gè)量級(jí)或兩個(gè)量級(jí),那么就能輕易奪取市場(chǎng)份額。
因此,在戰(zhàn)略上,我會(huì)選擇首先在專(zhuān)業(yè)場(chǎng)景下開(kāi)發(fā)助手,然后等待技術(shù)的進(jìn)一步發(fā)展。當(dāng)技術(shù)達(dá)到明顯的天花板效應(yīng)時(shí),可能會(huì)出現(xiàn)新的范式。無(wú)法預(yù)測(cè)未來(lái)是否會(huì)變得更加快速,像AlphaGo到現(xiàn)在只相隔7年,再過(guò)3年可能會(huì)出現(xiàn)一個(gè)新的范式,讓大家都驚訝。但假設(shè)不會(huì)發(fā)生這種情況,那么在那個(gè)時(shí)間點(diǎn)上,重新?tīng)?zhēng)奪市場(chǎng)是有機(jī)會(huì)的。
風(fēng)險(xiǎn)提示及免責(zé)條款 市場(chǎng)有風(fēng)險(xiǎn),投資需謹(jǐn)慎。本文不構(gòu)成個(gè)人投資建議,也未考慮到個(gè)別用戶特殊的投資目標(biāo)、財(cái)務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見(jiàn)、觀點(diǎn)或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: