AI B端如何落地?中金:AI Answer是最優(yōu)先模式 資訊
本文定義AI Answer 為結(jié)合LLM和IR技術(shù)的智能信息互動(dòng)應(yīng)用,信息源可為閉源知識庫、行業(yè)圖譜、或是互聯(lián)網(wǎng)開放信息。以C端檢索范式演進(jìn)為鑒,我們認(rèn)為通用智能模型在企業(yè)端或?qū)⒙氏纫訟I Answer模式落地,AI賦能內(nèi)部知識庫重建、構(gòu)建流量入口,有望帶來諸多價(jià)值增量。
摘要
以C端搜索引擎范式演進(jìn)為鑒,我們認(rèn)為B端AI Answer能夠帶來多元價(jià)值增量:
(資料圖)
1)數(shù)據(jù)價(jià)值挖掘:企業(yè)端自動(dòng)生成數(shù)據(jù)洞察與前瞻性的預(yù)測分析;用戶端自動(dòng)分配數(shù)據(jù)訪問權(quán)限,并推薦個(gè)性化的檢索路徑與知識生成。
2)知識資產(chǎn)沉淀:自動(dòng)生成信息分類標(biāo)簽,降低人工歸檔成本。同時(shí)用戶行為可作為人類反饋,訓(xùn)練AI Answer在生成內(nèi)容上進(jìn)一步對齊應(yīng)用領(lǐng)域的需求和偏好。
3)搜索效率提升:自動(dòng)剔除重復(fù)或冗余的信息,整合高質(zhì)量知識資產(chǎn)。主動(dòng)提供建議和關(guān)聯(lián)資料,促進(jìn)信息獲取的及時(shí)性。
供給端技術(shù)平權(quán)疊加需求端實(shí)現(xiàn)內(nèi)外雙向賦能,我們認(rèn)為AI Answer有望成為B端應(yīng)用中先行落地場景。
數(shù)據(jù)層面,AI Answer在搜索過程中融入垂域要素,更好的理解用戶意圖并產(chǎn)生更準(zhǔn)確的搜索結(jié)果;模型層面,技術(shù)平權(quán)背景下可以通過使用開源模型也可在垂域細(xì)分領(lǐng)域達(dá)到較優(yōu)效果。同時(shí)在企業(yè)需求端,AI Answer助力企業(yè)知識圖譜重構(gòu),實(shí)現(xiàn)后端流程運(yùn)維及前端業(yè)務(wù)交互的內(nèi)外雙向賦能。
AI Answer = LangChain + 大模型 + 向量數(shù)據(jù)庫。LangChain框架通過各種模塊化組件提供了全方位全流程的通用開發(fā)服務(wù),可被用于整合和管理大模型的輸出。智譜ChatGLM等大模型帶來大模型普惠,助力B端部署AI Answer。向量數(shù)據(jù)庫幫助拓展LLM的時(shí)空邊界,賦能企業(yè)打造基于專屬知識庫的AI Answer應(yīng)用。
企業(yè)內(nèi)部知識庫有望重構(gòu),管理軟件領(lǐng)域OA有望先行落地AI Answer。我們觀察到第四范式、星環(huán)科技、云知聲等公司已推出企業(yè)知識管理平臺產(chǎn)品,幫助客戶重構(gòu)企業(yè)知識庫;釘釘、WPS、印象筆記等產(chǎn)品助力個(gè)人和中小組織實(shí)現(xiàn)知識梳理。在管理軟件領(lǐng)域,我們認(rèn)為泛微、致遠(yuǎn)等OA廠商有望先行實(shí)現(xiàn)AI Answer和管理流程結(jié)合,落地智能協(xié)同應(yīng)用。
正文
什么是AI Answer?
我們認(rèn)為, AI Answer 為結(jié)合大語言模型(LLM)和信息檢索(IR,Information retrieval)技術(shù)的智能信息互動(dòng)應(yīng)用。在這個(gè)應(yīng)用中,LLM 負(fù)責(zé)理解語境并構(gòu)建查詢,而 IR 技術(shù)則依據(jù)這些查詢獲取相關(guān)數(shù)據(jù)或文檔。檢索到的結(jié)果最終由LLM 生成回應(yīng),從而形成一個(gè)以模型外部信息為支撐的動(dòng)態(tài)對話過程。
AI Answer檢索的信息可以是企業(yè)閉源知識庫、行業(yè)知識圖譜、或是互聯(lián)網(wǎng)開放信息。相較于傳統(tǒng)知識檢索應(yīng)用,AI Answer在交互模式、泛化能力及精確度上均有能力躍遷,我們認(rèn)為通用智能模型在企業(yè)端或?qū)⒙氏纫訟I Answer模式落地,價(jià)值增量包括:
??數(shù)據(jù)價(jià)值挖掘:企業(yè)端根據(jù)企業(yè)內(nèi)部數(shù)據(jù)與已有知識,自動(dòng)生成數(shù)據(jù)洞察與前瞻性的預(yù)測分析,提高企業(yè)運(yùn)維效率與知識創(chuàng)新動(dòng)能。同時(shí)用戶端AI Answer通過分析用戶的角色、需求、歷史查詢記錄,自動(dòng)分配合適的數(shù)據(jù)訪問權(quán)限,推薦個(gè)性化檢索路徑與知識生成。
??知識資產(chǎn)沉淀:自動(dòng)為線上知識文檔生成分類標(biāo)簽,降低人工信息整理成本。根據(jù)用戶使用應(yīng)用的情況跟蹤企業(yè)知識庫變化,自動(dòng)更新生成內(nèi)容,確保信息準(zhǔn)確性與實(shí)時(shí)。同時(shí)用戶使用AI Answer產(chǎn)生的行為可作為人類反饋,訓(xùn)練AI Answer在生成內(nèi)容上進(jìn)一步對齊應(yīng)用領(lǐng)域的需求和偏好。
??搜索效率提升:通過精準(zhǔn)分析用戶需求,自動(dòng)剔除重復(fù)或冗余的信息,整合高質(zhì)量知識資產(chǎn)。同時(shí)AI Answer應(yīng)用可作為虛擬助手,在平臺上同步協(xié)助員工解決問題、主動(dòng)提供建議和關(guān)聯(lián)資料,促進(jìn)信息獲取的及時(shí)性。
以C端檢索范式演進(jìn)為鑒,我們認(rèn)為B端 AI賦能內(nèi)部知識庫重建有望帶來諸多價(jià)值增量,滿足企業(yè)端提效需求。微軟2月8日發(fā)布基于OpenAI大模型的搜索引擎新版Bing(中文名“必應(yīng)”)[1],首次推出嵌入搜索引擎的“問答式搜索”功能,搜索界面的問答機(jī)器人可以與用戶聊天、協(xié)助撰寫文本、匯總?cè)W(wǎng)絡(luò)信息并以對話方式響應(yīng)查詢。
StatCounter數(shù)據(jù)顯示谷歌的搜索引擎幾乎占據(jù)了90%的市場份額,我們認(rèn)為Bing憑借智能化檢索有望不斷突破市場份額。據(jù) Data.AI 的圖示區(qū)間數(shù)據(jù),在嵌入了OpenAI大模型能力后,Bing的APP日均下載量在全球范圍內(nèi)增長了823%,同期對比谷歌搜索應(yīng)用的下載量僅增長3%。
圖表:New Bing推出后APP下載量較Google逐步收斂
資料來源:Data.ai,中金公司研究部
以Glean為例,大模型賦能的AI Answer重構(gòu)企業(yè)管理軟件。AI技術(shù)在企業(yè)端的應(yīng)用場景廣闊,其中知識內(nèi)容檢索場景知識密度要求較高,需求明確且技術(shù)路徑相對成熟。Glean通過打通跨應(yīng)用數(shù)據(jù)打造駕于SaaS層之上的“聚合層”,成為企業(yè)應(yīng)用場景的入口級產(chǎn)品。Glean可以結(jié)合企業(yè)內(nèi)部知識圖譜、以及上百家第三方SaaS應(yīng)用中進(jìn)行信息檢索,為每位用戶的自然語言查詢生成定制化的結(jié)果,覆蓋信息查找、復(fù)雜功能執(zhí)行等場景。
目前,Glean只面向企業(yè)客戶提供服務(wù),公司推出兩種定價(jià)方案,1)按席位收費(fèi),每月不超過100美元;2)根據(jù)企業(yè)的需求定制價(jià)格,目前商業(yè)模式以第二種為主。此外,在服務(wù)模式上,Glean 還提供高水平的安全性和靈活性,可以選擇在本地或云端部署,并且對用戶數(shù)據(jù)進(jìn)行加密和權(quán)限層級管理。
圖表:知識內(nèi)容檢索場景信息密度要求較高而靈活性要求較低,當(dāng)前模型已能夠滿足
資料來源:中金公司研究部
圖表:Glean結(jié)合企業(yè)文檔及第三方應(yīng)用進(jìn)行檢索
資料來源:Glean官網(wǎng),中金公司研究部
AI Answer有望成為B端最快落地的模式
供給端,模型層技術(shù)趨于平權(quán),企業(yè)具備閉源數(shù)據(jù)卡位,商業(yè)落地可得性較高。數(shù)據(jù)層面,與其他B端AI應(yīng)用相比集成了垂直行業(yè)知識的AI Answer應(yīng)用更易實(shí)施落地。
通用人工智能積累了強(qiáng)大的通識能力,但由于其廣泛而非專精的數(shù)據(jù)結(jié)構(gòu),其在專業(yè)領(lǐng)域的檢索實(shí)效性及性價(jià)比尚有欠缺。通過擬合垂直領(lǐng)域的數(shù)據(jù),AI Answer能理解行業(yè)內(nèi)的專業(yè)詞匯、概念和信息,從而在搜索過程中融入垂域要素,更好的理解用戶意圖并產(chǎn)生更準(zhǔn)確的搜索結(jié)果。
模型層面,B端企業(yè)AI Answer場景對于算法模型在知識涌現(xiàn)、數(shù)理分析等高階能力需求較弱,對檢索能力和文本生成能力需求較強(qiáng),技術(shù)平權(quán)背景下可以通過使用LLAMA、Bloom、ChatGLM等開源模型也可在垂域細(xì)分領(lǐng)域達(dá)到較優(yōu)效果。
例如,企業(yè)可以使用LangChain將數(shù)據(jù)庫文檔加載并索引到本地知識庫中,通過嵌入模型對文本進(jìn)行矢量化,助力快速檢索相關(guān)段落,再通過ChatGLM協(xié)助用戶基于檢索到的信息和用戶會(huì)話歷史生成精準(zhǔn)的答案。
圖表:垂域模型調(diào)優(yōu)處在監(jiān)督式微調(diào)階段,增量算力需求較少
資料來源:2023 年微軟Build大會(huì),中金公司研究部
需求端,AI Answer助力企業(yè)知識圖譜重構(gòu),實(shí)現(xiàn)內(nèi)外雙向賦能。
1)企業(yè)需要快速準(zhǔn)確地獲取和利用特定領(lǐng)域的知識和信息,以提高決策效率和質(zhì)量。傳統(tǒng)的搜索引擎往往不能滿足企業(yè)的個(gè)性化需求,而需要一個(gè)能夠理解企業(yè)商業(yè)模式下特定語境和邏輯的智能問答系統(tǒng)。
2)企業(yè)需要對自己擁有或者能夠獲取的數(shù)據(jù)和知識進(jìn)行有效地組織和管理,以提高數(shù)據(jù)質(zhì)量和可用性。傳統(tǒng)的知識庫構(gòu)建和維護(hù)往往需要大量的人力和時(shí)間成本,AI Answer能夠助力企業(yè)自動(dòng)化地從各種數(shù)據(jù)源中抽取、整合、更新和驗(yàn)證知識。
3)企業(yè)需要與客戶、合作伙伴、員工等各方有效地溝通和協(xié)作,傳統(tǒng)的人工客服或者機(jī)器人往往不能滿足用戶的多樣化和復(fù)雜化的問題,AI Answer經(jīng)過細(xì)化調(diào)優(yōu),能夠靈活地適應(yīng)不同場景和需求。
圖表:AI Answer助力企業(yè)決策從被動(dòng)響應(yīng)轉(zhuǎn)向主動(dòng)服務(wù)
資料來源:中國信通院《企業(yè)數(shù)字化轉(zhuǎn)型技術(shù)發(fā)展趨勢研究報(bào)告(2023)》,中金公司研究部
技術(shù)基礎(chǔ):AI Answer = LangChain + 大模型 + 向量數(shù)據(jù)庫
LangChain:針對大模型提供通用開發(fā)框架LangChain是一個(gè)封裝了各種大語言模型應(yīng)用開發(fā)工具的開源Python框架,提供了一套開發(fā)大模型的工具、組件和接口。LangChain幫助開發(fā)者將大模型和其他知識源/數(shù)據(jù)庫結(jié)合起來,以創(chuàng)建功能更強(qiáng)大的應(yīng)用程序,包括基于知識庫問答、聊天機(jī)器人、智能代理等。該開源Python可被用于整合和管理大模型(如ChatGLM)的輸出,提供了標(biāo)準(zhǔn)的模塊化組件、集成了不同的大語言模型并將其進(jìn)行整合,并將它們連接到各種外部數(shù)據(jù)源和API。
通過各種模塊化組件,LangChain框架提供了全方位全流程的優(yōu)化服務(wù)。傳統(tǒng)的大模型無法聯(lián)網(wǎng)、無法調(diào)用其他API、無法訪問本地文件、對Prompt要求高、生成能力強(qiáng)但內(nèi)容準(zhǔn)確度無法保證,而LangChain則提供了相應(yīng)模塊,旨在解決這一系列問題。
? Prompt:使用LLM需要用戶輸入需求,LangChain將用戶的輸入傳遞給Prompt Template。一個(gè)Prompt通常由Instructions、Context、Input Data和Output Indicator組成,但一般用戶并不會(huì)完整地輸入每個(gè)部分,使用LangChain的Prompt Template可以很好地根據(jù)用戶輸入定義各個(gè)部分,同時(shí)將Input Data留作動(dòng)態(tài)輸入項(xiàng)。
? Chain:利用該模塊,LangChain可以不單單利用本身的LLM和Prompt Template,而是將原模型鏈接到其他信息源或API,將模塊組合成完整的工作流,拓展LLM應(yīng)用邊界。
圖表:Prompt Template對輸入改寫
資料來源:海外獨(dú)角獸,中金公司研究部
圖表:連接多個(gè)Prompt Template及搜索、數(shù)據(jù)庫
資料來源:海外獨(dú)角獸,中金公司研究部
? Agent:如果LLM僅利用Chain模塊,那么模型將按照預(yù)設(shè)的接口和順序執(zhí)行工作,而Agent模組可以利用LLM分析應(yīng)該使用哪個(gè)API或者搜索引擎、數(shù)據(jù)源等工具鏈,并自行決定調(diào)用和實(shí)現(xiàn)的順序。比如,ChatGPT有很強(qiáng)的生成回答能力,但不夠準(zhǔn)確;Wolfram Alpha有很準(zhǔn)確的知識儲(chǔ)備,但語義理解能力較差,Agent可以針對ChatGPT的問題,自行判斷是否需要調(diào)用Wolfram Alpha,并生成回答。
? Memory:默認(rèn)情況下,Chain和Agent是無狀態(tài)(stateless)的[2],這意味著它們獨(dú)立地處理每個(gè)傳入的Query(就像底層的LLM和聊天模型),不具備上文記憶的能力。為了記住先前的交互,LangChain通過每次Prompt加入上文內(nèi)容和記錄的tricks,在不同的Query間傳遞上文,在前ChatGPT時(shí)代就實(shí)現(xiàn)了記憶的功能。
圖表:Agent判斷使用工具流程
資料來源:海外獨(dú)角獸,中金公司研究部
圖表:Entity Memory提供長期上下文記憶能力
資料來源:海外獨(dú)角獸,中金公司研究部
案例:YouTube博主Data Independent通過LangChain構(gòu)建了一個(gè)PDF問答機(jī)器人。
LangChain憑借PDF Loader的幫助加載上傳的PDF,并使用Splitter分割語句向量,同時(shí)盡可能保留原始語義,調(diào)用OpenAI的Embedding引擎進(jìn)行長向量變換并存儲(chǔ)在本地或者Pinecone云向量數(shù)據(jù)庫,最后用戶只需調(diào)用LangChain的QA Chain就可以針對上傳的PDF進(jìn)行問答。整個(gè)過程中,LangChain相當(dāng)于對每個(gè)環(huán)節(jié)集成,并對整體的交互進(jìn)行封裝。
LangChain受到廣泛關(guān)注和使用,獲得種子輪融資,但商業(yè)化任重道遠(yuǎn)。2023年4月6日,LangChain宣布獲得由Benchmark領(lǐng)投的1,000萬美元種子輪融資。
截至2023年4月19日,LangChain在Github上已有2.8萬Stars、478位貢獻(xiàn)者,被2,400多名用戶使用。但究其本質(zhì),LangChain是“整合其他開源庫的開源庫”,提供開發(fā)LLM的框架,以此節(jié)省開發(fā)人員編寫代碼的時(shí)間。而由于開源加之經(jīng)濟(jì)成本不穩(wěn)定、對輸出沒有評估步驟,客戶目前更偏好直接的模型交付,LangChain商業(yè)化仍有待探索。
LangFlow為LangChain開源且無代碼的可視化開發(fā)界面,用戶可以通過拖拽模塊和自然語言交互的模式構(gòu)建應(yīng)用原型。
Langchain將制作AI應(yīng)用的工具能力模板化和標(biāo)準(zhǔn)化,而LangFlow 提供了一系列可供選擇的LangChain組件,包括 LLMs、提示模板、代理和鏈等等,用戶可以通過鏈接節(jié)點(diǎn)的方式輕松構(gòu)建和測試產(chǎn)品原型,例如聊天機(jī)器人和文本解析助手。LangFlow基于Python開發(fā),同類產(chǎn)品還有基于JavaScript開發(fā)的Flowise。
圖表:LangFlow支持模塊拖放和聊天框構(gòu)建應(yīng)用原型
資料來源:LangFlow官網(wǎng),中金公司研究部
圖表:LangFlow通過簡單鏈接四個(gè)模塊即可構(gòu)建具備記憶且可自定義模板的聊天機(jī)器人
資料來源:LangFlow官網(wǎng),中金公司研究部
大模型:開源模型百花齊放,助力B端高效部署
ChatGLM等開源模型帶來大模型普惠,助力B端部署AI Answer。
企業(yè)可以通過Langchain平臺調(diào)用部分開源的自然語言處理模型,例如ChatGLM、Bloom與LLAMA模型等,這些開源模型為企業(yè)級AI應(yīng)用的推廣奠定了基礎(chǔ)。其中,ChatGLM是可被集成到LangChain的一款重要開源模型,能夠通過提供自然語言處理能力為企業(yè)打造高效的AI Answer應(yīng)用。
其研發(fā)企業(yè)智譜AI成立于2019年,源自清華大學(xué)計(jì)算機(jī)系知識工程實(shí)驗(yàn)室。2022年,公司合作研發(fā)了支持中英雙語的千億級超大規(guī)模預(yù)訓(xùn)練模型GLM-130B,并搭建了高精度通用知識圖譜。
圖表:智譜AI產(chǎn)品矩陣
資料來源:智譜AI官網(wǎng),中金公司研究部
GLM-130B在多個(gè)公開評測榜單上超越了GPT-3的性能,支持單張消費(fèi)級推理并且具備跨平臺跨芯片的快速推理能力?;贕LM-130B模型,公司又開發(fā)了6B參數(shù)規(guī)模的雙語對話模型ChatGLM,可以處理多種自然語言任務(wù)(如對話聊天和智能問答),并且支持在單張消費(fèi)級顯卡上推理使用。目前,GLM-130B和ChatGLM均開源,為企業(yè)端客戶提供了更低門檻和更高安全性的應(yīng)用方案。
圖表:ChatGLM-130B及ChatGLM-6B于中文大模型匿名對戰(zhàn)平臺SuperCLUE-瑯琊榜排名均位于前五
注:統(tǒng)計(jì)截至2023年5月29日
資料來源:SuperCLUE-瑯琊榜官網(wǎng),中金公司研究部
圖表:Leaderboard非英文問題測試中,ChatGLM排名第7,以較小參數(shù)達(dá)到高性能
注:統(tǒng)計(jì)截至2023年5月25日
資料來源:lmsys arena Leaderboard,中金公司研究部
向量數(shù)據(jù)庫:構(gòu)建企業(yè)知識庫的必備存儲(chǔ)“大腦”
向量是多模數(shù)據(jù)的壓縮,是AI學(xué)習(xí)的通用數(shù)據(jù)形式。非結(jié)構(gòu)化數(shù)據(jù)通常需要向量化之后才能被AI模型所理解,向量嵌入(vector embedding)是自然語言處理和深度學(xué)習(xí)中常用的數(shù)據(jù)預(yù)處理技術(shù),即將非數(shù)值如文本、圖片、視頻等源數(shù)據(jù)轉(zhuǎn)化為機(jī)器可以理解的多維數(shù)值向量。
圖表:通過嵌入模型將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為機(jī)器可以理解的多維數(shù)值向量
資料來源:Pinecone,中金公司研究部
向量搜索是一種模糊匹配,區(qū)別于傳統(tǒng)的關(guān)鍵詞索引精準(zhǔn)查詢。向量搜索一般采用K近鄰法或近似臨近算法,計(jì)算目標(biāo)對象與數(shù)據(jù)庫中向量嵌入的距離以表示兩者的相似度,排序后返回最為相似的結(jié)果。區(qū)別于傳統(tǒng)數(shù)據(jù)庫的精確索引,向量搜索是一種模糊匹配,輸出的是概率上的最近似答案。
圖表:向量搜索以向量嵌入的距離表征相似度,是一種模糊匹配
資料來源:Google Developers,中金公司研究部
向量數(shù)據(jù)庫是專門用來存儲(chǔ)和查詢向量的數(shù)據(jù)庫。向量數(shù)據(jù)庫即原生面向向量設(shè)計(jì)的、專門用于存儲(chǔ)、管理、查詢、檢索向量的數(shù)據(jù)庫。向量化技術(shù)已較為成熟,也出現(xiàn)了不少開源的向量搜索算法庫(如Facebook的FAISS),但向量數(shù)據(jù)庫提供一種開箱即用的解決方案,在數(shù)據(jù)持久化、實(shí)時(shí)增刪改、分布式計(jì)算、容災(zāi)備份等方面提供更完整的支持,更適合企業(yè)級應(yīng)用。
向量數(shù)據(jù)庫幫助拓展LLM時(shí)空邊界,是企業(yè)知識庫的必備存儲(chǔ)“大腦”。目前向量數(shù)據(jù)庫的核心應(yīng)用場景之一便是拓展LLM的時(shí)空邊界,賦能企業(yè)打造基于專屬知識庫的AI Answer應(yīng)用。
時(shí)間維度上,初始的LLM是基于歷史的通用語料庫訓(xùn)練的,而實(shí)際企業(yè)應(yīng)用場景中需要補(bǔ)充實(shí)時(shí)的、專業(yè)性的知識;空間維度上,LLM的輸入token存在長度限制,因此無法直接將企業(yè)知識庫的全量信息作為prompt一次性輸入,僅需最相關(guān)的部分。
向量數(shù)據(jù)庫和LLM的具體交互過程為:用戶首先將企業(yè)知識庫的全量信息通過嵌入模型轉(zhuǎn)化為向量后儲(chǔ)存在向量數(shù)據(jù)庫中,用戶輸入prompt時(shí),先將其同樣向量化,并在向量數(shù)據(jù)庫中檢索最為相關(guān)的內(nèi)容,再將檢索到的相關(guān)信息和初始prompt一起輸入給LLM模型,以得到最終返回結(jié)果。
圖表:向量數(shù)據(jù)庫和LLM的具體交互過程
資料來源:Pinecone官網(wǎng),星環(huán)科技微信公眾號,中金公司研究部
案例:星環(huán)科技Hippo向量數(shù)據(jù)庫具備多種企業(yè)級特性。目前向量數(shù)據(jù)庫市場參與者以海外初創(chuàng)型公司的開源產(chǎn)品為主,近期一級市場投融資熱度較高。
國內(nèi)大數(shù)據(jù)基礎(chǔ)軟件領(lǐng)軍企業(yè)星環(huán)科技在向量數(shù)據(jù)庫上已有數(shù)年技術(shù)積累,之前主要內(nèi)部自用,今年5月底正式產(chǎn)品化對外發(fā)布為Hippo向量數(shù)據(jù)庫產(chǎn)品,在高可用、高性能、易拓展等方面具備優(yōu)勢,支持多種向量搜索索引,支持?jǐn)?shù)據(jù)分區(qū)分片、數(shù)據(jù)持久化、增量數(shù)據(jù)攝取、向量標(biāo)量字段過濾混合查詢等功能,能夠很好地滿足企業(yè)針對海量向量數(shù)據(jù)的高實(shí)時(shí)性查詢、檢索、召回等場景。
圖表:星環(huán)科技Hippo向量數(shù)據(jù)庫具備多種企業(yè)級特性
資料來源:星環(huán)科技向星力數(shù)據(jù)技術(shù)峰會(huì),中金公司研究部
應(yīng)用場景和未來展望:企業(yè)內(nèi)部知識庫有望重構(gòu)
知識管理平臺:幫助B端客戶實(shí)現(xiàn)內(nèi)部知識庫重構(gòu)
知識管理平臺重新整合內(nèi)部知識,助力B端客戶打造AI Answer應(yīng)用。我們認(rèn)為企業(yè)知識庫有望成為AI Answer在B端的先行落地形式,目前我們觀察到第四范式、星環(huán)科技、云知聲、創(chuàng)新奇智、中科聞歌、鼎捷軟件等廠商均具備了基于企業(yè)內(nèi)部知識打造知識庫的能力。
圖表:第四范式“式說2.0”具備企業(yè)級知識庫結(jié)合Copilot能力,從單一入口實(shí)現(xiàn)多個(gè)功能的集合
資料來源:智東西,中金公司研究部
圖表:星環(huán)科技Sophon KG提供一站式知識全生命周期管理平臺,賦能各行業(yè)企業(yè)的問答、搜索、推薦環(huán)節(jié)
資料來源:星環(huán)科技產(chǎn)品白皮書,中金公司研究部
圖表:云知聲結(jié)合私域數(shù)據(jù)和大模型提供企業(yè)定制智能產(chǎn)品,打造大規(guī)模企業(yè)級“新版Bing”
資料來源:云知聲2023AIGC戰(zhàn)略發(fā)布會(huì),中金公司研究部
圖表:創(chuàng)新奇智基于內(nèi)部業(yè)務(wù)數(shù)據(jù)知識打造 “奇智孔明AInnoGC”,讓企業(yè)擁有基于私域數(shù)據(jù)的AI生成能力
資料來源:創(chuàng)新奇智官方公眾號,中金公司研究部
圖表:中科聞歌“雅意”大模型具備5大核心能力,可快速對接政府、企業(yè)數(shù)據(jù)并一鍵生成企業(yè)級專屬應(yīng)用服務(wù)
資料來源:雅意大模型發(fā)布會(huì),中金公司研究部
圖表:鼎捷軟件推出基于GPT的企業(yè)知識PaaS平臺MERITS,其中ChatFile能夠?qū)崿F(xiàn)知識問答能力
資料來源:鼎新電腦x微軟Azure OpenAI戰(zhàn)略合作發(fā)布會(huì),中金公司研究部
企業(yè)管理軟件:整合企業(yè)知識和管理流程,OA有望落地先行
OA有望成為企業(yè)管理軟件領(lǐng)域AI Answer先行落地場景。知識管理是OA的新興模塊,其主要用于企業(yè)內(nèi)部文檔和知識資料的存儲(chǔ)和管理,目前泛微、致遠(yuǎn)、藍(lán)凌等頭部OA廠商均推出了知識管理類產(chǎn)品(如泛微采知連、致遠(yuǎn)知識管理解決方案、藍(lán)凌知識管理平臺等),而現(xiàn)階段知識管理模塊主要為知識存儲(chǔ),并通過簡單的搜索功能實(shí)現(xiàn)知識提取,企業(yè)應(yīng)用效率低下。
我們認(rèn)為AI有望助力知識管理能夠進(jìn)行全方位升級,通過第三方大模型賦能實(shí)現(xiàn)AI Answer,真正將企業(yè)知識靈活運(yùn)用,進(jìn)一步激勵(lì)企業(yè)員工充實(shí)知識庫并提高其使用效率。
? 泛微網(wǎng)絡(luò):千里聆&采知連&小E助手實(shí)現(xiàn)知識的管理和問答。泛微千里聆基于RPA(機(jī)器人流程自動(dòng)化)和NLP(自然語言處理)技術(shù),具備信息采集功能;采知連未知識管理領(lǐng)域?qū)m?xiàng)產(chǎn)品,實(shí)現(xiàn)文檔管理、知識倉庫、知識運(yùn)營;小E智能語音輔助系統(tǒng)能夠?qū)崿F(xiàn)智能助理、知識問答、數(shù)據(jù)查詢、業(yè)務(wù)處理等功能。我們認(rèn)為未來公司產(chǎn)品有望與大模型實(shí)現(xiàn)深度融合,期待大模型融合后的企業(yè)協(xié)同管理應(yīng)用推出。
? 致遠(yuǎn)互聯(lián):AICOP助力實(shí)現(xiàn)“智能協(xié)同”。6月12日,致遠(yuǎn)互聯(lián)發(fā)布智能協(xié)同應(yīng)用AICOP的視頻演示,展示了智能協(xié)同助手“小致”在預(yù)訂會(huì)議、準(zhǔn)備會(huì)議資料、生成報(bào)告&文稿&會(huì)議紀(jì)要、填寫表單、發(fā)起流程等場景的賦能應(yīng)用。
圖表:致遠(yuǎn)互聯(lián)AICOP打通企業(yè)知識庫和流程管理,實(shí)現(xiàn)“智能協(xié)同”
資料來源:致遠(yuǎn)互聯(lián)微信公眾號,中金公司研究部
ERP 中 AI Answer落地展望:大模型助力下AI Answer 賦能生產(chǎn)流程管理。與OA相比,ERP與業(yè)務(wù)和生產(chǎn)聯(lián)系更緊密且具有更明顯的行業(yè)屬性,在業(yè)務(wù)運(yùn)行過程ERP沉淀的行業(yè)垂類數(shù)據(jù)有望助力大模型的訓(xùn)練。海外微軟的Dynamics 365 Copilot展示了客服、市場、供應(yīng)鏈管理等場景的AI賦能應(yīng)用;國內(nèi)對標(biāo)來看,用友網(wǎng)絡(luò)深耕ERP多年布局二十余個(gè)行業(yè)并積累了各行業(yè)豐富的用戶授權(quán)數(shù)據(jù),公司計(jì)劃后續(xù)將通過和通用大模型廠商合作+自研結(jié)合的方式進(jìn)一步訓(xùn)練企業(yè)服務(wù)大模型,期待大模型賦能下AI Answer在財(cái)務(wù)、人力、采購、制造、營銷等領(lǐng)域場景落地。
文檔整理&搜索引擎:面向個(gè)人和中小組織的知識檢索應(yīng)用
釘釘有望為中小組織和個(gè)人構(gòu)建“知識圖譜”。2023年6月,釘釘AI正式邀請測試,其展示了AI+文檔、AI+群聊、AI+應(yīng)用、AI+問答機(jī)器人等功能。其中AI+問答機(jī)器人能夠接收用戶主動(dòng)上傳特定的文檔數(shù)據(jù),生成特定場景的問答機(jī)器人,并作為專業(yè)模型實(shí)現(xiàn)更有效、準(zhǔn)確的AI問答。我們認(rèn)為這類功能為中小型組織和個(gè)人快速構(gòu)建知識庫,實(shí)現(xiàn)知識的沉淀和應(yīng)用。
WPS、印象筆記等文檔類軟件有望基于用戶端海量文檔實(shí)現(xiàn)AI Answer。我們認(rèn)為WPS、印象筆記等文檔類軟件作為文檔沉淀的平臺,具備天然接入AI大模型的應(yīng)用條件。如印象筆記的“知識星圖”功能,能夠借助AI語義分析產(chǎn)生知識圖譜和知識網(wǎng)絡(luò),實(shí)現(xiàn)信息的高效收集和利用。我們認(rèn)為文檔類軟件有望在B端和C端幫助用戶更好地基于平臺沉淀的文檔實(shí)現(xiàn)AI Answer。
圖表:釘釘能夠基于用戶上傳的文檔生成問答機(jī)器人
資料來源:量子位公眾號,中金公司研究部
圖表:Perplexity基于OpenAI API 可以與用戶進(jìn)行交互式的對話,并提供實(shí)時(shí)的信息及對應(yīng)出處
資料來源:Perplexity網(wǎng)頁,中金公司研究部
垂類場景:各行業(yè)知識應(yīng)用有望百花齊放
各個(gè)細(xì)分行業(yè)積累的大量知識有望在大模型賦能下實(shí)現(xiàn)歸集,賦能千行百業(yè)。如醫(yī)療行業(yè)的衛(wèi)寧健康、保險(xiǎn)行業(yè)的新致軟件、教育行業(yè)的科大訊飛均憑借過去在垂類行業(yè)的深耕,借助大模型實(shí)現(xiàn)知識的賦能應(yīng)用。展望未來,我們期待更多行業(yè)能夠在大模型賦能下實(shí)現(xiàn)行業(yè)知識萃取,各行業(yè)知識應(yīng)用有望百花齊放。
圖表:衛(wèi)寧健康推出醫(yī)療垂類模型WiNGPT賦能問診、報(bào)告生成等場景,未來計(jì)劃以Copilot形式融入WiNEX
注:公司預(yù)計(jì)WiNEX Copilot產(chǎn)品將于2023年10月Winning World2023大會(huì)上正式發(fā)布
資料來源:衛(wèi)寧健康微信公眾號,中金公司研究部
圖表:新致軟件Newtouch AI將企業(yè)數(shù)據(jù)與生成式AI模型連接,幫助企業(yè)快速構(gòu)建機(jī)器人應(yīng)用
資料來源:新致AI微信公眾號,中金公司研究部
圖表:科大訊飛將硬件產(chǎn)品搭載星火大模型,AI學(xué)習(xí)機(jī)通過分析用戶學(xué)情和知識圖譜提供類人引導(dǎo)式輔學(xué)
資料來源:科大訊飛AI學(xué)習(xí)助手視頻號,中金公司研究部
圖表:AI Answer相關(guān)公司一覽
資料來源:各公司官網(wǎng),中金公司研究部
本文作者:于鐘海、 魏鸛霏 、王之昊 、韓蕊 、胡安琪、譚哲賢,來源:中金點(diǎn)睛,原文標(biāo)題:《AI Answer:大模型助力B端落地先行范式》
于鐘海 SAC 執(zhí)證編號:S0080518070011 SFC CE Ref:BOP246
魏鸛霏 SAC 執(zhí)證編號:S0080523060019 SFC CE Ref:BSX734
王之昊 SAC 執(zhí)證編號:S0080522050001 SFC CE Ref:BSS168
韓蕊 SAC 執(zhí)證編號:S0080121080059
胡安琪 SAC 執(zhí)證編號:S0080122070070
譚哲賢 SAC 執(zhí)證編號:S0080122070047
關(guān)鍵詞: