00后華人大模型創(chuàng)業(yè),組隊(duì)7人挑戰(zhàn)langchain,硅谷頂級創(chuàng)始人給了天使投資
沒錯(cuò),Cortex就是這樣一個(gè)項(xiàng)目,被曝還拿下了Zoom系,Getty家族和快手系的天使投資。
這是一個(gè)集成諸多大模型API后,讓大模型更懂你的中間件。
(資料圖片僅供參考)
主打特色有二:
一是外接私有數(shù)據(jù),包括Notion、Slack、Google Drive等,做特定領(lǐng)域的私有版GPT;
另一件事是在每個(gè)企業(yè)內(nèi)部,打造千人千面的Copilot。
這個(gè)工具在國外已經(jīng)小小火了一把,目前擁有10多家付費(fèi)用戶和上千個(gè)人用戶。
還有家網(wǎng)紅SaaS公司用上了Cortex,讓網(wǎng)紅們以特定的人設(shè),和粉絲們激情熱聊。
所謂大模型中間件,是在底層大模型和上層應(yīng)用之間的基礎(chǔ)軟件,主要解決大模型落地過程中,集成數(shù)據(jù)、應(yīng)用、知識庫,以及大模型融合級功能協(xié)同這些問題。
比較適合那種正面臨兩難境地,又想在大模型領(lǐng)域試水的旁友們:
自己造一個(gè)通用大模型,又貴又麻煩;那單純訓(xùn)更垂直的行業(yè)大模型,或者調(diào)用別人家的大模型的API呢?好像又有些不夠用。
這個(gè)時(shí)候,中間件帶著解決方案閃亮登場了。
隨著大模型領(lǐng)域的愈發(fā)深入,大模型中間件的創(chuàng)業(yè)項(xiàng)目也先后冒了出來。能入硅谷頂級創(chuàng)始人青眼,Cortex憑借的是什么?
Cortex能夠做什么?
Cortex,可以將GPT-4等多個(gè)不同的大模型組合使用,實(shí)現(xiàn)語言模型之間的協(xié)同應(yīng)用。
也就是說,它是個(gè)大模型應(yīng)用層的編排器。
主要目的是提高技術(shù)人員開發(fā)的“可拓展性、可訪問性和效率”。
之所以叫Cortex,是取這個(gè)英文單詞“大腦皮層”的意思。
大腦是神經(jīng)中樞,可以看做大模型,而皮層就是大腦上面的結(jié)構(gòu)。
它能做的事情,就是按需調(diào)用不同的大模型,并用固定的格式來限制輸出的自由度,從而幫助用戶做些單一大模型解決不了,或自己調(diào)用多個(gè)大模型API會比較麻煩的事情。
具體而言,它的功能主要是以下兩方面:
第一,作為集成許多API的工具,外接私有數(shù)據(jù)庫,“指哪兒打哪兒”地變成一個(gè)專一領(lǐng)域大模型。
從這個(gè)角度來看,Cortex走的是既“廣”又“深”的路子。
廣,是說Cortex不與個(gè)別行業(yè)服務(wù)競爭,而是可以每個(gè)領(lǐng)域都用它練出大模型應(yīng)用。
深,是說在大模型通用知識基礎(chǔ)上,可以接入私有數(shù)據(jù)庫,加深對領(lǐng)域或用戶企業(yè)本身的理解。
為了讓這個(gè)專一領(lǐng)域大模型更實(shí)用,Cortex會采取調(diào)用向量數(shù)據(jù)、實(shí)時(shí)聯(lián)網(wǎng)搜索、調(diào)用指定API等方式。
Cortex的第二個(gè)功能,是能幫助每個(gè)人打造一個(gè)私人copilot。
基礎(chǔ)層面的工作,如撰寫草稿、制作PPT、編寫電郵、總結(jié)會議、查詢網(wǎng)購?fù)素浄绞?,Cortex都能搞定。
進(jìn)一步的,在同一公司內(nèi)部,喂給它一份原始的信息,Cortex也能獲取每個(gè)人崗位所需要的關(guān)鍵點(diǎn),并以特定格式輸出,即根據(jù)業(yè)務(wù)部門的不同而“千人千面”。
據(jù)了解,Cortex的費(fèi)用根據(jù)實(shí)際使用量計(jì)算。
就計(jì)費(fèi)方式和服務(wù)模式而言,Cortex似乎可以類比為鏈接數(shù)據(jù)庫和大模型的“云廠商”,聚集多種多樣的API資源后,保證所有的功能都能一直運(yùn)作,提供相關(guān)服務(wù)。
也因?yàn)槿绱耍珻ortex還蠻受開發(fā)人員的歡迎——Cortex主要面向的就是有一定技術(shù)基礎(chǔ)的開發(fā)者和IT從業(yè)人員,他們可以很快上手,大大減少從調(diào)試開始的工作量,節(jié)省時(shí)間去做更有創(chuàng)造性的事情。
對不擅長寫prompt的程序員格外友好
為什么會選擇做這樣一個(gè)功能的大模型中間件?為了弄清楚答案,量子位聯(lián)系了Cortex背后的團(tuán)隊(duì)。
他們給出的答案是,因?yàn)?strong>相信未來一定是一個(gè)多模態(tài)、多模型的世界。如果只有一個(gè)模型,哪怕強(qiáng)大如GPT-4,也無法搞定所有問題。
他們認(rèn)為,必須“把多個(gè)模型聯(lián)系在一起,才能組織一個(gè)真正的AI應(yīng)用”。
而這樣的功能實(shí)現(xiàn),在團(tuán)隊(duì)核心成員初期想用Langchain去做的時(shí)候,“越做越發(fā)現(xiàn)非常困難”,AI領(lǐng)域目前缺少一個(gè)幫助模型層和應(yīng)用層磨合的中間件來完成它的建設(shè)。
Cortex背后團(tuán)隊(duì)的創(chuàng)始成員Nemo Yang對量子位表示:
不管已有的平臺還是工具能夠提供的能力,都無法很好地滿足這樣的idea。
團(tuán)隊(duì)最初也走過其他路子,但隨著對領(lǐng)域的了解,聽到越來越多的用戶反饋稱,大模型挺好用的,但是出一個(gè)厲害的大模型就要接入一個(gè)API太過麻煩,對大模型調(diào)控性的掌握也比較困難。
受到這樣的啟發(fā),Cortex才逐步打磨成了今天的樣子。
Cortex的成形大概離不開用戶對市場現(xiàn)狀的一個(gè)反饋,在與量子位的交流中,Nemo反復(fù)多次提到“用戶說”“市場反饋”這樣的字樣,然后解釋Cortex是如何根據(jù)這些信息來捏出產(chǎn)品的特點(diǎn)的。
比如隨著大模型大火而愈發(fā)走到眾人面前的向量數(shù)據(jù)庫,就有市場反饋如果對上下文關(guān)聯(lián)很強(qiáng)的文章進(jìn)行向量分割,檢索匹配后返回的答案,可能因?yàn)橥词ι舷挛牡睦斫舛安恢^”。
根據(jù)這一點(diǎn),Cortex調(diào)用的向量數(shù)據(jù)庫是完全自研的,可以根據(jù)需要全局檢索,也可以選擇一段一段地部分返回。
再比如,身為團(tuán)隊(duì)里“語文底蘊(yùn)最好”的人,Nemo實(shí)操下來還是覺得,對程序員來說,prompt engineering看上去簡單,其實(shí)要出色完成并不容易。
所以Cortex有個(gè)設(shè)計(jì)對不擅長撰寫prompt的開發(fā)者極其友好:
能夠讓擅長寫prompt的同事啥的,加入工作流程,讓Cortex更清晰地了解你需要什么。
之后還會有什么功能上新呢?
Nemo介紹,接下來大概率會接入Slack confluence、 Microsoft全家桶、 Google全家桶等。
一切為了一個(gè)最終目的,那就是Developer first,盡可能減少開發(fā)者的開發(fā)周期。
團(tuán)隊(duì)介紹
Cortex背后的公司叫做Kinesys AI,目前團(tuán)隊(duì)7人全職,2名創(chuàng)始人均為華人,多人從斯坦福本碩畢業(yè)。
創(chuàng)始人兼CEO,Nemo Yang,00后,花了2年時(shí)間,拿下佐治亞理工學(xué)院本碩學(xué)位,ML出身,之前在字節(jié)飛書和微軟工作過。
14歲的時(shí)候,Nemo就因?yàn)橄矚g計(jì)算機(jī),只身前往硅谷留學(xué)。高中起,他開始寫網(wǎng)站和App,參與過startup的開發(fā)工作。
聯(lián)合創(chuàng)始人兼CTO,Jian Cai,畢業(yè)于北京大學(xué)計(jì)算機(jī)系,曾在Google工作8年。
他的上一份創(chuàng)業(yè)項(xiàng)目是在線協(xié)作辦公文檔“一起寫”,后來被快手收購。
關(guān)鍵詞: