全球速看:BloombergGPT來了!金融大模型應(yīng)用加快將帶來哪些產(chǎn)業(yè)鏈機遇?
近期根據(jù)彭博社最新發(fā)布的報告顯示,其構(gòu)建迄今為止最大的特定領(lǐng)域數(shù)據(jù)集,并訓(xùn)練了專門用于金融領(lǐng)域的LLM,開發(fā)了擁有500億參數(shù)的語言模型——BloombergGPT。
受到消息影響,金證股份午后漲停,同花順漲超16%,頂點軟件直線拉升觸及漲停,古鰲科技、東方財富、財富趨勢均漲超10%。
這款金融大模型的應(yīng)用將實現(xiàn)哪些驚人的功能?相關(guān)金融業(yè)公司是否將受益于大模型的應(yīng)用而實現(xiàn)降本增效?產(chǎn)業(yè)鏈機遇有哪些?本文將詳細解析。
(資料圖片僅供參考)
金融大模型開發(fā)與應(yīng)用難度均不大
據(jù)《BloombergGPT: A Large Language Model for Finance》一文中所述, BloombergGPT和 OpenAI GPT模式一樣,也是基于 Transformer架構(gòu)的,采用的是只有譯碼器的技術(shù)路線。通過比較, BloombergGPT模型參數(shù)為500億,在GPT-2 (1.5億)和GPT-3 (1750億)之間。
不同之處在于,為了加強 LLM對金融垂直領(lǐng)域的專業(yè)理解, Bloomberg構(gòu)建了目前規(guī)模最大的金融數(shù)據(jù)集 FINPILE,通過對通用文本+金融知識的混合訓(xùn)練,使得 BloombergGPT在執(zhí)行金融任務(wù)方面的表現(xiàn)超過了現(xiàn)有的通用 LLM模型,而在通用場景方面的表現(xiàn)則與現(xiàn)有的通用 LLM模型基本持平。
GPT-3和GPT-4等大型語言模型都是由專業(yè)的人工智能團隊開發(fā)出來的,而且模型的訓(xùn)練對計算能力的要求很高。BloombergGPT的成功驗證了“開放源代碼模型+優(yōu)質(zhì)垂直數(shù)據(jù)”的思路,為基于垂直數(shù)據(jù)構(gòu)建大語言模型提供了可能。
大量的、高質(zhì)量的垂直領(lǐng)域知識可以彌補模型在規(guī)模上的不足。通過對 BloombergGPT和GPT-3的對比,雖然 BloombergGPT的模型參數(shù)相對于GPT-3來說是比較小的,但是由于 BloombergGPT的預(yù)訓(xùn)練數(shù)據(jù)增加了大量的高質(zhì)量的金融數(shù)據(jù),并且對預(yù)訓(xùn)練數(shù)據(jù)進行了一系列的清洗和標注,所以 BloombergGPT在通用性和GPT-3基本持平的前提下,實現(xiàn)了對金融垂直能力的大幅提升。
算法方面,作者也有計劃披露他們訓(xùn)練BloombergGPT的細節(jié)方法;算力方面,約使用512塊40GB的A100 GPU,在訓(xùn)練過程中備份了4個模型,每個模型分了128塊GPU。從這個角度出發(fā)來看,無論是數(shù)據(jù)、算法、還是算力,國內(nèi)頭部金融科技公司都是可復(fù)制、可追趕的。
金融GPT投資機遇或蓄勢待發(fā)
在 BloombergGPT的成功案例中,訓(xùn)練數(shù)據(jù)是影響大規(guī)模語言模型性能的一個重要因素。
其原因主要有三點:第一,在金融垂直領(lǐng)域的數(shù)據(jù)輸入中, BloombergGPT成功地形成了對金融知識的理解,變得更加專業(yè);二是 BloombergGPT模型的參數(shù)雖然有所縮減,但其通用性和垂直性依然很強,這說明當(dāng)參數(shù)尺度一定時,高質(zhì)量的數(shù)據(jù)才是決定模型性能的關(guān)鍵因素;三是 Bloomberg在文章中明確表示,為了避免數(shù)據(jù)泄露, Bloomberg GPT將采用和 OpenAI一樣的封閉源碼,這也從側(cè)面證明了 Bloomberg GPT所擁有的原始源碼是各大模型爭奪的關(guān)鍵。
作為一家不以人工智能為核心的金融垂直領(lǐng)域企業(yè),Bloomberg為金融 GPT的發(fā)展提供了一個可借鑒的范例。金融 IT廠商擁有豐富的金融垂直知識和現(xiàn)有的人工智能產(chǎn)品布局,以高質(zhì)量的金融數(shù)據(jù)和開源的大語言模型為基礎(chǔ),同樣有機會打造出一個專屬于金融場景的大語言模型,從而實現(xiàn)大語言模型在金融場景中的有效賦能,讓大語言模型成為底層的人工智能操作系統(tǒng)。
在應(yīng)用中,金融GPT落地場景有:
1)新聞的情緒傾向性分析和內(nèi)容創(chuàng)造。它能幫助金融機構(gòu)判斷市場對某一事件的看法,并幫助他們進行量化策略、投資決策;
2)財務(wù)類知識問答和股票代碼配對。能夠輔助金融機構(gòu)進行信用評估,輔助投資人篩選新聞相關(guān)概念股,輔助分析師進行領(lǐng)域知識學(xué)習(xí),提升資料閱讀效率等。
3)財務(wù)報表分析和會計稽核的幫助.能夠輔助金融機構(gòu)生成基礎(chǔ)的財務(wù)分析報告和招股書,輔助投研人員報表配平,輔助會計和審計方面的工作。
很多中國的金融科技公司已經(jīng)在落地大模型的應(yīng)用。
同花順在2015年前后便推出人工智能應(yīng)用,在2019年更是選擇“All in AI”,公司目前的AI技術(shù)涵蓋自然語言處理技術(shù)、知識圖譜技術(shù)和虛擬人等六大技術(shù)。
恒生電子在公開平臺上表示將充分挖掘?qū)υ捠秸Z言模型技術(shù)在金融業(yè)務(wù)場景中的應(yīng)用潛力,通過集成“文心一言”的技術(shù)能力,在投研、投顧、營銷、客服、運營、風(fēng)控等金融各類業(yè)務(wù)場景開展人工智能大模型技術(shù)應(yīng)用,為金融機構(gòu)提供全場景人工智能解決方案及服務(wù),持續(xù)提升國內(nèi)金融機構(gòu)數(shù)智化發(fā)展水平。
國金證券建議關(guān)注同花順、恒生電子、財富趨勢、頂點軟件和凌志軟件等有金融大模型基礎(chǔ)的公司。
關(guān)鍵詞: