【獨家焦點】醫(yī)渡科技(02158)正研發(fā)醫(yī)療大模型,將擇機(jī)邀請測試
【資料圖】
近期業(yè)界傳言的“醫(yī)渡科技正研發(fā)醫(yī)療大模型”在7月3日得到了證實,醫(yī)渡科技(02158)首席技術(shù)官、首席人工智能科學(xué)家閆峻在該公司2023財年業(yè)績發(fā)布會上確認(rèn)了這一消息。
閆峻表示,公司在大語言模型的訓(xùn)練和面向場景的調(diào)優(yōu)上早有布局,也做了很大投入。醫(yī)渡科技的“醫(yī)療智能大腦“YiduCore一直在自然語言處理領(lǐng)域深耕,語言模型的訓(xùn)練也一直是其中很重要的組成部分。從整個技術(shù)鏈來看,大語言模型并非新鮮事物,未來的大模型訓(xùn)練數(shù)據(jù)規(guī)模更大,并且要針對一些特定場景進(jìn)行調(diào)優(yōu),這樣才能解決很多的實際問題。
大語言模型的訓(xùn)練和調(diào)優(yōu)對數(shù)據(jù)、算力和算法以及工程都有著極高的要求。在數(shù)據(jù)層面,醫(yī)渡科技正在注入更多的專業(yè)知識型數(shù)據(jù)。相比之前,公司對這些知識型數(shù)據(jù)的表達(dá)方式做了很多精細(xì)化加工與處理,并使用了課程學(xué)習(xí)等手段。在計算資源上,公司也重點增強(qiáng)了算力,用以支持從之前幾億參數(shù),到幾十億參數(shù)乃至幾百億參數(shù)的模型。
閆峻還介紹到,醫(yī)療健康垂直領(lǐng)域與開放領(lǐng)域有著很大的不同。對于醫(yī)療健康垂直領(lǐng)域而言,其下游任務(wù)相對比較明確,因此參數(shù)規(guī)模和要解決下游任務(wù)上存在一個性價比的平衡點。
在以傳統(tǒng)方法為基礎(chǔ)的模型算法和工程經(jīng)驗上,醫(yī)渡科技已有大量積累。在模型規(guī)模放大的過程中,公司還在持續(xù)針對下游任務(wù)調(diào)優(yōu)投入大量精力。
閆峻強(qiáng)調(diào),由于醫(yī)療健康領(lǐng)域的嚴(yán)肅性,在這一垂直領(lǐng)域的大模型訓(xùn)練過程中,對于專業(yè)性和信息安全等多方面要求都非常高,需要從業(yè)者心懷敬畏并以謹(jǐn)慎的態(tài)度去提供服務(wù)。
比如,在眾多開放領(lǐng)域遇到的問題,機(jī)器提供的答案能夠達(dá)到70-80分便可達(dá)到應(yīng)用水平;但對于醫(yī)療健康領(lǐng)域而言,下游任務(wù)要求足夠的專業(yè)性和模型的精準(zhǔn)度,而且要同時確保信息安全,做到95分甚至更高才能達(dá)到真正的應(yīng)用水平。因此,需要更多的時間補(bǔ)充知識及測試調(diào)優(yōu)。
智通財經(jīng)APP了解到,醫(yī)渡科技將于近期在適當(dāng)?shù)臅r間針對部分目標(biāo)場景推出小范圍邀請測試,所涉及場景將包括內(nèi)部生產(chǎn)效率提升,面向當(dāng)前業(yè)務(wù)產(chǎn)品的智能化升級,以及提供對患者的新服務(wù)能力,也不排除對行業(yè)中的科研及商業(yè)機(jī)構(gòu)開放提供專業(yè)醫(yī)療垂直領(lǐng)域大模型服務(wù)的可能。
關(guān)鍵詞: