語料模型將遇瓶頸?CV機(jī)器視覺或成破局點 世界看熱訊
近期,得益于各大AI模型對于數(shù)據(jù)需求的提升,以及Reddit等宣布將向聊天機(jī)器人公司收取數(shù)據(jù)使用費等催化,A股數(shù)據(jù)要素/知識產(chǎn)權(quán)/出版?zhèn)髅桨鍓K連續(xù)大漲。
(資料圖)
但另一方面,國信證券分析師提出,由于人類的自然語義數(shù)據(jù)是有限的,GPT3訓(xùn)練量是40t語義訓(xùn)練量,GPT4外界有人推測超過了400t的數(shù)據(jù)量,再往后模型參數(shù)越來越大,所需要的數(shù)據(jù)量也越來越大。人類現(xiàn)有知識馬上就用完了,GPT5可能是NLP這個模態(tài)最近幾年的一個天花板。
其表示,未來各大廠商發(fā)力點可能在應(yīng)用的落地、算力的提升以及“潛在空間非常大”的CV+機(jī)器視覺。
資料顯示,AI預(yù)訓(xùn)練模型有NLP、CV、多模態(tài)等。
國信證券指出,其中“CV機(jī)器視覺因為模型參數(shù)小,開源,全球語義庫十倍于NLP文本。目測國內(nèi)的爆發(fā),第一批會在5-6月份看到用在生產(chǎn)上,到了四季度會有大量公司引入工作流程,極大提升效率,行業(yè)不局限于TMT?!?/p>
此前文章我們跟大家聊過了CV(計算機(jī)視覺),這里跟大家重點聊聊機(jī)器視覺。
什么是機(jī)器視覺?
機(jī)器視覺通俗地講,就是用機(jī)器代替人眼來做測量和判斷,其作業(yè)過程一般是兩個步驟,首先利用光源、鏡頭、工業(yè)相機(jī)來負(fù)責(zé)圖片采集,將被檢測的目標(biāo)轉(zhuǎn)換成圖像信號。
然后圖像處理系統(tǒng)根據(jù)像素分布與亮度、顏色等信息,轉(zhuǎn)變成數(shù)字信號,然后再對這些信號進(jìn)行各種運算來抽取目標(biāo)的特征,進(jìn)而實現(xiàn)自動識別功能。
相對于人眼,機(jī)器視覺在速度、精度、環(huán)境要求、連續(xù)工作時間等方面均存在顯著優(yōu)勢。
機(jī)器視覺和計算機(jī)視覺的區(qū)別?
首先明確,機(jī)器視覺和計算機(jī)視覺都是人工智能的下屬科目,都是利用圖像處理、模式識別、人工智能等技術(shù),對圖像進(jìn)行分析和理解。但是,兩者的側(cè)重點和應(yīng)用場景不同。
機(jī)器視覺主要應(yīng)用在工業(yè)領(lǐng)域,比如工業(yè)檢測、自動化控制、智能制造等。而計算機(jī)視覺主要應(yīng)用在偏消費領(lǐng)域,比如人臉識別、行為分析、醫(yī)學(xué)圖像、地圖導(dǎo)航等。
目前機(jī)器視覺主要的應(yīng)用場景有電子設(shè)備及半導(dǎo)體、汽車、制藥、食品包裝等。其中,電子及半導(dǎo)體設(shè)備占約46.60%,主要應(yīng)用在高精度的制造和檢測,如晶圓切割、3C表面檢測、AOI光學(xué)檢測、PCB印刷電路等。汽車制造是機(jī)器視覺應(yīng)用的第二大場景,約占15.3%左右,幾乎所有系統(tǒng)和部件的制造都可用到機(jī)器視覺。
據(jù)招銀國際研報,相較于上千億參數(shù)的NLP模型相比,CV模型規(guī)模要小兩三個數(shù)量級,現(xiàn)階段比較有名的CV大模型包括微軟的swin-transformer系列,谷歌的ViT系列以及有150億參量的V-MOE模型。國內(nèi)方面,截止2021年,商湯訓(xùn)練了300億參數(shù)的CV模型,2022年華為也發(fā)布了30億參數(shù)的盤古系列CV模型。
上文提到,CV機(jī)器視覺因為模型參數(shù)小,開源,全球語義庫十倍于NLP文本。目測國內(nèi)的爆發(fā),第一批會在5-6月份看到用在生產(chǎn)上。
華安證券也表示,CV模型參數(shù)量通常較小,且語料庫不存在中英文差異,值得關(guān)注。
多重因素疊加,機(jī)器視覺百億藍(lán)海市場
申萬宏源表示,短中長期多重因素推動機(jī)器視覺市場需求快速提升,預(yù)計2025年市場規(guī)模突破390億。
1)從長期來看,未來人口老齡化及勞動力價格上漲將帶來機(jī)器替人剛需,機(jī)器視覺設(shè)備將逐步代替人工。
2)從中期來看,機(jī)器視覺下游應(yīng)用廣闊,滲透率持續(xù)提升,3C領(lǐng)域:終端客戶對機(jī)器視覺需求從手機(jī)擴(kuò)展至平板、耳機(jī)、手表等;鋰電領(lǐng)域:除攪拌外,在涂布、輥壓、卷繞、入殼等各工序都有機(jī)器視覺應(yīng)用,且視覺技術(shù)同樣適用于4680等新電池;半導(dǎo)體、光伏等領(lǐng)域:晶圓缺陷檢測設(shè)備、光伏硅片分選設(shè)備等需求提升顯著。
3)從短期來看,制造業(yè)固定資產(chǎn)開支回暖、國產(chǎn)化加速,將加速機(jī)器視覺設(shè)備需求釋放。依據(jù)中國機(jī)器視覺產(chǎn)業(yè)聯(lián)盟數(shù)據(jù),預(yù)計未來市場規(guī)模保持25%增長,2025年突破390億。
相關(guān)產(chǎn)業(yè)鏈
產(chǎn)業(yè)鏈方面,機(jī)器視覺上游主要是機(jī)器視覺底層開發(fā)商,即核心零部件(光源、相機(jī)、鏡頭、圖像采集卡等)及軟件提供商(圖像處理軟件)且其二者占據(jù)了機(jī)器視覺80%的比例,是產(chǎn)業(yè)鏈中絕對的核心環(huán)節(jié)和價值獲取者。
中游是二次開發(fā)的系統(tǒng)集成和軟件服務(wù)商,主要根據(jù)上游產(chǎn)品以及下游需求進(jìn)行集成整合,越來越多上游企業(yè)向中游業(yè)務(wù)擴(kuò)展延伸,形成自有的完整解決方案。
下游則是主要應(yīng)用領(lǐng)域,涉及到多種制造及服務(wù)行業(yè),主要應(yīng)用于汽車制造、消費電子、食品包裝、醫(yī)療制藥以及服務(wù)機(jī)器人。
其中,光源是國產(chǎn)化最為充分的環(huán)節(jié);鏡頭的話,高端的部分主要依賴進(jìn)口;工業(yè)相機(jī)以歐美進(jìn)口為主;圖像采集卡國內(nèi)發(fā)展較為完善和成熟,圖像處理軟件則基本被國外企業(yè)壟斷,國內(nèi)企業(yè)在二次開發(fā)中有所布局。
風(fēng)險提示及免責(zé)條款 市場有風(fēng)險,投資需謹(jǐn)慎。本文不構(gòu)成個人投資建議,也未考慮到個別用戶特殊的投資目標(biāo)、財務(wù)狀況或需要。用戶應(yīng)考慮本文中的任何意見、觀點或結(jié)論是否符合其特定狀況。據(jù)此投資,責(zé)任自負(fù)。關(guān)鍵詞: