語料模型將遇瓶頸?CV機器視覺或成破局點 世界看熱訊
近期,得益于各大AI模型對于數據需求的提升,以及Reddit等宣布將向聊天機器人公司收取數據使用費等催化,A股數據要素/知識產權/出版傳媒板塊連續大漲。
(資料圖)
但另一方面,國信證券分析師提出,由于人類的自然語義數據是有限的,GPT3訓練量是40t語義訓練量,GPT4外界有人推測超過了400t的數據量,再往后模型參數越來越大,所需要的數據量也越來越大。人類現有知識馬上就用完了,GPT5可能是NLP這個模態最近幾年的一個天花板。
其表示,未來各大廠商發力點可能在應用的落地、算力的提升以及“潛在空間非常大”的CV+機器視覺。
資料顯示,AI預訓練模型有NLP、CV、多模態等。
國信證券指出,其中“CV機器視覺因為模型參數小,開源,全球語義庫十倍于NLP文本。目測國內的爆發,第一批會在5-6月份看到用在生產上,到了四季度會有大量公司引入工作流程,極大提升效率,行業不局限于TMT。”
此前文章我們跟大家聊過了CV(計算機視覺),這里跟大家重點聊聊機器視覺。
什么是機器視覺?
機器視覺通俗地講,就是用機器代替人眼來做測量和判斷,其作業過程一般是兩個步驟,首先利用光源、鏡頭、工業相機來負責圖片采集,將被檢測的目標轉換成圖像信號。
然后圖像處理系統根據像素分布與亮度、顏色等信息,轉變成數字信號,然后再對這些信號進行各種運算來抽取目標的特征,進而實現自動識別功能。
相對于人眼,機器視覺在速度、精度、環境要求、連續工作時間等方面均存在顯著優勢。
機器視覺和計算機視覺的區別?
首先明確,機器視覺和計算機視覺都是人工智能的下屬科目,都是利用圖像處理、模式識別、人工智能等技術,對圖像進行分析和理解。但是,兩者的側重點和應用場景不同。
機器視覺主要應用在工業領域,比如工業檢測、自動化控制、智能制造等。而計算機視覺主要應用在偏消費領域,比如人臉識別、行為分析、醫學圖像、地圖導航等。
目前機器視覺主要的應用場景有電子設備及半導體、汽車、制藥、食品包裝等。其中,電子及半導體設備占約46.60%,主要應用在高精度的制造和檢測,如晶圓切割、3C表面檢測、AOI光學檢測、PCB印刷電路等。汽車制造是機器視覺應用的第二大場景,約占15.3%左右,幾乎所有系統和部件的制造都可用到機器視覺。
據招銀國際研報,相較于上千億參數的NLP模型相比,CV模型規模要小兩三個數量級,現階段比較有名的CV大模型包括微軟的swin-transformer系列,谷歌的ViT系列以及有150億參量的V-MOE模型。國內方面,截止2021年,商湯訓練了300億參數的CV模型,2022年華為也發布了30億參數的盤古系列CV模型。
上文提到,CV機器視覺因為模型參數小,開源,全球語義庫十倍于NLP文本。目測國內的爆發,第一批會在5-6月份看到用在生產上。
華安證券也表示,CV模型參數量通常較小,且語料庫不存在中英文差異,值得關注。
多重因素疊加,機器視覺百億藍海市場
申萬宏源表示,短中長期多重因素推動機器視覺市場需求快速提升,預計2025年市場規模突破390億。
1)從長期來看,未來人口老齡化及勞動力價格上漲將帶來機器替人剛需,機器視覺設備將逐步代替人工。
2)從中期來看,機器視覺下游應用廣闊,滲透率持續提升,3C領域:終端客戶對機器視覺需求從手機擴展至平板、耳機、手表等;鋰電領域:除攪拌外,在涂布、輥壓、卷繞、入殼等各工序都有機器視覺應用,且視覺技術同樣適用于4680等新電池;半導體、光伏等領域:晶圓缺陷檢測設備、光伏硅片分選設備等需求提升顯著。
3)從短期來看,制造業固定資產開支回暖、國產化加速,將加速機器視覺設備需求釋放。依據中國機器視覺產業聯盟數據,預計未來市場規模保持25%增長,2025年突破390億。
相關產業鏈
產業鏈方面,機器視覺上游主要是機器視覺底層開發商,即核心零部件(光源、相機、鏡頭、圖像采集卡等)及軟件提供商(圖像處理軟件)且其二者占據了機器視覺80%的比例,是產業鏈中絕對的核心環節和價值獲取者。
中游是二次開發的系統集成和軟件服務商,主要根據上游產品以及下游需求進行集成整合,越來越多上游企業向中游業務擴展延伸,形成自有的完整解決方案。
下游則是主要應用領域,涉及到多種制造及服務行業,主要應用于汽車制造、消費電子、食品包裝、醫療制藥以及服務機器人。
其中,光源是國產化最為充分的環節;鏡頭的話,高端的部分主要依賴進口;工業相機以歐美進口為主;圖像采集卡國內發展較為完善和成熟,圖像處理軟件則基本被國外企業壟斷,國內企業在二次開發中有所布局。
風險提示及免責條款 市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別用戶特殊的投資目標、財務狀況或需要。用戶應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。關鍵詞: