基于高光譜分選設備的關鍵技術——分類算法
發布時間:2023-10-10
瀏覽次數:489
分類算法是高光譜分選設備的關鍵技術之一。高光譜數據的分類算法可以分為基于光譜相似度匹配的分類方法和基于機器學習的分類方法2類。本文根據現有技術和研究資料,進行了簡單總結。
分類算法是高光譜分選設備的關鍵技術之一。高光譜數據的分類算法可以分為基于光譜相似度匹配的分類方法和基于機器學習的分類方法2類。本文根據現有技術和研究資料,進行了簡單總結。
?
高光譜相機原理
高光譜相機采集物體的反射光譜,典型的高光譜相機的原理是,光源投射到待測物體上,反射后經過相機鏡頭前端的狹縫進人高光譜相機內部的核心元件一—分光儀。分光儀將每一束光分成多束單色光,投到面陣相機上。面陣相機狹縫的長度方向w為像素維度,與狹縫垂直方向h為光譜維度,面陣相機w和h2個方向的分辨率決定著高光譜數據的像素分辨率和光譜分辨率。該高光譜相機的使用和線陣相機類似,一行一行的掃描,每一行的數據都是面陣相機的數據,代表的是w方向上每個像素點上的h個光譜數據,根據光譜信息進行光譜分析可以確定其化學組成,以此來鑒別物體的材質。
?
高光譜相機數據獲取
根據高光譜相機原理可知,高光譜相機每一幀數據都是面陣相機的二維數據,而高光譜數據是三維的數據,需要對相機采集到的數據進行相應的處理后才能獲得。高光譜相機數據獲取分為面陣相機數據獲取和數據拼接2個部分。面陣相機數據的獲取與普通2D相機數據的獲取過程并無差異,即先調整圖像質量,然后獲取圖像。調整圖像質量時,需要調節光源的亮度、相機光圈、焦距大小以及曝光時間等,以獲得最優的圖像效果。獲取圖像一般是連續獲取數據,可以按時間間隔觸發,也可以由外部I0信號觸發。如果這個10信號是編碼器,就可以實現按照距離觸發。觸發間隔有嚴格的要求,以保證拼接后的圖像與實際物體比例一致。
面陣相機數據的獲取完成后,還需要對數據進行拼接,從而得到高光譜數據。高光譜數據的格式有3種,分別為BSQ,BIL和BIP。BSQ(Band Sequential Format)格式是按波段保存,1個波段保存后接著保存第2個波段。這種格式適合對單個光譜波段中任何部分的空間(X,Y)存取。BIL(Band interleaved by line format)格式是按行保存,保存第1個波段的第1行后,接著保存第2個波段的第1行,這種格式提供了空間和光譜處理之間的一種折衷方式。BIP(Band interleaved by pixel format)格式是按像元保存,先保存第1個波段的第1個像元,然后保存第2波段的第1個像元。該格式為圖像數據光譜(Z)的存取提供了最佳性能。高光譜數據拼接完成后,通常還需要1個描述文件,然后可以導入光譜分析軟件進行數據處理了。
?
基于光譜相似度匹配的分類方法
光譜相似度的匹配算法是通過計算測試光譜向量與參考光譜向量之間的相似度來進行分類。光譜相似度的度量標準包括最小距離、光譜角度、光譜信息散度以及光譜相關性等,其中最小距離度量標準包括曼式距離和歐式距離等。光譜最小距離越小,相似性越大。光譜角度余弦值越大,相似性越大。光譜信息散度值越接近于0,相似性越大。光譜相關系數越大,相似性越大。
光譜相似度的匹配算法首先要建立待測物體的光譜庫,然后計算測試光譜與光譜庫中光譜數據的相似度,最后根據相似度數值以及相似度閥值來判斷物體的類別。光譜相似度匹配算法的重點在于待測物體光譜庫的建立,光譜庫可以是來自標準的光譜庫,也可以是根據待測物體建立的自定義光譜庫。標準的光譜庫對相機和光源的一致性要求較高,實際上不同的相機、不同的光源、不同的校準條件,得到的光譜曲線并不完全一致,所以標準光譜庫中的數據一般只作為參考,工業應用上需要自定義光譜庫。自定義光譜庫時,首先采集待測物體的光譜數據,選取感興趣區域(ROI),并對ROI中的數據進行端元提取,得到純凈像元,并將該像元的光譜數據存入光譜庫。常用的端元提取方法包括內部最大體積法(N-FINDER)、純像素索引法(PPl)、凸錐分析(CCA)、頂點成分分析法(VCA)等。
?
基于機器學習的分類方法
基于機器學習的分類方法分為非監督分類和監督分類。非監督分類是指在沒有任何分類先驗知識的情況下,僅依據數據本身的統計特征及自然點群的分布情況來劃分類別的分類方法,代表性的非監督分類包括均值聚類算法(K-Means)、選代自組織數據分析算法(Iterative Self?Organizing Data Analysis Technique)"。監督分類是指以先前提取的訓練樣本作為先驗知識,以對訓練樣本的學習構建分類模型,并對其他數據進行分類的過程"。監督分類算法常用的包括高斯最大似然分類法、最小距離分類、K近鄰、決策樹以及支持向量機等。
由于高光譜數據的波段數通常有200多個以上,包含豐富的信息,但有很多數據冗余,在進行監督分類之前,需要對數據進行特征提取,選取包含信息量大的波段或者特征來降低數據的冗余程度。將原始高維數據投影到一個新的低維空間,從而獲得原始數據的更精簡的表示,即降維,可以有效減少運算量,提高運算速度。常用的降維方法包括主成分分析(PCA)、線性判別分析(LDA)、回歸系數法、連續投影法等。以PV、PS、PP、PE和PC等塑料材質的分選為例,對比效果如圖1所示。
分類算法加速
由于高光譜數據包含3個維度的信息,是個數據立方體,數據量很大,因此需要對算法進行優化加速,這樣才能滿足工業上實時分選的需求。分類算法是基于每個像素的光譜數據進行運算的,算法加速主要是通過并行運算進行加速。
NVIDIAGPU Computing Toolkit提供了豐富的教程,可以根據CUDA提供的矩陣運算應用開發庫CUBLAS_Library進行并行運算加速,也可以參考CUDACProgramming Guide,編寫并行執行的核函數,直接操作GPU進行并行計算加速。相比于CPU的串行運算,GPU的并行運算能夠提高5~10倍的運算速度。
并行加速的另一種平臺是FPGA,FPGA器件屬于專用集成電路中的一種半定制電路——可編程的邏輯列陣。基于光譜相似性匹配算法,可以通過硬件描述語言(HDL)寫入FPGA,實現硬件上的并行,其運算的速度更快。FPGA的開發難度較大,并行占用的FPGA資源較多,需要大容量的FPGA。
?
相關產品
-
紅外光譜的發展、原理、特點、分類
紅外光譜的發展、原理、特點、分類紅外光譜的技術在各領域中的應用相繼經歷了很長時期,逐漸完善著自身技術在領域中的應用,且將低成本高性能作為發展與創新的主要方向。本..
-
近紅外光譜技術的優缺點和應用范圍
?由于近紅外光譜在光纖中良好的傳輸性,近年來也被很多發達國家廣泛應用在產業在線分析中。近紅外定量分析因其快速、正確已被列人世界谷物化學科技標準協會和美國谷物化學..
-
高光譜數據常見預處理方法有哪些?
高光譜在采集數據時會有成百上千個不同的波段數據,數據量巨大從而增加了數據處理的難度。而且在高光譜圖像采集過程中會有來自儀器與環境的干擾,獲得的光譜信號易存在噪聲..
-
高光譜成像儀光譜數據特征波長的選取方法介紹
高光譜成像儀?在對樣品進行側臉時,會采集多波段的光譜數據,全波段數據有較多的冗余信息,因此就需要采用一定的方法來選取樣本光譜的特征波段與紋理特征的重要變量。本文..