光譜百科

企業資訊

基于高光譜分選設備的關鍵技術——分類算法

發布時間：2023-10-10

瀏覽次數：489

分類算法是高光譜分選設備的關鍵技術之一。高光譜數據的分類算法可以分為基于光譜相似度匹配的分類方法和基于機器學習的分類方法2類。本文根據現有技術和研究資料，進行了簡單總結。

高光譜相機

高光譜相機原理

高光譜相機采集物體的反射光譜，典型的高光譜相機的原理是，光源投射到待測物體上，反射后經過相機鏡頭前端的狹縫進人高光譜相機內部的核心元件一—分光儀。分光儀將每一束光分成多束單色光，投到面陣相機上。面陣相機狹縫的長度方向w為像素維度，與狹縫垂直方向h為光譜維度，面陣相機w和h2個方向的分辨率決定著高光譜數據的像素分辨率和光譜分辨率。該高光譜相機的使用和線陣相機類似，一行一行的掃描，每一行的數據都是面陣相機的數據，代表的是w方向上每個像素點上的h個光譜數據，根據光譜信息進行光譜分析可以確定其化學組成，以此來鑒別物體的材質。

高光譜相機數據獲取

根據高光譜相機原理可知，高光譜相機每一幀數據都是面陣相機的二維數據，而高光譜數據是三維的數據，需要對相機采集到的數據進行相應的處理后才能獲得。高光譜相機數據獲取分為面陣相機數據獲取和數據拼接2個部分。面陣相機數據的獲取與普通2D相機數據的獲取過程并無差異，即先調整圖像質量，然后獲取圖像。調整圖像質量時，需要調節光源的亮度、相機光圈、焦距大小以及曝光時間等，以獲得最優的圖像效果。獲取圖像一般是連續獲取數據，可以按時間間隔觸發，也可以由外部I0信號觸發。如果這個10信號是編碼器，就可以實現按照距離觸發。觸發間隔有嚴格的要求，以保證拼接后的圖像與實際物體比例一致。

面陣相機數據的獲取完成后，還需要對數據進行拼接，從而得到高光譜數據。高光譜數據的格式有3種，分別為BSQ，BIL和BIP。BSQ（Band Sequential Format）格式是按波段保存，1個波段保存后接著保存第2個波段。這種格式適合對單個光譜波段中任何部分的空間（X，Y）存取。BIL（Band interleaved by line format）格式是按行保存，保存第1個波段的第1行后，接著保存第2個波段的第1行，這種格式提供了空間和光譜處理之間的一種折衷方式。BIP（Band interleaved by pixel format）格式是按像元保存，先保存第1個波段的第1個像元，然后保存第2波段的第1個像元。該格式為圖像數據光譜（Z）的存取提供了最佳性能。高光譜數據拼接完成后，通常還需要1個描述文件，然后可以導入光譜分析軟件進行數據處理了。

基于光譜相似度匹配的分類方法

光譜相似度的匹配算法是通過計算測試光譜向量與參考光譜向量之間的相似度來進行分類。光譜相似度的度量標準包括最小距離、光譜角度、光譜信息散度以及光譜相關性等，其中最小距離度量標準包括曼式距離和歐式距離等。光譜最小距離越小，相似性越大。光譜角度余弦值越大，相似性越大。光譜信息散度值越接近于0，相似性越大。光譜相關系數越大，相似性越大。

光譜相似度的匹配算法首先要建立待測物體的光譜庫，然后計算測試光譜與光譜庫中光譜數據的相似度，最后根據相似度數值以及相似度閥值來判斷物體的類別。光譜相似度匹配算法的重點在于待測物體光譜庫的建立，光譜庫可以是來自標準的光譜庫，也可以是根據待測物體建立的自定義光譜庫。標準的光譜庫對相機和光源的一致性要求較高，實際上不同的相機、不同的光源、不同的校準條件，得到的光譜曲線并不完全一致，所以標準光譜庫中的數據一般只作為參考，工業應用上需要自定義光譜庫。自定義光譜庫時，首先采集待測物體的光譜數據，選取感興趣區域（ROI），并對ROI中的數據進行端元提取，得到純凈像元，并將該像元的光譜數據存入光譜庫。常用的端元提取方法包括內部最大體積法（N-FINDER）、純像素索引法（PPl）、凸錐分析（CCA）、頂點成分分析法（VCA）等。

? 對比效果圖

基于機器學習的分類方法

基于機器學習的分類方法分為非監督分類和監督分類。非監督分類是指在沒有任何分類先驗知識的情況下，僅依據數據本身的統計特征及自然點群的分布情況來劃分類別的分類方法，代表性的非監督分類包括均值聚類算法（K-Means）、選代自組織數據分析算法（Iterative Self?Organizing Data Analysis Technique）"。監督分類是指以先前提取的訓練樣本作為先驗知識，以對訓練樣本的學習構建分類模型，并對其他數據進行分類的過程"。監督分類算法常用的包括高斯最大似然分類法、最小距離分類、K近鄰、決策樹以及支持向量機等。

由于高光譜數據的波段數通常有200多個以上，包含豐富的信息，但有很多數據冗余，在進行監督分類之前，需要對數據進行特征提取，選取包含信息量大的波段或者特征來降低數據的冗余程度。將原始高維數據投影到一個新的低維空間，從而獲得原始數據的更精簡的表示，即降維，可以有效減少運算量，提高運算速度。常用的降維方法包括主成分分析（PCA）、線性判別分析（LDA）、回歸系數法、連續投影法等。以PV、PS、PP、PE和PC等塑料材質的分選為例，對比效果如圖1所示。

分類算法加速

由于高光譜數據包含3個維度的信息，是個數據立方體，數據量很大，因此需要對算法進行優化加速，這樣才能滿足工業上實時分選的需求。分類算法是基于每個像素的光譜數據進行運算的，算法加速主要是通過并行運算進行加速。

NVIDIAGPU Computing Toolkit提供了豐富的教程，可以根據CUDA提供的矩陣運算應用開發庫CUBLAS_Library進行并行運算加速，也可以參考CUDACProgramming Guide，編寫并行執行的核函數，直接操作GPU進行并行計算加速。相比于CPU的串行運算，GPU的并行運算能夠提高5~10倍的運算速度。

并行加速的另一種平臺是FPGA，FPGA器件屬于專用集成電路中的一種半定制電路——可編程的邏輯列陣。基于光譜相似性匹配算法，可以通過硬件描述語言（HDL）寫入FPGA，實現硬件上的并行，其運算的速度更快。FPGA的開發難度較大，并行占用的FPGA資源較多，需要大容量的FPGA。

上一頁 : 高光譜,多光譜及超光譜的區別? 下一頁 : 近紅外光譜(NIR)應用包含哪些?

本文標簽：高光譜分類算法分選設備