中國是世界上茶科植物分布最廣的國家,也是世界上最大的茶籽油生產基地。茶籽油色清味香,是我國傳統食用植物油,在國內高端食用油市場上僅次于橄欖油。為更好地選育優良品種,提高茶籽油的市場競爭力,迫切需要一種快速、準確、高效分析油茶籽品質的方法。本研究通過油茶籽油酸、亞油酸、棕櫚酸的化學定量計量法比較主成分回歸法、偏最小二乘回歸和徑向基神經網絡3種高光譜校正建模的效果,尋求檢測油茶籽脂肪酸成分含量的最優建模方法,實現對油茶籽脂肪酸成分含量的快速、可靠、無損檢測。
1 實驗儀器與方法
分別從湖南、湖北、江西等地采集了30個品種的油茶種子,去殼、編號,將茶籽分為校正集20個,預測集10個用于實驗。
1.1 儀器
本研究應用了400-1000nm的高光譜相機,可采用杭州彩譜科技有限公司產品FS13進行相關研究。光譜范圍在400-1000nm,波長分辨率優于2.5nm,可達1200個光譜通道。采集速度全譜段可達128FPS,波段選擇后最高3300Hz(支持多區域波段選擇)。
1.2方法
1.2.1 油茶籽脂肪酸組成含量的化學測定
將油茶籽粉碎后用索氏抽提法獲取油樣,取油樣30mg于10mL試管中,用移液管移取2mL異辛烷溶解試樣,再用微量移液管加入4mL氫氧化鉀甲醇溶液2mol/L),蓋上玻璃塞劇烈振搖30s后靜置至澄清;向溶液中加入少量硫酸氫鈉,劇烈振搖,中和氫氧化鉀;待鹽沉淀后,將上層甲酯溶液倒入樣瓶中,用氣相色儀獲得油茶籽中油酸、亞油酸、棕櫚酸的含量。
1.2.2 油茶籽反射光譜采集
高光譜儀視場角25°,波段范圍為400~1000nm,采樣間隔1.4nm,數據間隔1nm,分辨率3nm,重復性優于0.3%;測量是在一個晴朗無風天氣中進行的。測量時,傳感器垂直向下,距離樣品0.15m,每個樣品測量前、后均用白板校正,每個樣本連續采集30次取平均得樣本光譜。
2 模型建立方法
首先用校正樣本集建立校正模型,通過軟件得出油茶籽光譜與油茶籽油酸、亞油酸、棕櫚酸含量的相關系數,找出最優的光譜范圍;通過逐步回歸方法去除光譜中的冗余信息,然后采用主成分回歸法PCR)、偏最小二乘回歸法(PLS)及徑向基神經網絡法(RBF)建立預測模型后對模型進行外部驗證。
3 結果與分析
3.1 油茶籽中脂肪酸組成的測定
高光譜儀在其測量臨界區有較強的機器噪聲,因此分析時截去兩端噪聲較嚴重波段,得高光譜如圖1所示。其記錄了400~920nm范圍內樣本的高光譜反射率。
油茶籽脂肪酸的主要成分是油酸、亞油酸、棕櫚酸。這些物質中甲基、亞甲基的C-H鍵在近紅外有較強的吸收。從圖中可以看出不同品種的油茶籽在同一波長處有不同的反射率,故高光譜可以作為油茶籽脂肪酸含量定量分析的依據。
3.2 光譜預處理
由于檢測到的光譜信號除含樣品待測成分信息外,還包括各種儀器噪聲,如高頻隨機噪聲、基線漂移、雜散光及一些背景噪聲等。因此,在數據分析前,對數據進行一些合理的預處理,減弱甚至消除各種因素對光譜信號的影響,為穩定、可靠地校正模型建立奠定基礎。常用的預處理方法包括:平滑處理消除噪聲及多元散射校正MSC)消除多重光譜偏差等。
表1所示為預處理前后油茶籽脂肪酸各成分模型的預測相關系數、預測集均方差、校正集均方差值。由表1可以看出,經過平滑和多元散射校正后油酸、亞油酸、棕櫚酸的校正集相關系數增大,而校正集均方差、預測集均方差減小。這說明光譜的預處理是有效的。
3.3 光譜的波段選擇
高光譜數據包含大量冗余信息,建模波段過寬會嚴重影響預測結果。首先,將校正集樣本光譜逐個波段與油茶籽油酸、亞油酸、棕櫚酸的化學測量值做相關性分析。其次,檢測其顯著性水平,用逐步回歸濾除其中冗余波段,得到16個相關性較強、顯著性水平較高的波段,如表2所示。
4結論
本實驗采用高光譜和化學計量法對油茶籽中脂肪酸的成分進行測定,結果表明利用高光譜可以簡單、快捷、無損、可靠、穩定的測量油茶籽中油酸、亞油酸、棕櫚酸的含量,為大批量油茶籽脂肪酸含量的快速檢測提供便捷技術。
本研究比較了主成分回歸、偏最小二乘回歸、徑向基神經網絡3種建模方法對油茶籽中油酸、亞油酸、棕櫚酸的預測效果,結果表明徑向基神經網絡建模的預測效果最好,油酸、亞油酸、棕櫚酸相關系數系數分別為0.9403、0.8935和0.9122;校正均方根誤差和預測均方根誤差分別為0.441、0.1749、0.0664和0.3518、0.184、0.162。