基于CARS-PLS的食用油脂肪酸近红外定量分析模型优化
摘要: 采用CARS 波长变量挑选方法优化建模,对食用油中4 种主要脂肪酸( 棕榈酸、硬脂酸、油酸和亚油酸) 进行近红外定量分析。应用预测浓度残差法剔除奇异样本后,对样品集光谱进行标准化预处理,通过CARS 优选出的波长变量分别建立4 种脂肪酸的偏最小二乘法( PLS) 模型。与采用OPUS 软件自动优化建模相比,CARS 法所建模型的决定系数( R2 ) 、交叉校验均方根误差( RMSECV) 和预测均方根误差( RMSEP) 都优于后者所建模型。CARS 法有效地简化了模型,且所挑选出的特征波长较少。
关键词: 食用油脂肪酸近红外光谱CARS 变量筛选偏最小二乘法
引言 我国居民食用植物油主要有大豆油、菜籽油、花生油、葵花籽油、橄榄油和芝麻油等。植物油中常见的高级脂肪酸主要有棕榈酸、硬脂酸、油酸和亚油酸等。不同植物油的脂肪酸组成有很大差异,因此其功效和营养价值也随之不同。随着营养学研究发展,人们对植物油中脂肪酸认识不断提高。中国营养学会也推荐膳食中必需脂肪酸摄入理想比值,市场上也出现大量调和油,为了评估食用植物油营养价值,研究分析常用食用植物油中脂肪酸组成是很有必要的。
近红外分析技术是利用近红外谱区包含的物质信息,用于有机物质定性和定量分析的一种分析技术。该方法具有快速、高效、无污染、无需前处理、无损分析及多组分同时测定等优点。国内外已有将近红外技术应用于油脂检测的研究报道。提高模型预测能力始终是近红外分析中的研究热点和难点问题。有研究报道,有效地变量筛选不仅可以简化模型,更主要的是可以剔除不相关变量,建立更好的校正模型,从而加强模型预测能力与稳健性。目前,在近红外分析中,常用的波长变量选择方法主要有相关系数法、方差分析法、无信息变量消除法、遗传算法、移动窗口偏最小二乘回归法等。CARS ( competitive adaptive reweighted sampling) 是近年来提出的一种新的变量选择方法。此算法能够在一定程度上克服变量选择中的组合爆炸问题,筛选出优化的变量子集,提高模型的预测能力和降低预测方差。
本文拟采用红外光谱技术,建立食用油中4 种主要脂肪酸( 棕榈酸、硬脂酸、油酸和亚油酸) 定量分析模型,通过CARS 挑选特征波长变量优化模型,提升脂肪酸近红外模型的预测能力。
1 CARS 变量筛选法 近红外光谱通常由大量数据点构成,建模时波长点数远大于样本数,且光谱的共线性非常严重。近红外光谱本身有效信息量很弱,有些波段与所测样品成分之间缺乏相关关系。各谱区的噪声水平也不一致,即使作相关的谱图预处理也可能导致模型不稳定,降低模型的精度。因此,波长变量筛选是很有必要的预处理手段,不但可以简化模型,并能有效提高模型的预测能力。
CARS 方法采用“适者生存”原则,将每个变量看成一个个体,通过自适应加权采样技术筛选出PLS 模型中回归系数绝对值较大的波长,去掉权重较小的波长,并通过交互校验优选出模型交互交验均方根误差最小时所对应的波长组合[9]。此算法中引入了指数衰减函数来控制变量的保留率,具有很高的计算效率,适用于高维数据的变量选择。
文中所用的CARS 和PLS 等程序均在MatlabR2008a 环境下运行。
有关上面的的专业知识就介绍到这里了,耗材汇后续将进一步整理有关专业知识,欢迎持续关注。如果有实验室耗材方面的需求,欢迎来电咨询。