蔡立晶1,蔡立娟2,李文勇3,赵肖宇1,尚廷义1
(1.黑龙江八一农垦大学,黑龙江 大庆 163319;2.长春理工大学,长春 130022;
3.大庆油田有限责任公司第一采油厂,黑龙江 大庆 163162)
摘要:提出了一种基于近红外透射光谱及最速下降BP算法识别大豆油质量的方法。光谱采集范围是10 000~4 000 cm-1,将得到的近红外光谱数据作为网络的输入神经元,利用主成分分析方法得出8个变量指标数,该变量指标对样品累计贡献率达到99.9%以上;将8个主成分的特征值作为BP网络的输入向量,建立BP神经网络模型。该模型对预测样品集能正确判别,判别正确率达到100%。
教育期刊网 http://www.jyqkw.com
关键词 :近红外透射光谱;BP神经网络;豆油质量分析
中图分类号: O657.33文献标识码:A文章编号:0439-8114(2015)01-0175-03
DOI:10.14088/j.cnki.issn0439-8114.2015.01.045
Quality Analysis of Soybean Oil based on Near Infrared Transmission Spectra and Artificial Neural Network Model
CAI Li-jing1,CAI Li-juan2,LI Wen-yong3,ZHAO Xiao-yu1,SHANG Ting-yi1
(1. Heilongjiang Bayi Agricultural University,Daqing 163319,Heilongjiang,China;2. Changchun University of Sciences and Technology,Changchun 130022,China;3. The Fist Oil Production Company, Daqing oilfield,Daqing 163162,Heilongjiang,China)
Abstract: A method based on near infrared transmission spectra and gradient descent BP algorithm was used to analyzed the quality of soybean oil. The range of 10 000 to 4 000 cm-1 spectral was acquired, then the near infrared spectrum data was input to BP network. Eight variable indexes were obtained with principal component analysis. The cumulative contribution rate of the 8 variable indexes was more than 99.9%. Using the 8 index as input vectors of BP neural networks model, it can discriminate the quality of samples with the accuracy of 100%.
Key words:near infrared transmission spectroscopy;BP neural network;soybean oil quality analysis
收稿日期:2014-03-20
基金项目:黑龙江省教育厅科学技术研究项目(12521378)
作者简介:蔡立晶(1977-),女,吉林前郭人,讲师,硕士,主要从事电磁场微波技术及光电检测技术的教学与研究工作,(电话)13845942988(电子信箱)threeminimoons@126.com。
近红外光谱技术具有快速、高效、无污染、无需前处理、无损分析及多组分同时测定等优点,在快速检测领域有较大的潜力和发展空间。近红外光谱分析技术用于食用油品质分析检测目前也有一些研究报道,主要用于油脂的品质检测[1]。西方国家最早利用近红外技术进行油脂品质分析。近红外技术结合判别分析方法等,在橄榄油[2,3]、坚果油[4]及其他植物油[5]的检测中已得到成功应用。刘福莉等[6]以8种食用油纯油的43个样品为对象,研究了近红外透射光谱结合聚类分析法快速鉴别食用油种类的可行性,判别模型对预测集样品的准确率达到100%。范璐等[7]利用气相色谱和傅里叶变换红外吸收光谱,对21种花生油、20种棕榈油及两者的4种调和油进行分析,对花生油和棕榈油做了识别分析。近红外光谱技术在掺伪检测中有着很多的应用[8],翁欣欣等[9]研究了橄榄油中掺伪情况研究,采用BP神经网络对掺伪橄榄油和未掺伪橄榄油进行了鉴别,对52个样品进行了预测,预测准确率为100%。随着营养学的研究发展,评估食用植物油的营养价值,研究分析常用食用植物油中的脂肪酸的组成是有意义的,吴静珠等[10,11]对食用油脂肪酸的定量分析进行了研究,人们对植物油中脂肪酸的认识不断增加。
人工神经网络方法是一种具有很强函数逼近能力的非线性建模方法,在人工神经网络的实际应用中,BP网络广泛应用于函数逼近、模式识别/分类、数据压缩等。陈建等[12]提出了一种采用近红外光谱技术结合人工神经网络对玉米品种进行鉴别的方法,试验结果说明该方法能快速无损地鉴别玉米品种,为玉米的品种鉴别提供了一种新方法。罗一帆等[13]进行了近红外光谱测定茶叶中茶多酚和茶多糖的人工神经网络模型研究,建立近红外光谱测定茶叶中茶多酚和茶多糖的模型,由此说明建立的近红外光谱-人工神经网络模型可用于预测茶叶中茶多酚和茶多糖的含量。赵肖宇等[14]研究应用近红外透射光谱和人工神经网络的豆油脂良莠鉴别,建立3层BP神经网络模型,模型能够有效辨识未知豆油脂的良莠以及不合格具体种类,类别预测正确率为100%。
本研究采用基于近红外透射光谱及神经网络中的最速下降BP算法的方法,对纯大豆油和掺杂大豆油进行真伪鉴别研究。
1 材料与方法
1.1 仪器
采用北京瑞利分析仪器公司WQF-510型傅里叶变换红外光谱仪。室温介于15~30 ℃,相对湿度的允许范围小于60%。仪器预热,系统通过自检且已获得本底光谱时,开始扫描样品。采集光谱范围10 000~4 000 cm-1,采样分辨率为4 cm-1,扫描次数32次,液体池6 mL玻璃器皿。
1.2 材料
样品包括两种,纯大豆油和掺杂大豆油,全部样品未经任何化学处理。所使用的纯大豆油是超市购买的九三大豆油,掺杂大豆油是指纯大豆油中掺入一定比例的猪油。为了使配置的掺杂大豆油得以充分混合,在制备样品前,先把猪油放在恒温箱中加热使其成液体状态,取一定量的猪油混合到纯大豆油中进行充分搅拌使其充分混合。将带有样品的器皿放入傅里叶变换红外光谱仪中进行光谱采集。每种样品光谱采集为30个样品,共收集60个样品的光谱信号。
2 结果与分析
2.1 光谱采集
纯大豆油和掺杂大豆油的近红外透射光谱见图1。由图1可见,掺杂大豆油与纯大豆油图谱之间的差异不明显。近红外光谱图之间的差异很小,很难通过直观的分析对两种油进行鉴别。
2.2 主成分数据处理
将asf文件转换为ASC码文件,每条谱图数据量为1 556个,共计得到60×1 556个全波段数据点,试验训练样品集数为50个,而且直接把光谱矩阵X50x1 556作为神经网络的输入,则输入元为1 556个,BP网络的规模较为复杂。将原始光谱矩阵进行主成分分解,主成分分析是把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。以减少神经网络输入的神经元。
采用Matlab的矩阵计算功能来编程实现主成分分析。主成分分析计算步骤为计算相关系数矩阵和计算特征值与特征向量,以及计算主成分贡献率及累计贡献率。特征根数量为8,即得到8个主成分,即val1,val2,val3,val4,val5,val6,val7,val8其累积贡献率分别为70.17%,90.42%,97.13%,98.78%,99.56%,99.88%,99.96%,99.99%。采用8个变量指标数,对样品计算累计贡献率均达到99.9%以上,基本可以涵盖样品光谱图的所有信息,因此红外透射光谱数据得到了最大程度不失真简化。将分解得到的矩阵T50x8作为BP网络的输入神经元。此时,BP网络的输入元从1 556降为8个,也就是8个主成分的特征值作为BP网络的输入向量。
2.3 神经网络建模与分析
BP网络的设计主要包括输入层、隐层、输出层及各层之间的传递函数等[15,16]。通用的神经网络需要预先确定网络的层数,而BP网络可以包含不同的隐层。理论上已经证明,在不限制隐层节点数的情况下,两层(只有一个隐层)的BP网络可以实现任意非线性映射。在模式样本相对较少的情况下,较少的隐层节点可以实现模式样本空间的超平面划分,此时选择两层BP网络就可以了,当模式样本数很多时,减少网络规模,增加一个隐层是必要的,但BP网络隐层数一般不超过两层。
试验采集光谱样品数为60个,随机抽取50个作为训练集,10个作为验证集。在BP网络设计中,数据主要分为两类模式,用1个输出元素即可表示,采用两层BP网络来实现分类。因为BP网络的输出为logig函数,所以目标向量的取值为0.2和0.8,分别对应两类模式。在程序设计时,通过判决门限0.5区分两类模式,输出元素分别为0和1。采用最速下降BP算法训练该网络。训练曲线训练经过了5 000次仍未达到要求的目标误差0.001,虽然训练的误差性能未达到要求的目标误差,但这并不妨碍用测试样本对网络进行仿真。
利用建立的BP网络模型对剩下的10个预测集样品进行鉴别,掺杂大豆油样品预测样本数为5个,纯大豆油预测样本数为5个。预测结果见表1。预测样品集可以做到正确的判别,判别正确率达到100%。
3 结论
采用大豆油为研究对象,利用傅里叶变换近红外光谱仪采集大豆油的近红外透射光谱,通过主成分分析及神经网络技术对光谱数据进行分类识别。结果表明,近红外透射光谱的网络建立及仿真可完成两类模式的分类。采用纯大豆油与掺杂大豆油两种的透射光谱,对光谱预处理,抽出8个主成分作为神经网络的输入神经元,建立最速下降BP网络模型,对预测集大豆油预测结果正确率为100%。试验表明将近红外透射光谱与神经网络技术相结合能够快速检测大豆油是否掺杂,从而为检测大豆油的品质提供一种简单有效的方法。
教育期刊网 http://www.jyqkw.com
参考文献:
[1] 于燕波,臧 鹏,付元华,等.近红外光谱法快速测定植物油中脂肪酸含量[J].光谱学与光谱分析,2008,28(7):1554-1558.
[2] 张 欣,于瑞祥,方晓明,等.橄榄油掺假检测技术的研究进展[J].中国油脂,2013,38(3):67-71.
[3] 林远辉,高 蓓,李玉玉,等.橄榄油掺假鉴别技术研究进展[J].食品科学,2013,34(5):279-283.
[4] 魏长宾,刘胜辉,臧小平,等.澳洲坚果油脂肪酸组成分析[J].中国油脂,2008,33(9):75-76.
[5] 李宗朋,王 健,张晓磊,等.基于近红外光谱技术的沙棘籽油鉴伪方法研究[J].中国油脂,2014,39(2):57-62.
[6] 刘福莉,陈华才,姜礼义,等.近红外透射光谱聚类分析快速鉴别食用油种类[J].中国计量学院学报,2008,3(19):278-282.
[7] 范 璐,吴娜娜,霍权恭,等.气相色谱分析和傅里叶变换红外吸收光谱识别花生油中棕榈油[J].河南工业大学学报(自然科学版),2008,29(1):12-16.
[8] 吴静珠,刘翠玲,李 慧,等.基于近红外光谱的纯花生油惨伪快速鉴别方法研究[J].北京工商大学学报(自然科学版),2011,29(1):75-78.
[9] 翁欣欣,陆 峰,王传现,等.近红外光谱-BP神经网络-PLS法用于橄榄油缠在分析[J].光谱学与光谱分析,2009,29(12):3283-3287.
[10] 吴静珠,刘翠玲,李 慧,等.近红外光谱技术在食用油种类鉴别及脂肪酸含量检测中的应用[J].北京工商大学学报(自然科学版),2010.09,25(5):56-59.
[11] 吴静珠,徐 云.基于CARS-PLS的食用油脂肪酸近红外定量分析模型的优化[J].农业机械学报,2011,42(10):162-166.
[12] 陈 建,陈 晓,李 伟,等.基于近红外光谱技术和人工神经网络的玉米品种鉴别方法研究[J].光谱学与光谱分析,2008, 28(8).1806-1808.
[13] 罗一帆,郭振飞,朱振宇,等.近红外光谱测定茶叶中茶多酚和茶多糖的人工神经网络模型研究[J].光谱学与光谱分析,2005, 25(8).1230-1233.
[14] 赵肖宇,关 勇,尚廷义,等.应用近红外透射光谱和人工神经网络的豆油脂良莠鉴别[J].浙江农业学报,2011,23(4):825-828.
[15] 杨建刚.人工神经网络实用教程[M].杭州:浙江大学出版社,2001.
[16] 张德丰,MATLAB神经网络仿真与应用[M].北京:电子工业出版社,2009.
(责任编辑 龚 艳)