导航菜单

基于SFLA和LSSVM的芹菜总黄酮含量预测模型

曾 燕a,成新文a,王 晓a,陈欲云b

(四川理工学院,a.计算机学院;b.化学与制药工程学院,四川 自贡 643000)

摘要:利用混合蛙跳算法(SFLA)对最小二乘支持向量机(LSSVM)的参数进行优化,建立了一种基于混合蛙跳算法和最小二乘支持向量机的芹菜总黄酮提取预测模型。仿真结果表明,该预测模型提高了预测精度,性能更加稳定,为芹菜总黄酮提取的在线预估和优化控制提供了可靠的技术参考。

教育期刊网 http://www.jyqkw.com
关键词 :芹菜;混合蛙跳算法;最小二乘支持向量机;总黄酮;预测

中图分类号:TP301 文献标识码:A 文章编号:0439-8114(2015)06-1486-04

DOI:10.14088/j.cnki.issn0439-8114.2015.06.053

Predicting Content of Total Flavonoids in Celery Based on SFLA and LSSVM

ZENG Yana,CHENG Xin-wena,WANG Xiaoa,CHEN Yu-yunb

(a.School of Computer science;b.Chemical and Pharmaceutical Engineering,Sichuan University of Science & Engineering,Zigong 643000,Sichuan,China)

Abstract: Shuffled frog leaping algorithm (SFLA) was used to parameters of optimize least square support vector machine (LSSVM). The prediction model of extracting total flavonoids from celery based on shuffled frog leaping algorithm and least squares support vector machine was established. Simulation results showed that this prediction method had high accuracy and stable performance. It was conducive to achieve online estimation and optimal control.

Key words: celery;artificial bee colony algorithm; least squares support vector machines; total flavonoids; prediction

收稿日期:2014-12-16

作者简介:曾 燕(1979-),女,四川自贡人,讲师,硕士,主要从事人工智能研究,(电话)13778586640(电子信箱)zy261365@suse.edu.cn。

黄酮类化合物是一类存在于植物中的天然产物,属于植物的次级代谢产物。现代医学研究发现,芹菜的茎叶中含有丰富的黄酮类物质,其具有清除自由基、抗氧化、抑菌、抗病毒、抗癌和抗肿瘤等作用[1,2]。从芹菜中提取黄酮类物质,以开发新型天然黄酮类药物为目标,促进芹菜的深加工,已成为资源高效利用的研究热点[3,4]。

目前,对芹菜总黄酮的提取主要采用碱液法、微波法、超声波法等,而对芹菜中总黄酮含量的测定,大多采用分光光度法、光谱法等方法。这些传统的提取和测定方法容易受到人为操作及环境变化等不可预见性因素的影响,造成数据准确性降低。采用软件方法实现芹菜总黄酮提取量的预测是解决此类生物量参数难以准确实时测量和控制的有效方法[5]。近年来,神经网络、支持向量机等预测方法成为当前研究的热点[6-8]。其中,神经网络对训练样本数据要求高,对于小样本数据应用受到一定限制;支持向量机适用于非线性小样本数据,但泛化能力有限,对于异常样本预测偏差较大。

本研究采用改进的混合蛙跳算法对最小二乘支持向量机的参数进行优化建模[9,10],避免了算法过早收敛陷入局部最优,提高了模型的预测精度,实现了芹菜总黄酮提取量的快速准确预测,为芹菜资源的高值化利用提供了技术支撑。

1 算法基础

1.1 最小二乘支持向量机

最小二乘支持向量机(LSSVM)对支持向量机(SVM)进行了改进[11],很好地解决了小样本、非线性和高维数的问题,提高了求解速度和泛化能力。将非线性问题转化为高维特征空间的线性估计问题,构建了如下回归函数:

1.2 SFLA算法的改进

1.2.1 SFLA算法的种群初始化改进策略 由于标准SFLA算法采用随机方式产生初始种群,导致个体分布缺乏均匀性,影响了种群的多样性,算法的求解效率也受到限制。因此,在种群初始化阶段,引入反向学习策略,确保初始种群具有多样性,主要步骤如下所示:

1)随机生成初始解,用集合形式表示解集为:

2 芹菜总黄酮含量的测定和预测建模

2.1 芹菜总黄酮含量的测定

将芹菜原料进行低温烘干粉碎后,称取芹菜干粉1.00 g于50 mL锥形瓶中,加入一定量的乙醇浸泡,然后将浸泡好的溶液进行超声波提取,提取完成后抽滤、定容,作为待测液备用。取上述样品液2.0 mL并以30%乙醇定容至5 mL,加入0.3 mL 15%NaNO2摇匀静置6 min,再加入0.3 mL 10% Al(NO3)3,摇匀静置6 min后加入4 mL 1 mol/L NaOH,再用蒸馏水定容,摇匀静置15 min后测定吸光度。根据吸光度由下式计算样品液中的总黄酮含量:

式中,m为总黄酮含量(mg/g);C为溶液中总黄酮的测定浓度(mg/mL);V1为芹菜总黄酮提取液总体积(mL);W为芹菜干粉质量(g);V为所取待测液体积(mL)。

2.2 预测模型的构建

采用紫外分光光度法测定芹菜总黄酮含量,测定过程复杂、时间长,制约了芹菜总黄酮的生产应用。因此,构建芹菜总黄酮含量的预测模型,减少测定次数,对实现在线实时预测尤为必要。基于SFLA和LSSVM的芹菜总黄酮含量预测步骤如下:

1)对芹菜总黄酮提取试验中的数据进行归一化处理;

2)参数初始化,设置蛙群个体总数、迭代总次数、子群数、每个子群内的蛙数、子群内的更新次数、变异因子及最大、最小变异概率;

3)按式(5)反向学习策略构建初始种群;

4)计算每只青蛙适应度值后按降序排序,并分成k个子群;

5)确定每个子群的最优解和最差解及群体全局最优解,反复更新每个子群的最差青蛙,直至达到设定的子群迭代总次数后,将更新后的子群进行混合,取代原来的群体;

6)按式(6)和式(7)计算群体的适应度方差,再按式(8)计算变异概率,并按式(9)对全局最优解进行变异操作,更新当前群体最优解;

7)当迭代次数达到设定的最大次数,则停止计算,输出最优解,否则转到第4步;

8)根据最优解优化LSSVM的参数,构建预测模型,并对测试数据集进行仿真和测试。

3 预测模型的应用

在芹菜总黄酮提取试验中,设置了5种料液比(1∶10、1∶20、1∶30、1∶40、1∶50,m/V)、5种乙醇体积分数(0、60%、70%、80%、90%)和5个提取时间(10、20、30、40、50 min)条件,进行了芹菜总黄酮含量测定试验。将上述试验所得的24个数据作为样本数据,在数据归一化之后,选取前16个试验样本数据作为训练样本数据,构建基于SFLA和LSSVM的预测模型;再用后11个样本数据作为测试数据,对该模型进行验证。作为训练样本数据的16个原始样本数据如表1所示。

在预测仿真试验中,计算机配置为联想双核E5800@3.2 GHz,2 G内存,Windows XP操作系统,测试环境为Matlab 7.0。采用改进的混合蛙跳算法优化最小二乘支持向量机得到的最优化参数值为:核宽度σ=9.257 1,正规化参数γ=4.453 578。将基于SFLA和LSSVM的预测模型所得仿真数据与实际测量数据进行比较,其比较结果如表2所示。

由表2可以看出,基于SFLA和LSSVM的芹菜总黄酮含量预测模型得到的仿真数据与实测数据的最大相对误差为4.49%,最小相对误差为0.20%,平均相对误差为2.12%。实测数据与仿真数据的对比如图1所示。

为了更直观地描述模型估计值与实际测试值的相对误差情况,采用如图2所示的相对误差曲线图。图3为基于SFLA和LSSVM的芹菜总黄酮含量预测模型的进化曲线,所采用预测模型的收敛速度快、精度高、性能稳定。

4 小结

本研究提出了一种基于SFLA优化的LSSVM芹菜总黄酮预测模型,该模型在混合蛙跳算法的初始化阶段引入反向学习策略,确保了个体分布的均匀性,同时为了避免算法陷入局部最优,根据适应度方差,动态调整蛙群的变异概率,提高了预测的精度和收敛速度,性能稳定。仿真试验结果表明,该预测模型可以应用于芹菜总黄酮含量的在线测量,对芹菜黄酮类化合物的测定有着重要的应用价值。

教育期刊网 http://www.jyqkw.com
参考文献:

[1] 赵 进,尤婷婷,林丹英.超声波提取芹菜总黄酮及鉴别[J].时珍国医国药,2007,18(6):1454-1455.

[2] 文开新,王成章.黄酮类化合物生物学活性研究进展[J].草业科学,2010,27(6):115-122.

[3] 包丽芹,韩德权.芹菜及芹菜黄酮的药用价值[J].黑龙江医药, 2007,20(4):317-320.

[4] 陈欲云,刘春丽,边名鸿.芹菜黄酮抗氧化作用的研究[J].时珍国医国药,2012,23(7):1718-1719.

[5] 俞金寿.软测量技术及其应用[J].自动化仪表,2008,29(1):1-7.

[6] 袁 琦,黄建清,符 新.基于神经网络的水产养殖水质预测模型研究[J].湖北农业科学,2013,52(1):143-146.

[7] 高丙朋,姜 波,南新元.基于LS-SVM的番茄产量在线预测[J].湖北农业科学,2012,51(5):1025-1027.

[8] 杨 玮,孙 红,郑立华.基于土壤参数的冬小麦产量预测模型[J].农业工程学报,2013,29(23):118-123.

[9] 秦 业,袁海文,袁海斌,等.基于优化最小二乘支持向量机的电能质量扰动分类[J].电工技术学报,2012,27(8):209-214.

[10] EUSUFF M M,LANSEY K E. Optimization of water distribution network design using the shuffled frog leaping algorithm[J]. Water Resources Planning and Management,2003,129(3): 210-225.

[11] 陶新民,徐 晶,杨立标,等.一种改进的粒子群和K均值混合聚类算法[J].电子与信息学报,2010,32(1):92-97.

下载文本