转换到繁體中文
您的位置 : 首页 > 报刊

基于LM-BP神经网络的穿心莲药材分类识别
作者:周舒冬 李倚岳 李丽霞 张敏    
作者单位:广东药学院,广东 广州 510310; 广东省万年青制药有限公司,广东 汕头 510021

《时珍国医国药》 2009年 第3期

  多个检索词,请用空格间隔。
       【摘要】 
       目的建立高效准确的穿心莲样品识别模型,为进行质量控制提供参考。方法收集不同产地的12个穿心莲药材样品的指纹图谱,提取4个主成分利用LM-BP神经网络进行模式识别。结果建立了穿心莲药材指纹图谱的LM-BP神经网络模型,经过对不同产地穿心莲的识别,证明其有较好的识别功能。结论LM-BP算法在识别速度和精度上都比传统BP算法有了较大提高。
       【关键词】  LM-BP神经网络 穿心莲 指纹图谱
       为了更全面地检测各种成分在药材中分布的全貌,评价药材质量,促进优质中成药的生产,对中药品种的分类识别是一个首要环节[1]。我国中药材产地多,资源丰富、品种繁多、来源复杂,单凭传统的经验鉴别容易造成失误,而随着计算机技术发展和模式识别算法的提出和改进,利用中药指纹图谱进行中药材鉴定已经取得了长足发展。由于中药指纹图谱含有大量信息,形成一个巨大的多维信息库,且同时存在一些噪声干扰而真伪难辨等,因此如何提高中药指纹图谱的识别效率,获取更多有用的数据信息成为亟待解决的问题。本研究结合Levenberg-Marquardt算法与BP神经网络技术,提取不同产地批次的穿心莲中药指纹图谱的特征空间信息,利用Matlab7.0软件编程建立高效准确的穿心莲样品识别系统。
       1  材料与仪器
       1.1   样品来源  12批穿心莲药材样品由广东省中药研究所提供,经广州华南植物研究所陈炳辉研究员鉴定为穿心莲Andrographis paniculata(Burm.f.)Nees,其中4批产自江西,5批来自广东,福建3批。
       1.2   试剂 乙腈(色谱纯),甲酸(分析纯),二次蒸馏水(自制)。
       1.3   仪器Agilent四元泵高效液相色谱仪、SPD210A紫外检测器,LC210ATVP输液泵、UV24802型紫外可见分光光度计,AR2140电子分析天平。
       2  方法
       2.1   色谱分析条件 Phenomsil ODS柱( 250 mm ×4.6 mm,5 μm),0.1%甲酸乙腈(A)与0.2%甲酸(B)梯度洗脱:0~20 min(20%A-80%B),20~40 min(30%A -70%B),40~55 min(40%A -60%B),55~60 min(85%A-15%B)。流速1.0 ml/min,柱温25。C,检测波长254 nm,进样量10 μl,所有组分均在60 min内被洗脱。
       2.2   对照品溶液的制备精密称取穿心莲内酯、脱水穿心莲内酯、新穿心莲内酯和脱氧穿心莲内酯对照品适量,用50%甲醇配制成1.0 mg/ml的对照品溶液。
       2.3   供试品溶液的制备 取各批干燥的穿心莲药材2.0 g,粉碎,过40目,用20 ml 85%的乙醇回流提取两次,2 h/次,过滤,合并滤液,回收乙醇,滤液浓缩至干,再加50%甲醇使其充分溶解,置10ml量瓶中稀释至刻度,作为供试品溶液。
       2.4   方法学考察
       2.4.1   精密度实验取供试品溶液(样品1),连续进样6次,各主要色谱峰的相对保留时间和相对峰面积比值的RSD均小于3.0%,表明仪器精密度良好。
       2.4.2   稳定性实验取供试品溶液(样品1)分别在0,1,2,4,12,24 h进样测定,各主要色谱峰的相对保留时间和相对峰面积比值的RSD均小于3.0%,表明样品在24 h内稳定。
       2.4.3   重复性实验取穿心莲药材(样品1),按“2.3”项下的方法分别制备供试品溶液6份,进样检测,结果各主要色谱峰的相对保留时间和相对峰面积比值的RSD均小于3.0%,表明方法的重复性良好。
       2.5   模式识别方法
       2.5.1   模式识别和BP神经网络模式识别作为一个研究领域,迅速发展于20世纪60年代,它是一门以应用数学为理论基础,利用计算机应用技术,解决实际分类及识别问题的学问[2]。
       
       神经网络是一种模拟人脑功能的成熟的模式识别方法,它借鉴了人脑神经系统处理信息的过程,以数学网络拓扑结构为理论基础,其中BP神经网络是迄今为止应用最为广泛的神经网络[3]。
       
       BP神经网络是一种有监督的学习算法,它的特点是同一层内的神经元不连接,在整个信号传递过程中不存在任何信号反馈;输入层用于信号分配和传递,不具备运算功能;隐含层和输出层的神经元具有运算功能,可输出最终运算结果。BP神经网络的学习过程有正向与反向两个过程,在正向传播过程中,输入信息从输入层经过隐含层传向输出层,若不能得到预期输出,则转为反向传播,将信号沿原来的连接通道返回并修改各层节点间的权值,经过反复调试,使得误差信号小于某个阈值或等于0,此时训练结束。经过训练的网络则可将系统规则、预测能力等隐含在网络中,只需将测试样本输入则可给出处理结果。
       2.5.2   Levenberg-Marquardt算法改进的BP算法BP神经网络的常规算法在实际应用还存在一些需要改进的问题,例如网络学习收敛速度慢,容易陷入局部极小等。而L-M算法是专门用于误差平方和最小化的方法,它在网络训练速度和识别精度上的具有明显的优势[4],因此本研究采用L-M算法对标准的BP算法进行改进。
       
       设BP神经网络的误差指标函数为:
       
       E(x)=12¶Ni=1‖Yi-Y^i‖2=12¶Ni=1e2i(x)
       
       其中,Yi为实际输出向量, Y^i为预期的输出向量, ei(x)为误差。
       
       设xk表示第k次迭代的权值和阈值组成的向量,新的权值和阈值组成的向量xk+1表示为:
       
       xk+1=xk+△x,△x=[JT(x)J(x)=μI]-1J(x)e(x)
       
       其中, J(x)为网络训练误差e(x)的Jacobian矩阵, I为单位矩阵, μ>0。
       
       L-M算法的流程:①给出训练误差允许值ε,常数β和μ0,初始化权值和阈值向量k=0,μ=μ0。② 计算网络输出及误差指标函数E(xk)。 ③计算Jacobian矩阵J(x)。④计算△x 。⑤如果E(xk)<¶,则转到⑥,否则以xk+1=xk+△x为权值和阈值向量计算误差指标函数E(xk+1),若E(xk+1)<E(xk),则令k=k+1,μ=μ/β,转到②;否则令μ=μβ,转到④。⑥结束。
       
       当μ=0时,L-M算法即高斯-牛顿法,当μ取值很大时,则越接近梯度下降法。在实践中,它具有二阶收敛速度,所需要的迭代次数很少,既具备牛顿法的局部收敛特性,又有梯度下降算法的全局特性。因此,L-M算法提供了一种快速有效的训练手段,其算法计算复杂度为O(n3/6) 。
       2.6   指纹图谱的建立和分析
       2.6.1   穿心莲的指纹图谱 按照上述方法,分别对12批穿心莲药材进行分析,制作了穿心莲药材的HPLC指纹图谱,并计算出其穿心莲内酯、脱水穿心莲内酯、新穿心莲内酯和脱氧穿心莲内酯的含量。
       2.6.2   资料预处理  为消除由于数据变换的幅度和范围以及数据分布的非正态性对结果的影响,先将原始数据进行标准化变换。
       2.6.3   LM-BP神经网络结构及训练测试结果本实验所采用的3层LM-BP网络中,输入节点数为4,即原始数据经特征提取后的4个主成分,隐含层节点数为4,输出层有1个节点。由于目前仍无系统的关于中间隐层节点数的选取理论,经多次实验比较,最终选取隐层节点数为4时效果比较显著。
       
       动量因子和学习速率是影响BP神经网络训练速率和收敛度的两个重要因素。如果学习效率和动量因子过大则网络收敛很快,但最后网络发生振荡,失去功能;如果学习效率和动量因子太小则学习速度太慢,网络性能也会受到影响。因此经实验比较选择,本网络的最佳学习率为0.05,动量因子为0.6。
       
       由于实验的样品数目较少,故采用交叉验证法进行分类验证,也就是说将标准化变换后的每个样本依次作为待测样本,用剩余的其它样本组成新的训练集建立学习模型,用于预测每个样本的归属。
       
       经过LM-BP神经网络的训练,可发现有一个穿心莲样品被识别错误,这份来自江西的样品被鉴别为福建的样品,其他11个样品的鉴别结果均正确。从总体来看,使用LM-BP网络鉴别穿心莲样品的识别正确率达到了91.67%,结果见表1。
       表1  LM-BP神经网络对穿心莲预测样本的预测结果(略)
       同时实验预先使用传统BP神经网络进行训练学习,发现虽然传统BP神经网络的鉴别结果与改进的模型结果一致,但从训练的速度进行比较,LM-BP算法的收敛速度很快,而传统算法的收敛速度则比较缓慢,其误差收敛曲线图如图1和图2。
       图1  传统BP神经网络的误差收敛曲线(略)
       图2  LM-BP神经网络的误差收敛曲线(略)
       3  讨论
       
       中药指纹图谱是一种综合的、可量化的鉴定手段[5,6],它是建立在中药化学成分系统研究的基础上,它能通过指纹图谱的特征性来有效鉴别样品的真伪或产地,并且能够通过指纹图谱主要特征峰的面积或比例的确定,有效控制产品的质量,确保产品质量的相对一致。但由于受到不同产地及不同采收期的影响,当不同药材样品的指纹图谱非常相似时,不可能用直接观察的方法对各类产区的药材作出准确鉴别,如果使用简单的传统相关系数法,当样品间的相关系数非常大也很难作出鉴定。因此使用神经网络方法可对相似度较高的样品分类鉴定作深入地研究。
       
       本文首先利用穿心莲HPLC的指纹图谱资料建立了LM-BP神经网络模型,测试时只需将样品的主要图谱数据作为输入,则可输出相应的产地类别,操作简便快捷。由于中药指纹图谱的模糊综合等特性,单纯依靠人工识别容易出现混淆,因此借助人工神经网络技术对中药指纹图谱资料进行分析,充分利用了模糊、非线性的技术特性,可以真实反映中药材的内在质量。
       
       应用基于L-M算法的神经网络进行穿心莲药材的识别分类,训练时间比普通的BP网络训练时间短,且拟合精度并未降低。本方法克服了传统BP网络训练时间长、易陷入局部极小的局限性,在对识别精度和识别速度要求比较高的情况下,采用L-M算法改进的BP网络可以达到很好的效果,具有一定的实用价值。
       【参考文献】
          [1] 万绍晖,万绍明,康廷国.系统科学在中药质量控制中的运用[J].时珍国医国药,2005,16(5): 457.
       
       [2] Andrew R.Webb著.王 萍,杨培龙,罗颖昕译.统计模式识别,第2版[M].北京:电子工业出版社, 2004.
       
       [3] 汤 丹,李 薇,许 毅,等.广藿香指纹图谱解析的人工神经网络方法研究[J].中药材,2004,27 (7): 534.
       
       [4] 赵 弘,周瑞祥,林廷圻.基于Levenberg-Marquardt算法的神经网络监督控制[J].西安交通大学学报,2002,36(5):523.
       
       [5] 林蔚兰,曾令杰,梁惠瑜.不同产地穿心莲药材HPLC指纹图谱初步研究[J].中成药,2007,29 (5): 730.
       
       [6] 梁永枢,段 启,方丽华,等.广东德庆何首乌药材HPLC指纹图谱方法学研究[J].广东药学院学报, 2006,22(3):265.

经典中医古籍

中药学教材(附图片)

穴位数据库(附图片)