转换到繁體中文
您的位置 : 首页 > 报刊

利用改进人工神经网络对中草药大黄的鉴别研究
作者:唐斌 阳丽 杜军    
作者单位:1.四川大学化学学院 , 四川 成都 610064; 2.泸州医学院,四川 泸州 646000;3.宜宾学院,四川 宜宾 644007

《时珍国医国药》 2009年 第4期

  多个检索词,请用空格间隔。
       【摘要】 
       在对大量中草药质量控制实践基础上,该文采用改进的BP算法和近红外光谱对中草药大黄的质量鉴别进行了研究,其具有较高的正确率。同时将改进BP算法的隐含层节点个数和动量因子对正确率的影响与传统BP算法的做了比较研究,并用留一法对其进行了交叉检验,得到了理想的结果。该法具有样品前处理少,测定快速和非破坏性等特点,在中草药的鉴别领域具有较好的前景。
       【关键词】  人工神经网络 BP算法 中草药 大黄
       
       大黄是我国最常用的中草药之一,对正品和非正品大黄的快速、准确鉴别对于大黄及其中草药产品的质量控制具有重要的意义。商品中常混有非正品大黄的根和根茎,使其泻下作用不及正品大黄,有些还能带来坏的影响。长期以来,对大黄生药的鉴定多是依靠其外部形态、性状鉴定、显微鉴定和理化鉴定以确保正品大黄的临床疗效,但这些方法在一定程度上依赖于经验,且对它们的根及其炮制加工后的粉末人们难以区别。人们已提出多种现代检测技术对各种中草药的鉴别做了研究,如红外光谱法、质谱法等[1~5]。人工神经网络是对生物神经网络的一种数学模拟,它利用大量简单的处理单元广泛连接组成复杂网络,来模仿人脑神经结构和功能,从而对信息进行处理。由于神经处理具有自组织、自学习、稳定性、容错性以及非线性信息处理等功能,目前大多数应用误差反向传播算法的前馈神经网络,本文对传统的神经网络进行了改进,对52种大黄样品进行了测定和鉴别,并比较这两种神经网络的隐含层个数和动量因子的影响做了讨论。
       1  BP算法的改进
        经典BP算法的训练过程由信号的正向传播与误差的逆向传播两个过程组成。其中,误差的逆向传播是基于网络全局误差并按“误差梯度下降”的原则对网络权重进行修改。如果对原来基于“全局误差”的权重修改原则进行合理调整,使权重的修改倾向于减小输出值较大样本的网络映射误差,这是峰值识别原理的基本思想,其实质是在误差逆向传播的网络权重修改过程中,遵循了侧重于“峰值样本误差”的权重修改原则。
        首先,我们从经典BP算法开始,设有输入为x1(t)、x2(t)、…、xn(t)的n维输入,输出为xL1(t)、xL2(t)、…、xLm(t)、的m维输出和若干隐层组成的多输入、多输出人工神经网络模型,这里的t为样本序列号,这样的样本共有P对。
        第l层中第i个神经元节点所接收到的上一层输入总和为
        y2i(t)=Ni-=1j=1wlijxl-1j(t)+θli    (1≤l≤L,1≤i≤N1)(1)
        式中:Nl为第l层神经元节点总数;wlij为第l层i节点与第l-1层j节点之间的连接权重;θli为第l层i节点的阈值。
        第l层中第i个神经元节点的输出为
        xli(t)=f(yli(t))=1/l+exp(-θyli(t))(1≤l≤L,1≤i≤N1)(2)
        式中:f(·)为转移函数,这里采用的是对数型的单极性Sigmoid函数;θ为决定Sigmoid函数压缩程度的系数,该系数越大,曲线越陡;反之,曲线越缓。
        当训练次数为k时,网络输出层及隐层的误差信号可表示为
        eL0(k)=pt=1f(yLi(t))(dLi(t)-xLi(t)xt-1(t)
        =pt=1δLi(t)xL-1(t) 1≤i≤NL(3)
        eL0(k)=pt=1f"(yli(t))δl+1i(t)wl+1i(k)xl-1(t)
        (1≤l≤L,1≤i≤N1)(4)
        式中:dLi(t)为训练样本的期望输出。那么网络权重的修改公式为
        wli(k+1)=wli(k)+η(k)eli(k)+a[wli(k)-wli(k-1)](5)
        el0={el0,el1,el2,…,eli…,elN1}  (1≤l≤L,1≤i≤N1)(6)
        式中:η(k)为训练次数为k时的学习率;a为动量项系数。
        以上为经典BP算法的基本内容。现基于峰值识别思想来实现网络误差修正倾向于输出样本的较大值,定义误差修正系数x
        ξi=dLi(t)/dLmax(t)(7)
        式中:dLmax(t)为训练样本期望输出的最大值。
        为了进一步提高神经网络模型的训练速度,改善网络峰值识别的精度,可以在上述修正系数的基础上,增设误差修正放大系数μ,那么,加入误差修正系数ξ及误差修正放大系数μ后,当训练次数为k时,网络输出层误差信号的向量表达式可为:
        e/L0(k)=pt=1f"(yLi(t))(dLi9t)-xLi(t))μξixL-1(y)
        =pt=1δ/Li(t)xL-1(t)        (1≤i≤NL)(8)
        对于隐层神经元,训练次数为k次时,误差信号的向量表达式为
        e/L0(k)=pt=1f"(yLi(t))δ/l+1i(t)wl+1i(k)xl-1(t)
        (1≤l≤L,1≤i≤N1)(9)
        相应的权重表达式为:
        wli(k+1)=wli(k)=η(k)e/l(k)+a[wli(k)-wli(k-1)](10)
        el0={el0,el1,…,eli,elNl}    (1≤l≤L,1≤i≤N1)(11)
        应用该改进的BP算法进行网络训练,能够使峰值误差修正占优,从而提高网络对峰值的映射精度,现利用该修改的BP算法对中草药大黄的质量进行了鉴别。
       2  结果与讨论
        利用文献[6]中的实验方案和实验数据,现用改进的BP算法对这52种大黄的质量进行了鉴别,并与才采用传统BP算法的检验结果进行了比较。为了比较改进的BP算法和传统的BP算法它们的正确率与隐含层节点数之间的关系,现对它们的隐含层依次从1~8进行了比较。见图1。
        从图1可以看出,改进的BP算法的每一个隐含层节点数的正确率都比原算法鉴别的正确率要高,且鉴别的正确率随隐含层数的增加变化较稳定。当隐含的层数为2时,其正确率就升高达93%,其高于传统的BP算法。当将隐含层神经元从2增大到8时, 改进的BP网络对大黄的识别正确率基本趋于平缓, 这其中当隐含层神经元为5时, 改进的BP网络对大黄的识别正确率达到最高, 为98.2 %。但是神经网络一般来说是用于大样本场合,隐含层不超过2,隐含层多可能导致过拟合,非线性程度也会增加。而对于本文中小样本容量的情形,虽然当隐含层神经元为5时其识别的正确率最高,但在这里我们将节点数任选为2。
        动量因子和学习速率是影响BP神经网络训练速率和收敛度的两个重要因素。到目前为止, 还没有严格的系统的理论规则来选择动量因子和学习速率。对于特定的问题, 这些参数通常根据实验来选择。在这项实验中, 我们使用的是Matlab 软件中的内部函数Trainbpx , 其中学习速率一项是由函数自我调整的。因此, 在实验中只需要选择合适的动量因子。在此将动量因子从0.1 到0.9 逐个做,最后, 我们确定最合适的动量因子为0.6。
        图1  正确率随隐含层节点数的变化
        图2  正确率随动量因子的变化
        从图2可以看出, 改进的BP网络对大黄的识别正确率随着动量因子的变化比较平稳, 都达到了94 %以上。调节动量因子, 可以使我们找到最高的识别正确率, 但是如果动量因子太大了, BP 网络就不能收敛了。相比较文献[7]中的结果,改进BP网络的正确率随动量因子的变化较稳定。
        图3  鉴别结果
        为了便于比较改进前和改进后BP神经网络在中药质量检测中性能的提高,检验阈值设定为0.5,从图3可以发现, 有两个大黄样品在改进BP 网络的鉴别之外, 被识别错误。第37个样品输出值为0.866 6 , 第45个样品输出值为0.616 54。这两个样品为鉴别错误的样品。其他50个样品的鉴别是正确的。从总体来看, 使用BP 网络鉴别大黄样品识别正确率达到了96.115 %。
       3  结论
        利用改进的神经网络,结合红外光谱相对中草药大黄进行正品的高效鉴别。该法继承了大黄样品粉碎后无需进行复杂的处理, 可以用近红外光谱仪进行分析监测等优点。改进后神经网络的鉴别正确率较高。用独立预测样本进行检验比较可以发现, 其识别正确率可达到96.115 %,鉴别结果稳定。本方法操作简便、无污染、低消耗, 是一个很有发展前途的鉴别中草药的方法。
       【参考文献】
         [1] 孙素琴, 周 群, 梁曦云, 等.七种花旗参茶包的FTIR光谱法无损鉴别[J].光谱学与光谱分析,2002 , 22 (4) : 600.
       
       [2] 孙素琴, 梁曦云, 杨显荣.六色灵芝的FTIR快速无损鉴别[J].光谱学与光谱分析,2002 , 22 (2) : 226.
       
       [3] 董 彬, 孙素琴, 周红涛, 等.红外光谱和聚类分析法无损快速鉴别赤芍[J].光谱学与光谱分析,2002 , 22 (2) : 232.
       
       [4] 陈 斌, 赵龙莲, 李军会, 等.近红外光谱法快速分析葛根中的有效成分[J].光谱学与光谱分析,2002 , 22 (6) : 976.
       
       [5] 袁湘林, 张玉奎, 邹汉法.基体辅助激光解吸电离飞行时间质谱用于中草药黄芪鉴别的研究[J].药物分析杂志,2001,21(1):7.
       
       [6] 汤彦丰,张卓勇,范国强.中草药大黄的近红外光谱和人工神经网络鉴别研究[J].光谱学与光谱分析,2004 , 24 (11) : 1348.
       
       [7] 马 波,周在德,李梦龙.人工神经网络及其在色谱中的应用[J].化学研究与应用,2000,12(4):375.

经典中医古籍

中药学教材(附图片)

穴位数据库(附图片)