独立分量分析及其在生物医学工程中的应用

(整期优先)网络出版时间:2022-10-20
/ 3

独立分量分析及其在生物医学工程中的应用

钱泽众

身份证号码:220182198003060410

摘要:独立分量分析(简记 ICA)是近年来发展起来的一项新技术。ICA与 PCA 或 SVD 的最大区别在于:后者所得到的各个成分仅仅是彼此无关,而前者需要各个成分在统计上彼此独立。由于人体表面检测到的信号通常含有几个相互独立的成份,故使用 ICA技术进行分析,得到的结果更具生理学上的意义,以消除干扰和伪迹。

关键词:独立分量分析;生物医学工程

引言

ICA是近年来统计信号处理领域的一个新进展。正如它的名字所示,它是一种将信号分解为几个独立的组成部分的技术。PCA和 SVD是一种常用的分解信号的线性代数方法, ICA与其最大的区别在于:

(1)后者仅要求被分解的各个成分彼此垂直(无关),但不需要彼此独立,以统计信号处理语言表示,也就是说,后者仅考虑二次统计特征,而前者更充分地考虑其概率密度函数的统计独立性。

(2)后一种方法是按照能量的等级来考虑被分解的成分的重要程度。这种分解方法具有很好的数据压缩和消除弱噪声的优势,但是其分解的结果通常没有明显的生理含义。前者的分解结果虽有一定的不确定性,但是如果它是多个独立的信源,那么它的分解结果就会有较好的生理上的解释。

因为测量的生理学信号通常是多个独立分量的累加(例如,引起的脑电通常会被自发的脑电所覆盖,并经常伴有心电、眼动、头皮肌电等)。另外,神经生理学的研究表明:人类在认知和感知信息的早期处理中存在着“去冗余”的特征, ICA也具有相似的特征,这是由于它们的相互关联的信息最少。

ICA是随着盲信号处理技术的发展而兴起的,尤其是盲信源分离技术,目前已成为生物医药工程领域关注的热点。在国际上,下列研究机构的工作在当前的工作中处于领先地位:

(1)美因加州大学生物系计算机神经生物学实验室。

(2)日本 Riken脑科研究所脑部资讯研究室,网址:http://www.ww. bip. riken. jip

(3)分兰赫尔辛基理工大学计算机与资讯科学实验室,网址: I/www.cis.hut.fi

目前已出版比较多的期刊包括 IEEETrans的 SP、 NN、 Neural Computation等。本文的主要内容是对 ICA的原理、算法和应用进行简要的介绍,以期引起国内同行的重视。将集中在概念描述上,而非在数学上严格。

一、原理

1.1 提出的问题

如下所示为一组相互独立的信号源,其中 A为混合矩阵, (n)为观测记录。即(n)= A(n)。问题的任务是:如果 A阵是未知的,而对于 i(n)没有其他的先验知识,则解混矩阵 B,以便使处理的结果(n)= B(n)中的各个成分尽量彼此独立,并且通近 (n)易于理解,解不是惟一的,而是由下列条件所限定:

                       

图1独立信息源分解的框图示意

(2)排序不确定:在中,各个成分的顺序可能是不同的,因为 B阵列中的任何一条线都能对齐。

(3)最多(n)中只有一个高斯类型的信源,这是由于高斯信源的线性结合仍然是高斯类型,所以在混合后不可能有任何区分。

(4)信源数 N仅可小于或等于观察信道数 M。                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                                        

这样(n)仅仅是在以上情况下近似(n)。也就是说,任务的本质是最优问题,由最优准则(目标函数)和最优方法两部分组成。

1.2目标函数

学者们从不同的视角提出了许多准则。在这些准则中,最常用的是互信息极小准则(简记 MMI)和最大信息或熵最大准则(简记 ME)。因为最基础的独立性准则应该从概率密度函数(简记 pdf)中得到,而在工作时 pdf通常是不知道的,而且估算起来也很困难,所以一般都是通过某些方法来避免这个问题。一般有两种方法:将 pdf按级数展开,把 pdf的估算转换成高阶统测量的估算;将一个非线性链路引入到图1的输出中,以求得到最优解。后者的方法实际上是在暗中引进高阶统计。

二、处理算法

最优算法可以分为批量优化和自适应处理两种。

2.1批量优化

目前已有两种较为成熟的批处理方法,其中最早的一种是成对旋转法,它的特征是将最优解分成两个阶段(见下图)。首先将(n)“球化”成 Z (n),使得 z (n) T= In,也就是:各个成分不相关,并且方差为1,然后,通过寻找适当的正交归阵来实现各个成分的独立性。第一个步骤与 PCA相似。第二个步骤是利用 Givens的转动,使 z中的各个成分在两个方向上重复地转动,直至收敛。1999年, Gadoso又提出了一些改进的办法,如 Maxkurt法、 JADE法、 SHIBBS法等。

                  IMG_256

                         图2成对旋转的两步示意图

   最近几年出现的一种新的方法就是“固定点”法,虽然它的思想来自于自适应过程,但是它的最后一种算法是批处理。简言之,用随机梯度方法对 B阵列进行调整以实现最优的目的是:

                          B(k+1)=B(k)+$B(k)

                           $B(k)=-L

在式中 k为选代序列,Ek为暂时性的目标函数,在达到稳定状态时,必须有[E为集合平均运算符]:

E[$B(k)]=0                          (1)

若$B(K)涉及B(K),则B的稳定值可从(1)方程中得到。但(1)式始终是一个非线性的,所以在求解过程中,仍然要用牛顿法共轭梯度法等数值计算方法。结果表明,该算法在收敛速度和计算量上都优于前者,并能按需逐次抽取最重要的 yi,因而具有很好的应用前景。

2.2自适应处理与神经网络相结合的方法

下面是一个与神经网络相结合的自适应优化算法。Cichocki于1994年提出的调整算法如下:

B(k+1)=B(k)+$B(k)

$B(k)=Lk[1-7(yk)5T(k)]B(k)

式中7和5是N维向量,它们的每个单元都是一个非线性的单调升函数:

7(yk)=sgnyk×yk2,5Tyk=3tanh(10yk) 得到虽然效果很好,但其方法却是经验的。

                 IMG_256

                       图3 自适应处理的框图

此后,学术界对此进行了较深入的探讨,并发展出许多新的算法。

三、应用举例

3.1模拟运算

通过模拟试验,验证了 ICA算法对信源进行了分解。左边的图片是一套不为系统所知的信号。将该信号集合用来作为 ICA算法(在图中示出),并将其分解的结果显示在右边。可见,在波形、极性、振幅等方面,源信号的波形得到了很好的分解。

临床 EEG信号通常包含有高斯组分(例如诱导电位)和亚高斯(肌电、工频等)。为了测试 Infomax算法在这种情形下的应用,我们做了一个模拟试验,左边的第一行是自发EEG,第二排是模拟的视觉诱导电势,最后一排是肌肉电的干扰。通过 ICA对混合后的信号进行 ICA分析,得出了如下所示的结果,该结果说明了当有亚高斯和超高斯信号时,该方法仍能有效地进行盲分解。但是需要注意的是:由于尚未包含多个传导信号,所以该模拟并不能直接由ICA分解获得视觉诱发电位。

IMG_256

线性混合信号盲分解模拟实验图

模拟原始信号                随机混合后的信号             ICA分解结果    

      

诱发电位单次提取的模拟实验图 

3.2试验VEP分析

(1)多导脑电观察 VEP的强化:多导脑电分析 ICA后,将 VEP相关的成分提取出来,不会产生 VEP,因为这只是一种信号,而不是在头皮上,所以,要获得电极上的 VEP分量,必须按照以下的步骤进行:用训练所得的 W阵列,将多导脑电信号的 ICA分解,从而获得每一独立分量的矩形。然后,根据各个成分的波形特性和发生周期,选取与VEP相关的成分(例如,在最初300毫秒内,振幅更大),将剩余的成分设为0,从而获得新的独立分量矩阵y';将其反向转换到每个头皮的电极上,得到x'=B-1-y '。

通过这种方法,可以大大降低提取VEP所需的累积次数。相干平均和ICA处理结果的比较图中的图片左边是经过3次累积得到的VEP,中间的图片是经过50次的累积,右边的是经过ICA处理的VEP。比较中、右图的波形趋势大致一致,但后者的主要峰、谷明显更明显,累积的频率从50降至3。

   

VEP增强过程图

           

相干平均和ICA处理结果的比较

(2)ICA分量的空间模式

通过B-1将 ICA成分的瞬时值倒推至每个电极,获得r',然后用断层插补法求出了该成分在头皮上的空间分布。这种空间分布图还可以用一种更简单的方法获得:将B-1的每一组元素的值分配给每个 ICA的电极。通过对断层图像进行插补,可以显示出任何时间内 LCA成分的空间分布。

四、结束语

文章对 ICA的原理、算法、应用作了粗略的介绍,可见 ICA的确是一个值得关注的领域,但是它的理论体系并不完善,在实践中所采取的处理方式仍具有一定的实践意义。比如,对于非线性性质,为何不能很严格地加以说明;在实际应用中,算法的稳定性和收敛性是一个很常见的问题。在实际应用中,尚有很多研究方向,比如在生理信号模式识别和系统建模中的应用。

参考文献:

[1]Comon P. Independent component analysis:A new oncept? [J]. Signal PD cessng,1994, 35( 3) :287-314.

[2]Cardoso JF. Higher σder o ntrasts frindependent component analysis [J].N eural

Co mput ation, 1999, 11(1): 157493.

[3]Hyvar inen A, 0E. A fast fixel 7o intalgσ ithm fr independentComponent analysis[J ] Neural mputation 1997, 9(6): 1483-4492.

[4]Hyvar inen A. Fast and D bust fixel-po int algσithm 6r independent Component analysis[ J].IEEE Trans NN, 1999, 10( 3) :626-634.

[5] Cichocki A, U nbehanen R Rummet E Bo b-ust lerning ag σ ithm 6 r blind separ ation fsour es[J} Electr onic L etters, 1994, 30( 17):1386-1387.

[6] A mari SI. N atural gradient w σ ks effcientlyin learning[ J]. Neur al Computation 1998, 10(2):251-276.