基于SVM分类器的阿尔茨海默病早期辅助诊断系统

(整期优先)网络出版时间:2021-09-04
/ 2

基于 SVM分类器的阿尔茨海默病早期辅助诊断系统

鞠思奇、王震昭、丛源昊、王淑娇

山东协和学院 山东 济南 250107


摘要:人口老龄化加剧,阿尔茨海默病病人逐年上升,医疗系统面临越来越严峻的挑战,早期是治疗的黄金时间,早发现、早治疗,可以控制病情发展。影像检查可辅助诊断,如头CT(薄层扫描)可显示脑皮质萎缩明显,特别是海马及内侧颞叶,支持AD的临床诊断。MRI对检测皮质下血管改变(例如关键部位梗死)和提示有特殊疾病(如多发性硬化进行性核上性麻痹多系统萎缩、皮质基底节变性、朊蛋白病、额颞叶痴呆等)的改变更敏感。

关键词:阿尔茨海默病、SVM

前言

阿尔茨海默病是一种致死性的神经退行性疾病,65岁以上的人群发病率高,且发病率随着年龄逐渐增高。通过CT和MRI的图像来判断是否患病。随着科学技术的发展,医学影像技术也在快速发展,通过脑图像自动判断来辅助医生诊断,以此来提高诊断的效率和准确性,因此此类系统发展空间非常大。

1.SVM算法原理

SVM学习的基本想法是求解能够正确划分训练数据集并且几何间隔最大的分离超平面。如下图所示,6133387676a33_html_cc8e3d243e1aed1e.png 即为分离超平面,对于线性可分的数据集来说,这样的超平面有无穷多个(即感知机),但是几何间隔最大的分离超平面却是唯一的。

在推导之前,先给出一些定义。假设给定一个特征空间上的训练数据集6133387676a33_html_736ee6ce28e9d600.png

其中,6133387676a33_html_ff58bcd896f25844.png  为第6133387676a33_html_3a2c0ead2ed164e1.png 个特征向量,6133387676a33_html_5671cc551173d9b5.png 为类标记,当它等于+1时为正例;为-1时为负例。再假设训练数据集是线性可分的。

几何间隔:对于给定的数据集T和超平面6133387676a33_html_cc8e3d243e1aed1e.png ,定义超平面关于样本点6133387676a33_html_7ff3813a373e6934.png 的几何间隔为

6133387676a33_html_79c77bb5c8942a4c.png

超平面关于所有样本点的几何间隔的最小值为

6133387676a33_html_61215a15c15ccd8b.png

实际上这个距离就是我们所谓的支持向量到超平面的距离。

根据以上定义,SVM模型的求解最大分割超平面问题可以表示为以下约束最优化问题

6133387676a33_html_68aa6c756b83e3ad.png

将约束条件两边同时除以6133387676a33_html_98fe8d8b8d42259.png ,得到

6133387676a33_html_edaf2c60a51f17c5.png

因为6133387676a33_html_dc42767cd95a5a76.png 都是标量,所以为了表达式简洁起见,令

6133387676a33_html_edb779328a2e7d56.png

得到

6133387676a33_html_223cf3878981e07f.png

又因为最大化6133387676a33_html_98fe8d8b8d42259.png ,等价于最大化6133387676a33_html_695721945f2487e5.png ,也就等价于最小化6133387676a33_html_2e19aa0562295a7a.png (1/2是为了后面求导以后形式简洁,不影响结果),因此SVM模型的求解最大分割超平面问题又可以表示为以下约束最优化问题

6133387676a33_html_d633ecfa4a4bb6d8.png

这是一个含有不等式约束的凸二次规划问题,可以对其使用拉格朗日乘子法得到其对偶问题(dual problem)。

首先,我们将有约束的原始目标函数转换为无约束的新构造的拉格朗日目标函数

6133387676a33_html_a28000cebbb969fe.png

其中6133387676a33_html_eec7c4c2da0ee6ea.png 为拉格朗日乘子,且6133387676a33_html_dfc139c936ff2d00.png 。现在我们令

6133387676a33_html_bc4c2cd8f8c5dbbe.png

当样本点不满足约束条件时,即在可行解区域外:

6133387676a33_html_47ba19164e557a63.png

此时,将6133387676a33_html_eec7c4c2da0ee6ea.png 设置为无穷大,则6133387676a33_html_6edfbe4d0d83ac81.png 也为无穷大。

当满本点满足约束条件时,即在可行解区域内:

6133387676a33_html_f71d5a269c5e669c.png

此时,6133387676a33_html_6edfbe4d0d83ac81.png 为原函数本身。于是,将两种情况合并起来就可以得到我们新的目标函数

6133387676a33_html_6b12f8390185d438.png

于是原约束问题就等价于

6133387676a33_html_c4278ce070283803.png

为求解过程好做,我们需要使用拉格朗日函数对偶性,将最小和最大的位置交换一下,这样就变成了:

6133387676a33_html_cf4a6110b2dd0745.png

要有6133387676a33_html_6de0a2c4a3ddeb49.png ,需要满足两个条件:

① 优化问题是凸优化问题

② 满足KKT条件

首先,本优化问题显然是一个凸优化问题,所以条件一满足,而要满足条件二,即要求

6133387676a33_html_9f5fd79075e3c237.png

为了得到求解对偶问题的具体形式,令6133387676a33_html_4fd35d5ec4182ccd.png6133387676a33_html_5c16cd7c52c22c2.png6133387676a33_html_fcf0648f18fc265d.png 的偏导为0,可得

6133387676a33_html_94dc401b7b1b30b8.png

将以上两个等式带入拉格朗日目标函数,消去6133387676a33_html_5c16cd7c52c22c2.png6133387676a33_html_fcf0648f18fc265d.png , 得

6133387676a33_html_9e31e920bc68baaf.png

6133387676a33_html_f7d4cabce0b2525b.png6133387676a33_html_dee0e955f724d936.png 的极大,即是对偶问题

6133387676a33_html_184e71c16bf42983.png

把目标式子加一个负号,将求解极大转换为求解极小

6133387676a33_html_f15dab5b869319fc.png

现在我们的优化问题变成了如上的形式。对于这个问题,我们有更高效的优化算法,即序列最小优化(SMO)算法。

前面的推导都是假设满足KKT条件下成立的,KKT条件如下

6133387676a33_html_4b3759686a772b86.png

另外,根据前面的推导,还有下面两个式子成立

6133387676a33_html_6d7cdd4ddcb67a99.png

由此可知在6133387676a33_html_e519666f7f250c05.png 中,至少存在一个6133387676a33_html_120d456f84887930.png (反证法可以证明,若全为0,则6133387676a33_html_2fbc05ac110a0528.png ,矛盾),对此6133387676a33_html_f6b0fe19c6d31d47.png

6133387676a33_html_49ac0cb03196381.gif6133387676a33_html_b59a8849336f02ae.png

因此可以得到

6133387676a33_html_9dc61e52ff08ef48.png

对于任意训练样本6133387676a33_html_4fa5bb87ef474a51.png ,总有6133387676a33_html_f3a9ef51f71f4032.png 或者6133387676a33_html_54fe085c956461fd.png 。若6133387676a33_html_f3a9ef51f71f4032.png ,则该样本不会在最后求解模型参数的式子中出现。若6133387676a33_html_e984d7986bd4c6e4.png ,则必有6133387676a33_html_54fe085c956461fd.png ,所对应的样本点位于最大间隔边界上,是一个支持向量。这显示出支持向量机的一个重要性质:训练完成后,大部分的训练样本都不需要保留,最终模型仅与支持向量有关。

“软间隔”的概念,即允许某些点不满足约束

6133387676a33_html_8fb56cf21fddb9d5.png

采用hinge损失,将原优化问题改写为

6133387676a33_html_1bca5b344d5f3003.png

其中6133387676a33_html_1d2ab8beffe6ebb8.png 为“松弛变量”,6133387676a33_html_112baee3c3e8437e.png ,即一个hinge损失函数。C>0称为惩罚参数,C值越大,对分类的惩罚越大。线性支持向量机学习算法如下:

输入:训练数据集6133387676a33_html_96f7d66a44c72320.png 其中,6133387676a33_html_ec45244401200e54.png6133387676a33_html_1081f885f537d1b4.png

输出:分离超平面和分类决策函数

  1. 选择惩罚参数C>0,构造并求解凸二次规划问题

6133387676a33_html_d80b1c7d9354858f.png

得到最优解6133387676a33_html_8bd92267fe0116cf.png

(2)计算

6133387676a33_html_2d1eb5b62e228360.png

选择6133387676a33_html_a0a13d578a94e2b7.png 的一个分量6133387676a33_html_be24dc27eb4224e6.png 满足条件6133387676a33_html_fcf1e4388b7e0cd4.png ,计算

6133387676a33_html_5449073075b49fe0.png

(3)求分离超平面

6133387676a33_html_7f464bb4a7cb55f3.png

分类决策函数:

6133387676a33_html_b1da3982c44da64.png

2.非线性SVM算法原理

核函数表示,通过一个非线性转换后的两个实例间的内积。具体地,6133387676a33_html_23cc980f1c23e2b6.png 是一个函数,或正定核,意味着存在一个从输入空间到特征空间的映射

6133387676a33_html_6355ed60d492386.png ,对任意输入空间中的6133387676a33_html_1043212115fcfe7f.png ,有

6133387676a33_html_1095c391912b59c4.png

在线性支持向量机学习的对偶问题中,用核函数6133387676a33_html_23cc980f1c23e2b6.png 替代内积,求解得到的就是非线性支持向量机

6133387676a33_html_5cdb6c3a89763f97.png

综合以上讨论,我们可以得到非线性支持向量机学习算法如下:

输入:训练数据集6133387676a33_html_fcc12a75d681168.png 其中,6133387676a33_html_e14b08a4e082fbe6.png6133387676a33_html_f5ba5327065b813b.png

输出:分离超平面和分类决策函数

(1)选取适当的核函数6133387676a33_html_23cc980f1c23e2b6.png 和惩罚参数C>0,构造并求解凸二次规划问题

6133387676a33_html_e6e6eb9c69ce1ab3.png

得到最优解6133387676a33_html_861a3c899a207447.png

(2)计算

选择6133387676a33_html_a0a13d578a94e2b7.png 的一个分量6133387676a33_html_be24dc27eb4224e6.png 满足条件6133387676a33_html_fcf1e4388b7e0cd4.png ,计算

6133387676a33_html_efd9c3d4f751fcf9.png

(3)分类决策函数:

6133387676a33_html_c25ea263ce365773.png

介绍一个常用的核函数——高斯核函数

6133387676a33_html_ef107c5ce8921fe0.png

对应的SVM是高斯径向基函数分类器,在此情况下,分类决策函数为

6133387676a33_html_31db66e81f8e0e84.png

3.结语

本文提出了SVM在阿尔茨海默病诊断中的应用,阐述了SVM的基本原理,为阿尔茨海默病的早期诊断做了技术基础。但是疾病的诊断是一个复杂且庞大的工程,需要我们不断地创新。

参考文献:

  1.  R. Brookmeyer, E. Johnson, K. Ziegler-Graham et al., "Forecasting the global burden ofAlzheimer's disease," Alzheimer's and Dementia, 3(3), 186- 191 (2007).
    [2] P. D. Sloane, S. Zimmerman, c. Suchindran et al., "The public health :mpact of Alzheimer'sdisease, 2000 -2050: potential implication of treatment advances," Annual Review of PublicHealth, 23(1), 213-231 (2002).