基于遗传算法的子网络生物标记优化方法
通过结合基因表达谱与蛋白质相互作用网络,人们在乳腺癌转移分类预测问题上取得了显著成效。然而,作为基于网络方法的主要步骤之一,子网络乳腺癌转移预测标记的有效识别问题仍然是一个巨大的挑战。现有的典型识别方法是贪婪搜索算法,但其给出的解可能不是全局最优子网络标记,从而削弱了学习机器的预测能力。文章设计了一个基于遗传算法优化乳腺癌转移子网络分类标记的方法,该方法不仅可以找出具有最优鉴别分数的子网络乳腺癌转移预测标记,并且使用这些标记作为特征和3种常见的分类方法(Logistic 回归、支持向量机和随机森林算法)所建立的分类器具有更好的分类预测性能。通过对比各种分类方法,我们认为,经过遗传算法进行特征优化后采用随机森林算法建立的分类器对乳腺癌转移数据的识别率和预测率最精确,并且具有很好的推广作用,可以对为未知类别的乳腺癌转移数据进行较好的判别。
版权所有:中国教育和科研计算机网网络中心 Copyright © 1994-2017 CERNIC,CERNET,京ICP备05078770号,京网文[2014]2106-306号
关于假冒中国教育网的声明 | 有任何问题与建议请联络:Webmaster@cernet.com