简介:MicroRNAs(miRNAs)是一个家庭(2123nt)突然,规章的非编码的RNA处理了从长(70110nt)miRNA先锋(pre-miRNAs)。识别真、假的先锋在miRNAs的计算鉴定起一个重要作用。一些数字特征从先锋序列和他们的第二等的结构被提取了适合一些分类方法;然而,他们可以失去在序列和结构隐藏的一些有用地歧视的信息。在这研究,pre-miRNA序列和他们的第二等的结构直接被用来基于在二个序列之间的加权的Levenshtein距离构造一个指数的核。这个字符串内核然后为检测真、假的pre-miRNAs与支持向量机器(SVM)被相结合。在331上基于训练真、假的人的pre-miRNAs的样品,在SVM的2个关键参数被5褶层选择有不同5褶层分区的十字确认和格子搜索,和5条认识被执行。在16独立人士之中,测试从3人,8动物,2工厂,1个病毒,和2人工地假的人设定pre-miRNAs,我们的方法统计上在11个集合上超过以前的基于SVM的技术包括3人,7动物,和1假人的pre-miRNAs。特别地,有通常在以前的工作被排除的多重环的premiRNAs正确地与92.66%的精确性在这研究被识别。
简介:Inthisstudy,wepresentaconstructivealgorithmfortrainingcooperativesupportvectormachineensembles(CSVMEs).CSVMEcombinesensemblearchitecturedesignwithcooperativetrainingforindividualSVMsinensembles.Unlikemostpreviousstudiesontrainingensembles,CSVMEputsemphasisonbothaccuracyandcollaborationamongindividualSVMsinanensemble.AgroupofSVMsselectedonthebasisofrecursiveclassifiereliminationisusedinCSVME,andthenumberoftheindividualSVMsselectedtoconstructCSVMEisdeterminedby10-foldcross-validation.ThiskindofSVMEhasbeentestedontwoovariancancerdatasetspreviouslyobtainedbyproteomicmassspectrometry.BycombiningseveralindividualSVMs,theproposedmethodachievesbetterperformancethantheSVMEofallbaseSVMs.
简介:AcomputationalsystemforthepredictionandclassificationofhumanG-proteincoupledreceptors(GPCRs)hasbeendevelopedbasedonthesupportvectormachine(SVM)methodandproteinsequenceinformation.ThefeaturevectorsusedtodeveloptheSVMpredictionmodelsconsistofstatisticallysignificantfeaturesselectedfromsingleaminoacid,dipeptide,andtripeptidecompositionsofproteinsequences.Furthermore,thelengthdistributiondifferencebetweenGPCRsandnon-GPCRshasalsobeenexploitedtoimprovethepredictionperformance.ThetestingresultswithannotatedhumanproteinsequencesdemonstratethatthissystemcangetgoodperformanceforbothpredictionandclassificationofhumanGPCRs.
简介:G-proteincoupledreceptors(GPCRs)representoneofthemostimportantclassesofdrugtargetsforpharmaceuticalindustryandplayimportantrolesincellularsignaltransduction.PredictingthecouplingspecificityofGPCRstoG-proteinsisvitalforfurtherunderstandingthemechanismofsignaltransductionandthefunctionofthereceptorswithinacell,whichcanprovidenewcluesforpharmaceuticalresearchanddevelopment.Inthisstudy,thefeaturesofaminoacidcompositionsandphysiochemicalpropertiesofthefull-lengthGPCRsequenceshavebeenanalyzedandextracted.Basedonthesefeatures,classifiershavebeendevelopedtopredictthecouplingspecificityofGPCRstoG-proteinsusingsupportvectormachines.Thetestingresultsshowthatthismethodcouldobtainbetterpredictionaccuracy.
简介:识别蛋白质的细胞的本地化是的潜水艇在基因产品的功能的注解特别地有用。在这研究,我们使用机器学习和探索数据分析(EDA)技术检验并且描绘在九细胞的分隔空间局部性的人的蛋白质的氨基酸序列。代表人的蛋白质的3,749个蛋白质序列的数据集从SWISS-PROT数据库被提取。特征向量被创造捕获特定的氨基酸顺序特征。相对一台支持向量机器,一个多层的视感控器,和一个天真的Bayes分类器,C4.5决定树算法是越过在可靠地预言蛋白质的细胞的本地化基于他们的氨基酸定序的潜水艇的所有九分隔空间的最历久不渝的表演者(平均Precision=0.88;平均Sensitivity=0.86)。而且,EDA图形在每分隔空间描绘了蛋白质的必要特征。作为例子,在血浆膜上局部性的蛋白质有恐水病的氨基酸的更高的比例;细胞质的蛋白质有中立氨基酸的更高的比例;并且mitochondrial蛋白质有中立氨基酸的更高的比例和极的氨基酸的更低的比例。这些数据证明C4.5分类器和EDA工具能为描绘并且预言人的蛋白质的细胞的本地化基于他们的氨基酸定序的潜水艇是有效的。
简介:在cis的第二上的一个部件的transcriptional活动的直接否定的影响被叫作transcriptional干扰(TI)。U6是通常使用在基于向量的RNAi驾驶小发卡RNA(shRNA)表示的一个类型IIIRNA聚合酶III倡导者。在病毒的向量的设计和构造,多重抄写单位可以在空间有限向量在靠近的最近被安排。决定U6倡导者活动是否能被TI影响为在基因治疗的目标shRNA的表示是批评的或loss-of-function学习。在这研究,我们设计了并且实现shRNA和外长的基因表情由二个独立transcriptional单位被驾驶的一个修改retroviral系统。我们安排了在二倡导者安排驾驶shRNA表示和UbiC倡导者的U6倡导者。在主要巨噬细胞,我们发现U6倡导者活动被UbiC倡导者禁止什么时候在分叉的安排然而并非在双人脚踏车。相反,PKG倡导者没有如此的否定影响。而不是提高U6倡导者活动,CMVenhancer面对UbiC倡导者在U6倡导者活动有重要否定影响。我们的结果显示那项U6倡导者活动能被TI影响在一近似倡导者特定并且安排依赖者举止。