学科分类
/ 1
7 个结果
  • 简介:MicroRNAs(miRNAs)是一个家庭(2123nt)突然,规章的非编码的RNA处理了从长(70110nt)miRNA先锋(pre-miRNAs)。识别真、假的先锋在miRNAs的计算鉴定起一个重要作用。一些数字特征从先锋序列和他们的第二等的结构被提取了适合一些分类方法;然而,他们可以失去在序列和结构隐藏的一些有用地歧视的信息。在这研究,pre-miRNA序列和他们的第二等的结构直接被用来基于在二个序列之间的加权的Levenshtein距离构造一个指数的核。这个字符串内核然后为检测真、假的pre-miRNAs与支持向量机器(SVM)被相结合。在331上基于训练真、假的人的pre-miRNAs的样品,在SVM的2个关键参数被5褶层选择有不同5褶层分区的十字确认和格子搜索,和5条认识被执行。在16独立人士之中,测试从3人,8动物,2工厂,1个病毒,和2人工地假的人设定pre-miRNAs,我们的方法统计上在11个集合上超过以前的基于SVM的技术包括3人,7动物,和1假人的pre-miRNAs。特别地,有通常在以前的工作被排除的多重环的premiRNAs正确地与92.66%的精确性在这研究被识别。

  • 标签: 链内核 支持向量原理 MIRNAS 前体
  • 简介:Inthisstudy,wepresentaconstructivealgorithmfortrainingcooperativesupportvectormachineensembles(CSVMEs).CSVMEcombinesensemblearchitecturedesignwithcooperativetrainingforindividualSVMsinensembles.Unlikemostpreviousstudiesontrainingensembles,CSVMEputsemphasisonbothaccuracyandcollaborationamongindividualSVMsinanensemble.AgroupofSVMsselectedonthebasisofrecursiveclassifiereliminationisusedinCSVME,andthenumberoftheindividualSVMsselectedtoconstructCSVMEisdeterminedby10-foldcross-validation.ThiskindofSVMEhasbeentestedontwoovariancancerdatasetspreviouslyobtainedbyproteomicmassspectrometry.BycombiningseveralindividualSVMs,theproposedmethodachievesbetterperformancethantheSVMEofallbaseSVMs.

  • 标签: 肿瘤识别 计算方法 生物学性能 蛋白质
  • 简介:AcomputationalsystemforthepredictionandclassificationofhumanG-proteincoupledreceptors(GPCRs)hasbeendevelopedbasedonthesupportvectormachine(SVM)methodandproteinsequenceinformation.ThefeaturevectorsusedtodeveloptheSVMpredictionmodelsconsistofstatisticallysignificantfeaturesselectedfromsingleaminoacid,dipeptide,andtripeptidecompositionsofproteinsequences.Furthermore,thelengthdistributiondifferencebetweenGPCRsandnon-GPCRshasalsobeenexploitedtoimprovethepredictionperformance.ThetestingresultswithannotatedhumanproteinsequencesdemonstratethatthissystemcangetgoodperformanceforbothpredictionandclassificationofhumanGPCRs.

  • 标签: 疾病预防 识别方法 G-蛋白质 受体
  • 简介:G-proteincoupledreceptors(GPCRs)representoneofthemostimportantclassesofdrugtargetsforpharmaceuticalindustryandplayimportantrolesincellularsignaltransduction.PredictingthecouplingspecificityofGPCRstoG-proteinsisvitalforfurtherunderstandingthemechanismofsignaltransductionandthefunctionofthereceptorswithinacell,whichcanprovidenewcluesforpharmaceuticalresearchanddevelopment.Inthisstudy,thefeaturesofaminoacidcompositionsandphysiochemicalpropertiesofthefull-lengthGPCRsequenceshavebeenanalyzedandextracted.Basedonthesefeatures,classifiershavebeendevelopedtopredictthecouplingspecificityofGPCRstoG-proteinsusingsupportvectormachines.Thetestingresultsshowthatthismethodcouldobtainbetterpredictionaccuracy.

  • 标签: G-蛋白 疾病预防 分子机制 临床表现
  • 简介:作文向量树(CVTrees)被一个没有排列、没有参数的方法从整个染色体的数据推断。有相应分类的这些树的协议在这个工作提供推断的发展史的一个客观理由,我们证明由表现的CVTrees的稳定性和自我一致性自举并且大折刀重新采样测试适应了这条没有排列的途径。我们的最终的目标是倡导费时间的统计重新采样测试根本能在使用这条没有排列的途径被避免的观点。对分类的同意应该作为一个主要标准被拿估计原核生物的种系发生的树。

  • 标签: BOOTSTRAP 矢量 组分 检验 树木分类 系统发育树
  • 简介:识别蛋白质的细胞的本地化是的潜水艇在基因产品的功能的注解特别地有用。在这研究,我们使用机器学习和探索数据分析(EDA)技术检验并且描绘在九细胞的分隔空间局部性的人的蛋白质的氨基酸序列。代表人的蛋白质的3,749个蛋白质序列的数据集从SWISS-PROT数据库被提取。特征向量被创造捕获特定的氨基酸顺序特征。相对一台支持向量机器,一个多层的视感控器,和一个天真的Bayes分类器,C4.5决定树算法是越过在可靠地预言蛋白质的细胞的本地化基于他们的氨基酸定序的潜水艇的所有九分隔空间的最历久不渝的表演者(平均Precision=0.88;平均Sensitivity=0.86)。而且,EDA图形在每分隔空间描绘了蛋白质的必要特征。作为例子,在血浆膜上局部性的蛋白质有恐水病的氨基酸的更高的比例;细胞质的蛋白质有中立氨基酸的更高的比例;并且mitochondrial蛋白质有中立氨基酸的更高的比例和极的氨基酸的更低的比例。这些数据证明C4.5分类器和EDA工具能为描绘并且预言人的蛋白质的细胞的本地化基于他们的氨基酸定序的潜水艇是有效的。

  • 标签: 亚细胞 人类 蛋白质 数据分析
  • 简介:在cis的第二上的一个部件的transcriptional活动的直接否定的影响被叫作transcriptional干扰(TI)。U6是通常使用在基于向量的RNAi驾驶小发卡RNA(shRNA)表示的一个类型IIIRNA聚合酶III倡导者。在病毒的向量的设计和构造,多重抄写单位可以在空间有限向量在靠近的最近被安排。决定U6倡导者活动是否能被TI影响为在基因治疗的目标shRNA的表示是批评的或loss-of-function学习。在这研究,我们设计了并且实现shRNA和外长的基因表情由二个独立transcriptional单位被驾驶的一个修改retroviral系统。我们安排了在二倡导者安排驾驶shRNA表示和UbiC倡导者的U6倡导者。在主要巨噬细胞,我们发现U6倡导者活动被UbiC倡导者禁止什么时候在分叉的安排然而并非在双人脚踏车。相反,PKG倡导者没有如此的否定影响。而不是提高U6倡导者活动,CMVenhancer面对UbiC倡导者在U6倡导者活动有重要否定影响。我们的结果显示那项U6倡导者活动能被TI影响在一近似倡导者特定并且安排依赖者举止。

  • 标签: 启动子活性 RNA干扰 转录活性 病毒载体 SHRNA 基础