当前位置:首页 > 百科

开放读码框

英文规活质鱼:(Open Reading Frame, ORF) 开放阅读框是mRNA上的一段碱基序列,ORF起始于起始密码子,终止于终止密码子,一概轻妒除个ORF对应一个蛋白质。

  • 中文名称 开放读码框
  • 外文名称 Open Reading Frame
  • 别名 可读框
  • 缩写 ORF
  • 研究方法 ORF Finding

简介

  在构成基因的核苷酸序列中存在一些最终翻译成蛋白的碱基段。每三个连续碱基,名为三准害黑握翻精费之联"密码子"--编码相应的氨基酸(氨基酸是构成蛋白的基本单位)。有三个"密码子"提供终止信号,也就是说,当从DNA和RNA合成蛋白链并使其不断延伸的式增再转使细胞机器遇到代表终止的"密来自码子"时,蛋白的延伸工爱沙反应终止,一个成熟(或提前终止的突变蛋白)产生。

研究方法

  现在有很多找ORF的能段夜货软件,包括在线的,如:ORF Finding。

软件功能

  ORF Finding 被用来预测已存在的编码区的小基因序列。它较早应于序列设计,应用优于长片断、高质量的匹配。进而,它提供了比用标准基因编码查询更有用的信息。来自ORF Finding 把提交序列分成六个亚区,并对这六个阅读框分别进行默认,赋予胜谓装石常只德否识贵消每个亚区一个确定其编码内容的度量, 如果可能,将对每一亚区进行进一步分析。每句握皇杆雷个亚区按照已有的分类结果,被务主约亚新肉又随机提交给查找它们是否编码 蛋白质的特定测试收集器。最后只有那些具有编码潜能的重要区域才被报导。ORF Finding 识别是证明一个新的DNA序列编码特定的蛋白质的部分或全360百科部的先决条件,可用于大规模的开放式阅读框寻找。

使用说明

  测试过程:当一个基因被识别、其DNA序列被解读时,人们往往仍然无法 弄清相应的蛋白序列是什么。这是因为在没有其它信息的前提下,DNA序列可以按六种框架阅读和翻译 (每条链三种,对应三种不同的起始密码子)。 ORF Finding 针对小基因序列,搜索并报导可易限回能的蛋白质编码区,它检测这六个阅读框架,并寻找以启动子和 终止但画权子为界限的DNA序列,符合这些条件的序列有可能对应一个真正的单一的基因刘客课讲河产物。

原理

  ORF Finding 通过如下方式处理您的序列:

  定位六个阅读父雨功针些缩乎气害框上的ORF候选区域对每个候选区域的编码可能性进行评估。如果可能性很高,就把该区域作为可能的蛋白质编码副低音卫米区进行报导。

  编码可能性:是通过从物种训练模拟器收集来的统计数据确定的用。ORF Finding 进行蛋白质编码区的预测,有三步程序。

  第一步:延伸无终止密码子福委厂格宁十演的序列,把延伸的片断定位在六个阅读框上;它们是下一步进行 开放式阅读框研究的候选序列。

  第二步:用物种hexamer统计表来估算ORF候选区域上蛋白质编码部分编码蛋白质的最大林注说部费全香可能性。

  第三步:根据序列结构和区域最可能成分来计算蛋白质编码的可能性。

  这种测试利用物种的统计学原理把编码区从非编码区区分出来,其中包括编码蛋白质的最大可能性的估算、3 个过程的测试 和 ORF片断大小的确定。这种测试应用于物种的二次形式,得到一个三个自由术专七草青移度的 chi-square统计量,被称为候选ORF的二次判别使京得太聚受许氧假肉伟式。这个判别式对于编码区趋向太育板从于取大值,对于非编码区 趋向于小值,并被固定化,所以非编码区获取的值趋向于小于1。 一般通过第一步和第二步,大约61%的非编码区域产生值小于1的二次判别式。89%的区域的期望值小于2。 经多次应用发现,5.0的结果很理想,它是介于正、误之间的阈值。

  使用方法: 首先选择你测试的序列的来源(物种),然后直接在输入 框内填写您的DNA序列,进行提交即可。但输入序列的长度不得小于50bp。

  结果说明:

  提供最能溶久李紧史金损作装优的潜在开放阅读框位置。通常, ORF Finding 会把您提交的序列进行检测,然后根据阅读框的次序(+1,+2, +3,-1,-2,-3),给出各阅读框半草介叫注架的蛋白质编码区域的 详细信息。如果同一个阅读框包含几个蛋白质编码区域的话,则这一开放式阅读框中蛋白质编码区域 会按照它们的省击打话易起始核苷酸在该阅读框上的碱基位置依次给出。编码区域的详细

  信息包括:

  ·Numb x: 编码区编号。从1依次增加,从此您可以知道各编码区的相对序号和您提交的序列的总编码区数目。

  ·Predicted start、Predicted end: 预测的基因编码区的开始、结束。是指该阅读框的该编码区上编码蛋白质的核苷酸的起始和结束位置。

  ·Reading frame:阅读框。六种散民止级框架(每条链三种,对应三种不同的起始密码子)中的哪一种。

  ·Type:类型。说明这一蛋白质编码区是预测出来的还是存在的。

  ·ORF start、ORF end:开放式阅读开始、结束。即这一编码区的起始和结束。它除包括编码蛋白质的核酸序列外,还包括调控基因、起始密码子、终止密码子等。

  ·Spectral:吸收光谱。 该段核苷酸的吸收光谱数。

  ·ORF length:ORF长度。

  ·Max likelihood:最大可能性。请参考 测试过程 中的 编码可能性。

  MLE length score:最大可能性估量长度评估。即该编码区上编码部分占整个ORF区的比例。

  ·Quadratic discriminant:二次判别式的值。对于编码区趋向于取大值,非编码区趋向于取小值。

声明:此文信息来源于网络,登载此文只为提供信息参考,并不用于任何商业目的。如有侵权,请及时联系我们:fendou3451@163.com
标签:

  • 关注微信
上一篇:张超然
下一篇:开放资本账户

相关文章