<ul id="8aumu"></ul>
  • <strike id="8aumu"></strike>
  • <ul id="8aumu"></ul>
    VIP標識 上網(wǎng)做生意,首選VIP會員| 設為首頁| 加入桌面| | 手機版| RSS訂閱
    食品伙伴網(wǎng)服務號
     

    NCBI中的GenBank和RefSeq

    放大字體  縮小字體 發(fā)布日期:2006-07-01

    RefSeq NM_xxxxxx和GenBank Afxxxxxx看起來是重復的,但RefSeq和GenBank是分開的數(shù)據(jù)庫,而且兩者都是可以通過在Entrez nucleotide中輸入各自的ACCESSION獲得。開始時臨時的RefSeq記錄與GenBank記錄非常相似。但是,當RefSeq記錄被專家review以后,新增的序列數(shù)據(jù)、生物學注解、和參考文獻常被加入。那時,RefSeq條目(即序列)代表一個來自不同實驗室的綜合信息,這時二者可以非常不同。

    GenBank是一個多種序列的存儲池,對每個基因都含有許多序列。而RefSeq數(shù)據(jù)庫被設計成每個人類位點挑出一個代表序列來減少重復,是NCBI提供的校正的序列數(shù)據(jù)和相關的信息。數(shù)據(jù)庫包括構建的基因組contig、mRNA、蛋白和整個染色體。

    RefSeq記錄是有三種可以獲得的狀態(tài):預測的,臨時的和檢查過的(reviewd)。檢查過的記錄代表了目前關于一個基因和它的轉錄子的知識的匯編。它們很多都來自于GenBank記錄、人類基因組命名委員會、和OMIM。RefSeq標準為人類基因組的功能注解提供一個基礎。
    RefSeq記錄通過以下步驟創(chuàng)建:
    1、確定代表不同基因的序列
    2、建立正確的基因名字到登錄號的聯(lián)系
    3、確定完整范圍的可以獲得的序列數(shù)據(jù)
    4、創(chuàng)建一個新的處于三種狀態(tài)之一的參考序列(RefSeq)記錄

    為什么RefSeq記錄中的基因符號(symbol)有時和相關的GenBank中的不一樣?RefSeq全部使用官方基因符號。而GenBank是一個公共的序列備份庫,由數(shù)據(jù)發(fā)現(xiàn)者提供。有的作者會向相關的物種命名委員會取得官方基因符號,但有的作者沒有,所以有時會產(chǎn)生別名。GenBank與Pubmed相同,通過display可以選擇顯示格式,常用的有GenBank和FASTA兩種格式。如果要對基因序列作進一步分析,F(xiàn)ASTA格式是很好的選擇。FASTA格式僅包括該序列的簡要特征,并以ATGC4種堿基列出核苷酸序列,簡單明了。而GenBank格式可顯示較完整的基因序列記錄,反映核苷酸序列的詳細信息。

     
    [ 網(wǎng)刊訂閱 ]  [ 食品專題搜索 ]  [ ]  [ 告訴好友 ]  [ 打印本文 ]  [ 關閉窗口 ] [ 返回頂部 ]

     

     
    推薦圖文
    推薦食品專題
    點擊排行
     
     
    Processed in 0.149 second(s), 19 queries, Memory 0.88 M