|
人類基因組中或含有超過20%的非編碼基因2018-09-04 10:37來源:生物谷
近日,一項(xiàng)刊登在國際雜志Nucleic Acids Research上的研究報(bào)告中,來自美國國家癌癥研究中心的科學(xué)家們通過研究發(fā)現(xiàn),高達(dá)20%的編碼基因可能根本就無法進(jìn)行編碼,因?yàn)檫@些基因具有非編碼或偽基因(即過時(shí)的編碼基因)的特征,由此導(dǎo)致的人類基因組的縮小或許會(huì)對生物醫(yī)學(xué)領(lǐng)域產(chǎn)生重要的影響,因?yàn)楫a(chǎn)生蛋白質(zhì)的基因數(shù)量以及其身份對于科學(xué)家們研究包括癌癥和心血管疾病在內(nèi)的多種疾病都至關(guān)重要。 2003年科學(xué)家們完成了人類全基因組測序工作,研究人員發(fā)現(xiàn),人類基因中實(shí)際上攜帶有2萬個(gè)彼此分離的編碼基因。研究人員對編碼相關(guān)人類蛋白質(zhì)組的基因進(jìn)行了分析,對來自數(shù)據(jù)庫GENCODE/Ensembl, RefSeq和UniProtKB中參考蛋白質(zhì)組的詳細(xì)對比分析后他們發(fā)現(xiàn)了22210個(gè)編碼基因,但這些基因中僅有19446個(gè)基因出現(xiàn)在數(shù)據(jù)庫中;而剩下的2764個(gè)基因似乎僅存在于一個(gè)或兩個(gè)數(shù)據(jù)庫的注釋中,而這些基因幾乎所有都可能是非編碼或偽基因,實(shí)際上,這些基因連同另外1470個(gè)編碼基因都無法向典型的蛋白質(zhì)編碼基因一樣進(jìn)化,也就是說,總共有4234個(gè)基因都不能編碼產(chǎn)生蛋白質(zhì)。 研究者Tress解釋道,如今我們能夠詳細(xì)分析這些基因,而且有超過300個(gè)基因都被重新歸類為非編碼基因,而這些結(jié)果已經(jīng)被GENCODE國際聯(lián)合會(huì)在人類基因組中進(jìn)行了全新注解。這項(xiàng)研究再次強(qiáng)調(diào)了科學(xué)家們對人類全基因組測序15年后人類細(xì)胞中真實(shí)基因數(shù)量的懷疑,盡管最新數(shù)據(jù)顯示,編碼人類蛋白質(zhì)的基因數(shù)量超過了2萬個(gè),但研究人員表示,我們的研究證據(jù)指出,人類機(jī)體中或許僅有1.9萬個(gè)編碼基因,但研究人員目前并不清楚這1.9萬個(gè)基因到底是哪些。 研究者David Juan說道,讓我們非常不可思議的是,一些看似非常罕見的基因已經(jīng)被大量研究了,而且有超過100個(gè)科學(xué)出版物都基于這樣的假設(shè)認(rèn)為這些基因能夠產(chǎn)生蛋白質(zhì);本文研究結(jié)果表明,人類基因組可能仍然存在很多不確定性,后期研究人員仍然需要對人類蛋白質(zhì)組進(jìn)行大量研究,因?yàn)槠鋵τ卺t(yī)學(xué)領(lǐng)域非常重要。
|