愛伊米

《科學》連發6篇論文公佈一重要成果!可惜喬布斯沒趕上

4月1日,《科學》雜誌連發6篇論文,公佈了人類基因組測序的最新重要成果。國際科學團隊端粒到端粒(T2T)聯盟,透過新的技術繪製出全球第一個完整的、無間隙的人類基因組序列,首次揭示了高度相同的節段重複基因組區域及其在人類基因組中的變異。

今天,我們邀請知名科普作者張田勘和您聊聊與人類基因組測序由來、發展、意義有關的那些事。

《科學》連發6篇論文公佈一重要成果!可惜喬布斯沒趕上

《科學》雜誌以封面文章公佈人類基因組測序的最新重要成果

喬布斯患癌與基因測序

人類基因組是指每個人細胞中細胞核的23對染色體的脫氧核糖核酸(DNA)以及細胞質中線粒體中的小DNA分子。為何要檢測和繪製人類基因組,一個簡單的回答是,為了研究生命現象和治療疾病。

為了更好地理解這一點,我們不妨先來講個故事。

蘋果公司創始人喬布斯於2003年10月診斷出患了癌症。當時初診醫生以為他患的是胰腺癌,但後來發現並不完全準確。

胰腺癌是惡性程度極高的病,在當時幾乎沒有什麼特效藥。而且在人類基因組草圖於2003年正式公佈後,基因測序還處於初創時期並且相當昂貴。喬布斯屬於最早嘗試這種新興事物的人,他在醫生的建議下花了昂貴的費用對自己的癌症基因進行了測序,以期找到新的治療靶點和更有效的治療方案。

後來發現,喬布斯患的並非是一般的胰腺癌,而是胰腺神經內分泌瘤。

神經內分泌腫瘤是一類腫瘤的總稱,是由生產激素的細胞出現變異惡化而產生的。它可以出現在胰腺,也可能在胃腸、肝膽或肺部發生。如果發生在胰腺,就叫胰腺神經內分泌瘤。

遺憾的是,當時對胰腺神經內分泌瘤的基因突變檢測還無法發現,因此基因測序並沒有找到癌變基因靶目標。直到喬布斯去世的2011年,胰腺神經內分泌瘤的基因突變才被發現和公佈,MEN1是這類腫瘤最高頻突變的基因。

這個世界上有相當數量的人天生就攜帶MEN1突變,他們都很有可能得一種病,即多發性內分泌腺腫瘤綜合徵Ⅰ型(Wermer綜合徵)。

透過更多病人的基因測序和基因功能研究,以及CT、超聲波等其他檢查發現,胰腺神經內分泌瘤惡性程度較低,但臨床上難以徹底治癒。與很多惡性腫瘤(癌症)相比,多數神經內分泌瘤要溫順得多,生長比較緩慢,即使出現了轉移,也可以透過手術聯合藥物治療等方式獲得長期生存,5年生存率接近50%。這也是為何喬布斯患癌8年後才去世的原因。然而當時沒有查到這一腫瘤的致癌基因,也沒有特效藥,因此他失去了挽救生命的機會。

同時,人們也知道,如果有遺傳傾向,並透過基因檢測發現了其他致癌基因,如乳腺癌基因BRCA突變,就可以透過切除癌症的靶器官,如乳房,來預防乳腺癌,美國著名演員安吉麗娜·朱莉就是透過預防性手術切除乳腺來降低患乳腺癌的風險。

但是,攜帶了MEN1突變,並不能透過切除來根治,因為這個基因突變產生的腫瘤病變一般在垂體、甲狀旁腺、胰腺等器官,這些器官功能很重要,沒法隨便切除。

所以,到目前為止,還沒有有效的藥物能預防Wermer綜合徵患者發生腫瘤,也沒有針對MEN1突變腫瘤的治療方案,但是,如果透過基因測序發現病因,至少是找到了研發藥物和對症治療的方案。

自從人類基因組測序工作開展以來,研究人員估計,與癌症相關的基因約有1000個,如果都能透過基因測序定位、定性,世界上的絕大多數各類癌症就有可能得到預防和治療。

人類基因組序列的䓍圖完成

我們姑且把最新公佈的人類基因組序列或圖譜稱為人類基因組的2。0版,或者高配版,未來是否還有3。0版,有待研究的深入。在瞭解人類基因組2。0版之前,先要回顧一下此前的低配版,即1。0版的人類基因組。

1990年10月,人類基因組計劃在美國首先啟動,之後英、日、法、德等國參與並組成了國際人類基因組計劃協作組,其核心內容是測定人類基因組的全部DNA序列。1998年中國計劃加入人類基因組計劃。1999年7月7日,國際人類基因組計劃協作組公佈了中國加入人類基因組計劃的申請,並於同年9月1日向世界宣佈,中國成為美、英、日、法、德之外,第6個人類基因組計劃的參與國,也是唯一的發展中國家。

人類基因組計劃原定要用15年時間、投資30億美元完成,但是由於測序工具的改進,這一龐大而艱鉅的任務提前幾年完成了。2001年2月15日,《自然》雜誌發表了長達62頁的論文《人類基因組的初始測序與分析》,這是從學術上向世界宣告,歷經10年、耗資約27億美元的人類基因組計劃初步完成。不過,到了2003年4月25日,美、英、日、法、德、中六國才正式共同宣佈人類基因組序列完成。

但是,這只是一個草圖,姑且稱為1。0版。1。0版當然比較粗糙,但也是人類探索自身生命的一個重大里程碑。這個1。0版的主要內容是,科學家對人的23對染色體中所有DNA的約30億個鹼基對的排列組合作了測序,知道了在正常情況下它們是怎樣排列的,以及它們之中某些基因的功能。

當時所知的是,人類基因組包含近2萬個編碼蛋白質的基因,由約30億個鹼基對(遺傳密碼)組成。如果把這30億個字元用A4紙打印出來裝訂成書,厚度可達約100米,相當於30多層樓高。

初級版本帶來的新認識

人類基因組1。0版本完成後,當時及後來的研究認定,基因組中編碼蛋白質的區域,即功能基因只佔一小部分,不超過整個基因組的3%,其餘97%左右的DNA序列統稱為非編碼DNA,也有人稱為垃圾基因,但是這個看法現在已被證明是錯誤的。因為,這些年的大量研究表明,占人類基因組97%的非編碼序列具有重要的生物學功能,而且與人類疾病有直接或間接的關聯。

同時,根據估計,人類基因突變或與基因有關的疾病有6000多種,與癌症相關的原癌基因就約有1000個。但是,人類與基因有關的疾病並非總是與編碼基因相關,也與非編碼基因有關。儘管迄今還有大量的功能基因不被人類認識,但是,1。0版的基因組為人類認識疾病、生命現象提供了堅實的基礎。

在人類基因組1。0版本的基礎上,科學家逐漸發現了各種功能基因。在這些研究成果的基礎上,又產生了更多的“組學”研究。其中,國際人類基因組單體型圖計劃(HapMap)就十分重要,透過這個計劃,可以瞭解任意兩個人之間的遺傳差異。人類基因組1。0版本只是打開了人體自身的遺傳密碼這本天書的大部分章節,但地球上每個人的天書都是一種版本,HapMap揭示的就是不同天書版本之間的差別與規律,因此可以揭示覆雜的疾病的遺傳因素,如高血壓、腫瘤、精神疾病、糖尿病等。

在人類基因組1。0版本的基礎上,還發展出了人類基因組DNA元件百科全書計劃(ENCODE),目標是建立一幅人類基因組內功能元件的綜合圖。此外,還有人類蛋白質組計劃(HPP)等。

2.0版如何補齊人類基因組

在2001年完成人類基因組1。0版本之後,科學家還為這個版本陸續打了不少補丁,來補齊這個版本,如2013年釋出了參考基因組序列(GRCh38),在當時被認為是標準人類參考基因組。

但是,此次發表的2。0版本又對2013年釋出的參考基因組序列進行了重大升級,無論是從數量還是質量來看,都應當算是人類基因組的2。0版。

2。0版本的人類基因組被命名為T2T-CHM13。從這個命名上,就可以看出它的一些主要特點。

T2T的得名在於,它是由美國國家人類基因組研究所的亞當·菲利皮領導的“端粒到端粒”(T2T)聯盟繪製,意指對每條染色體從一端到另一端進行測序,因為每條染色體的末端由端粒構成。

同時,新版本的人類基因組是從一個被稱為CHM13的細胞系中讀取的DNA。人的細胞的每段DNA都有兩個副本,一個來自母親,另一個來自父親,兩者有一些重大差異。此前的1。0版本基因組是分段進行基因組測序並進行組裝的,在組裝基因組片段時,來自父母的基因序列可能會混合在一起,從而掩蓋個體基因組中的實際變化。但是,採用CHM13測序人類基因組可以避免父本和母本基因的混淆,由此測得的序列只含有來自父本的DNA,這就可能獲得以前未知的基因片段,而且這也是未來深入進行國際人類基因組單體型圖計劃的基礎。

當初的人類基因組1。0版本其實遺留了大約8%的“空白”間隙。總體而言,新的人類基因組2。0版本由30。55億個鹼基對和19969個蛋白質編碼基因組成,比此前的1。0版本增加了近2億個鹼基對以及2000多個新基因。新版本還發現了大約200萬個額外的變異基因,其中622個出現在與疾病相關的基因中。新版本序列還糾正了原來版本中的數千個基因結構錯誤。

治療癌症和其他疾病的新希望

人類基因組2。0版本是否會給胰腺癌和其他癌症,以及更多的疾病治療帶來福音,挽救更多人的性命呢?答案是肯定的。

人類基因組2。0版本的大部分新內容來自神秘的著絲粒,它是將兩條染色體連線在一起的密集的DNA束,在細胞分裂中起著關鍵作用。參與這項工作的美國加利福尼亞大學伯克利分校博士後阿爾特莫斯指出,約90%的基因新序列來自染色體的著絲粒,著絲粒內部及周圍的新DNA序列約佔整個基因組的6。2%。

著絲粒的作用在於,它的大型蛋白質複合物牢牢抓住染色體,如此細胞核內的其他組織就可以將染色體對分開。但是,一旦這一過程出錯,染色體分離也會出錯,隨後一系列後果也會出現。如果這種情況在細胞的減數分裂時發生,可能會發生染色體異常,導致自然流產或先天性疾病。而且,如果這種情況發生在體細胞中,可能會導致癌症。

顯然,對著絲粒及其周圍鹼基對序列的精準檢測,以及對其他原癌基因的研究,是未來預防和治療癌症的基礎,治療癌症的藥物和療法也必然建立在這些基礎之上,因此更多的癌症病人和其他疾病患者都會得益於新版本的基因組測序。

另一方面,對5條近著絲粒染色體的短臂區域的測序結果顯示,這些短臂區域中包含了編碼核糖體RNA的基因的多個複製,一共400個。染色體短臂區域的變異水平也比較高,並有大量的重複序列。這表明,短臂區域很可能是基因演化的熱點區域,因為停留在那裡的基因複製可以自由變異並獲得新的功能。因此,研究這一區域的基因既可能發現很多功能基因,也能進一步解開癌症和其他疾病的謎團。

當然,新版本的基因組是單個基因組的測序,而且並非蓋棺定論,它只是對1。0版本的人類參考基因組38(GRCh38)提供補充。而GRCh38並不代表任何一個個體,是由多個捐贈者的DNA組裝而成,被合併為一個線性序列。

現在,T2T聯盟已與人類泛基因組參考聯盟合作,對350個個體進行全基因組測序,並基於此建立一個新的“人類泛基因組參考”,以獲得更全面和準確的人類基因組,因此,這個未來的基因組可以稱為3。0版本。

此外,中國人的基因組與現有的完整白人基因組序列仍然存在較大差異,因此,中國也需要測出完整的中國人基因組序列,以便面對疾病時能更好地對症下藥。

流程編輯:u028