來源:hao123百家號 時間:2022-05-17 10:47:44
在人體細(xì)胞中,遺傳物質(zhì)是DNA——脫氧核糖核酸。它被包裹在細(xì)胞的核中并存在于染色體中。DNA的編碼形式為含氮堿基——腺嘌呤(A)、鳥嘌呤(G)、胸腺嘧啶(T) 和胞嘧啶(C)。
生物體有大量的生物信息,這些信息決定了它們的形態(tài)和解剖結(jié)構(gòu),包括在生物體中進(jìn)行的過程。
堿基的排列順序,決定了長相、智力,不同病癥的發(fā)病風(fēng)險等。舉個例子,ACA的排列讓人眼神不好,而CAC的排列能讓人長高,這其實(shí)就是遺傳信息。有機(jī)體的每一個特征都存在于它的體內(nèi),而包含這么多信息的分子就是DNA分子。
目前,地球上大約有10萬億字節(jié)的數(shù)字?jǐn)?shù)據(jù),每天,人類產(chǎn)生的電子郵件、照片、推文和其他數(shù)字文件加起來還有250萬千兆字節(jié)的數(shù)據(jù)。大部分?jǐn)?shù)據(jù)存儲在稱為艾字節(jié)數(shù)據(jù)中心(1 艾字節(jié)為 10 億千兆字節(jié))的巨大設(shè)施中,這些數(shù)據(jù)中心可能有幾個足球場那么大,建造和維護(hù)成本約為 10 億美元。
每年耗費(fèi)數(shù)億美元維護(hù)的數(shù)據(jù)中心
許多科學(xué)家認(rèn)為,另一種解決方案在于包含我們遺傳信息的分子:DNA,它可以以非常高的密度存儲大量信息。麻省理工學(xué)院生物工程教授馬克·巴斯說,理論上一個裝滿DNA的咖啡杯可以存儲世界上所有的數(shù)據(jù)!
雖然不同機(jī)構(gòu)計算一克DNA的儲存容量的值不同,但目前被廣泛接受的是一克DNA可儲存215PB(2.15億GB)!那么,既然DNA能儲存遺傳信息,那能儲存數(shù)字信息嗎?通過人工合成DNA編碼進(jìn)行數(shù)據(jù)寫入,再用DNA測序進(jìn)行數(shù)據(jù)讀取可行嗎?
數(shù)字?jǐn)?shù)據(jù)存儲的主要步驟
答案是可行的。哈佛大學(xué)的遺傳學(xué)家George Church、Sri Kosuri和同事用數(shù)千個DNA片段編碼了一本52000字的書,他們制定了一種算法,將二進(jìn)制代碼(0和1)與遺傳代碼(A、T、G和C)相對應(yīng),使用DNA的四個字母A、G、T和C來編碼數(shù)字化文件的0和1。然而,由于編碼方案問題,導(dǎo)致效率低,每克DNA只能存儲大約1.52 PB(152萬GB)。
編解碼過程概述
目前,寫入1PB的數(shù)據(jù)(100萬GB)需要花費(fèi)1萬億美元!昂貴的成本成為DNA數(shù)據(jù)儲存發(fā)展的一大障礙。但據(jù)專家估計,隨著合成和測序DNA設(shè)備的發(fā)展,且為了與用于存儲檔案數(shù)據(jù)的磁帶競爭,DNA合成的成本將在未來兩年內(nèi)降低大約六個數(shù)量級。這有點(diǎn)類似于過去幾十年在閃存驅(qū)動器上存儲信息的成本急劇下降的情況。
除了成本之外,使用DNA存儲數(shù)據(jù)的另一個主要瓶頸是難以從所有文件中挑選出想要的文件?,F(xiàn)通常使用PCR(聚合酶鏈?zhǔn)椒磻?yīng))檢索DNA文件。每個DNA數(shù)據(jù)文件都包含一個與特定PCR引物結(jié)合的序列。
聚合酶鏈?zhǔn)椒磻?yīng)(PCR)
要提取特定文件,將該引物添加到樣本中以查找和擴(kuò)增所需序列。然而,這種方法的一個缺點(diǎn)是引物和脫靶 DNA 序列之間可能存在串?dāng)_,從而導(dǎo)致不需要的文件被拉出。這就好比你將蘋果、梨子、香蕉依次用一根繩系住,然后將其放入麻袋中。當(dāng)你想要香蕉時,在拉取繩子的過程中你得依次拉出蘋果、梨子最后才到你想要的香蕉。
針對此情況,麻省理工學(xué)院的團(tuán)隊開發(fā)了一種新的檢索技術(shù),該技術(shù)涉及將每個DNA文件封裝到一個小的二氧化硅膠囊中。每個膠囊都標(biāo)有與文件內(nèi)容相對應(yīng)的單鏈 DNA“條形碼”。為了以具有成本效益的方式證明這種方法,研究人員將20個不同的圖像編碼成大約3000個核苷酸長的DNA片段,大約相當(dāng)于100個字節(jié)。(他們表明,這些膠囊可以容納高達(dá)1 GB 大小的DNA文件。)
DNA儲存膠囊
每個文件都標(biāo)有與“貓”或“飛機(jī)”等標(biāo)簽相對應(yīng)的條形碼。當(dāng)研究人員想要提取特定圖像時,他們會移除DNA樣本并添加與他們正在尋找的標(biāo)簽相對應(yīng)的引物,引物標(biāo)有熒光或磁性顆粒,便于從樣品中提取和識別任何匹配項(xiàng)。同時保留 DNA 的其余部分完整地放回存儲中。
不同的顏色代表不同的儲存內(nèi)容
哈佛醫(yī)學(xué)院遺傳學(xué)教授喬治·丘奇將這項(xiàng)技術(shù)描述為“知識管理和搜索技術(shù)的巨大飛躍”。運(yùn)用此技術(shù),詹姆斯·巴納爾正在開發(fā)一家名為Cache DNA的初創(chuàng)公司,該公司目前正在開發(fā)長期存儲DNA的技術(shù),既可用于長期的DNA數(shù)據(jù)存儲,也可用于近期的臨床和其他預(yù)先存在的DNA樣本。
Cache DNA官網(wǎng)
雖然DNA可能需要一段時間才能成為一種數(shù)據(jù)存儲介質(zhì),但今天已經(jīng)迫切需要低成本、大規(guī)模的存儲解決方案來存儲來自Covid-19測試、人類基因組測序和其他領(lǐng)域的預(yù)先存在的DNA和RNA樣本基因組學(xué)領(lǐng)域。因此,我們可以安全地假設(shè)使用DNA來存儲數(shù)據(jù)的未來并不遙遠(yuǎn)。
標(biāo)簽:
學(xué)生八字劉海怎么剪(學(xué)生八字劉海怎么剪教程):環(huán)球今亮點(diǎn)
先在額前取一縷頭發(fā),量不要太多,不然剪出來的劉海特別厚重。然后把這縷頭發(fā)修剪至眉毛...
薩莫吉爾尼(關(guān)于薩莫吉爾尼的簡介)
大家好,薩莫吉爾尼,關(guān)于薩莫吉爾尼的簡介很多人還不知道,現(xiàn)在讓我們一起來看看吧!1、...
新西蘭央行加息50個基點(diǎn)至5.25%
新西蘭央行4月5日宣布,將基準(zhǔn)利率上調(diào)50個基點(diǎn)至5 25%,以抑制高通脹。這是該行自2021...
當(dāng)前快播:電解液“龍頭”一季度凈利潤或“腰斬”
3月28日,電解液“龍頭”新宙邦(300037 SZ)發(fā)布了2022年年報。報告顯示,公司2022年實(shí)現(xiàn)...
烹調(diào)雞蛋常犯哪些錯誤?雞蛋正確的烹飪方法有什么