Harici bellekler, bilgisayarlar, mp3 çalarlar… Bellek kapasitesi, günümüz elektronik eşyaların olmazsa olmaz özelliklerinden biri. Aldığımız cihazların kaç gigabayt’lık veri tutabildiği, veri aktarımının ne kadar hızlı olduğu bizim için önemli kriterler arasında. Peki, kendi işletim sistemimiz? İnsan DNA’sındaki toplam verinin ne kadar büyük olduğunu, cinsel birleşme sırasında gerçekleşen veri akışının ne boyutlarda olduğunu biliyor musunuz?
-İnsan Genomundaki Veri Nasıl Tutuluyor?
Sahip olduğunuz genetik veri, yaklaşık 100 trilyon hücrenizin her birinde bir kopya olarak tutuluyor. Bu veriyi, yarısı annemizden diğer yarısı da babamızdan gelen 46 ciltlik bir ansiklopedi serisi gibi düşünebilsiniz. Tipik bir ansiklopedinin yazıldığı 27 harf yerine, genomik ansiklopediniz sadece 4 harf ile yazılıyor. Ve bunlar, Adenin (A), Timin (T), Sitozin (C) ve Guanin (G) olarak adlandırılıyor. ATGTCATGCA… şeklinde sürüp giden 6 milyar harf, sizi siz yapan tüm özelliklerinizi ortaya koyuyor.
-Genom ile Bilgisayar Veri Depolama Arası Kıyaslama
Bu yazımızda, genetik bilginin, bilgisayar sistemlerindeki karşılığını bulmak istediğimiz için, iki farklı dili birbirine çevirebilmemiz gerekiyor. Bunun için her iki dile kısaca değinelim.
Bildiğiniz üzere, bilgisayar sistemleri, ikili kod (binary code) esasına dayanır. Türkçe bir yazı nasıl 29 harf barındırıyor ve genetik kod nasıl 4 harf barındırıyorsa, bilgisayarlar da sadece iki karakter kullanarak ile çalışır: 0′lar ve 1′ler. 010100010001… şeklinde giden diziler, şu anda bu yazıyı okuduğunuz uygulamalardan, işletim sistemlerine kadar herşeyin çalışmasını sağlar.
DNA dizilerinin bilgisayar verisi olarak gösterebilmemiz için, 4 farklı DNA seçeneğinin (A, T, G ve C) ikili kod (0 ve 1) ile tasvir gerekir. 0′lar ve 1′ler (ki her birine bit denir) gruplaştırarak daha büyük birimleri tanımlayabilirler. Bu grupların en küçüğü “bayt” olarak adlandırılır ve 8 bit’ten oluşur.
0-0-1: 3 bit
0-1-1-0-0-1-0-0: 8 bit veya 1 bayt
İkili kod, sadece iki harf içerdiği için, tek bit kullanarak (yani sadece 0 ya da 1) yalnıza iki DNA harfini tanımlayabiliriz. Oysa ki, genomunuz 4 farklı DNA harfi içerir. Bu sebeple, 4 farklı DNA harfini tanımlayabilmek için minimum iki bit kullanmamız gerekir. Böylece, iki bit ile yazılabilecek 4 farklı kombinasyonu da (00, 01, 10 ve 11) elde edebiliriz.
Örneğin DNA harfleri: “A:01 C:11 G:10 C:00″ şeklinde ikili koda çevrilebilir.
Bu şekilde, 01001001 şeklinde yazılan bir ikili kodun “ACGA” olarak belirtilecek DNA koduna denk geldiğini anlayabiliriz.
Her iki bitlik veri, bir baz çiftine denk geldiğinde, bir bayt (yani 8 bit) içinde 4 harflik bir DNA dizi bilgisini kaydedebiliriz. Tüm diploid (anneden ve babadan gelen DNA) insan genomunun bit olarak karşılığını hesaplamak istediğimizde, aşağıdaki işlemleri gerçekleştirmemiz gerekir.
6×10^9 baz çifti/diploid genom x 1 bayt/4 baz çifti = 1.5×10^9 bayt
Diğer bir deyişle, 1.5 Gigabayt’a denk gelen bu veri, yaklaşık 2 CD’ye sığabiliyor. Bu bağlamda 3 farklı kişinin DNA bilgisini (birbirinden farklı 3 genomik veri) tek bir DVD içine koyabiliyoruz.
Kopyala-Yapıştır Hiç Bu Kadar Büyük Olmamıştı!
Şimdi başka bir noktaya değinelim. Kemik iliklerinizde her saniye yaklaşık 2.6 milyon yeni kan hücresi oluşturuluyor. Bu hücrelerin oluşumu da mitoz adı verilen hücre bölünmeleri ile gerçekleşmekte. Her bir bölünme esnasında, varolan hücre kendi genomunu kopyalıyor ve yeni kopyayı yeni hücreye taşıyor. Bu şekilde aynı genoma sahip yeni bir hücre meydana getirilmiş oluyor. Peki bu işlemler sırasında ne kadarlık bir veri kopyalanıyor?
1.5 Gigabayt/hücre * 2.6 milyon hücre = 3.900 Terabayt
3.900 Terabayt’lık veri, vücuduzda her saniye kopyalanıyor! Günümüzde bu boyutta bir veri kopyalama işlemini yapacak bilgisayarların sayısı muhtemelen bir elin parmaklarını geçmez, belki de yoktur.
-Tüm Organizmadaki Toplam Veri Ne Kadar?
Yukarıdaki hesaplamayı daha da ilginç bir hale getirelim. Yukarıda, tek bir hücre içinde 1.5 GB’lık bir DNA verisi olduğunu gördük. Peki, tüm insan vücudunda tutulan genetik bilginin boyutu ne kadar tutar? Basit olması açısından şimdilik mirobiyom’u (üzerimizde yaşayan mikroorganizmaları) göz ardı edip, sadece kendi hücrelerimizi düşünelim. Tahminler, insan vücudu üzerinde 10 trilyon ile 100 trilyon arasında hücre olduğunu gösteriyor. Hücre sayınını 100 trilyon ve tek bir hücredeki genetik veriyi 1.5 GB olduğunu varsaydığımızda, vücudumuzdaki tüm verinin boyutunu şu şekilde hesaplayabiliriz.
1.5 Gigabayt x 100 trilyon hücre = 150 trilyon Gigabayt = 150 Zettabayt (10^21)!!!
Bu noktada, Zetabayt gibi bir terim yabancı gelebilir. Bu terimi anlamak için şöyle bir örnek vermekte yarar var. Günümüz tahminleri internet üzerindeki tüm bilginin 0.5 Zettabyte olduğunu gösteriyor. Diğer bir deyişle, hücrelerinizde, insanoğlunun yarattığın en büyük kütüphaneden 300 kat daha büyük bir veri var. Müthiş değil mi?
-Cinsel Veri Aktarımı (Bu aygıt daha hızlı çalışabilir!?)
Bu veriler ışığında, tipik bir cinsel birleşme sırasında ne kadar genetik veri aışverişi yaşanıyor olabilir? Erkekten gelen her bir sperm hücresi bir set kromozom (22 kromozom + X veya Y kromozomu) taşır, bu nedenle haploid’dir. Diğer bir deyişle, vücut hücrelerinizin taşıdığının yarısı kadar genetik bilgi taşır. Her bir sperm hücresi 3 milyar harften oluşan bir genetik veri barındırdığı düşünülürse, bir sperm hücresinin yaklaşık 750 MB’lık bir veri taşıdığını yukarıdaki verilerden çıkabiliriz. Son olarak, ortalama bir erkeğin her bir ejakülasyon sonucunda 180 milyon kadar sperm hücresi bıraktığını da not edelim.
180×10^6 haploid hücre x 750 MB/haploid hücre = 135 x 10^9 MB ya da 135.000 Terabayt
135.000 Terabayt! Daha iyi anlayacağımız bir şekilde anlatmak gerekirse, bir cinsel birleşme sırasında, yaklaşık 1000 adet yüksek çözünürlüklü filmi aktaracak kadar veri akışı meydana gelir.
İşi daha da ileriye götürelim. Bu büyüklükte bir veri transfer edilirken, yalnızca tek bir sperm hücresi istenilen veriyi hedefe kadar ulaştırabilir. Bu da 135 Terabayt’lık bilginin sadece 750 MB’lık kısmının hedefe gönderilebildiğini gösterir. Diğer bir deyişle, cinsel birleşme sırasında gönderilen bilginin %99.9999999….’luk bir kısmının yolda kayıp olur. Neyse ki, hedefe ulaşan %0.000…01′lik oran bile sağlıklı bir birey oluşturmak için yeterlidir.
Elbette, bu sayıların sadece eğlence amaçlı olarak hesaplandığını belirtmekte fayda var. Genomunuz, sahip olduğu veriyi basit bir harf kodundan (ATGATCGA..) çok daha kompleks şekillerde depolar. Genomik verinizin depolanmasında, binlerce protein ve RNA, oldukça kompleks etkileşimlerle görev alır. Tüm bu verilerin ne kadar olduğunun bilinmesi şimdilik mümkün değil. Yine de, bu yazının üzerinizde taşıdığınız verinin ne kadar büyük olduğuna dair size ipucu vereceğine inanıyoruz.
Kaynaklar:
BiteSize Bio: How Much Information is Stored in the Human Genome
Wikipedia: Human Genome
Human Genome Project: Information
Hazırlayan Can Holyavkin
.