Boğaziçi Üniversitesi Türkiye Genom Araştırması

Türkiye'nin farklı illerinde yaşayan bireylerin tüm genom dizilim analizi

Amaç

Önerdiğimiz genom projesi ile Türkiye'de ikincil alel frekansı %5'in üzerinde olan genomik çeşitliliğin bulunması amaçlanmaktadır. Bu kapsamda ilk aşamada farklı illerden örneklenmiş bilinen bir kalıtsal hastalığı bulunmayan 16 insan genomunun tamamı yeni nesil DNA dizileme cihazları ile dizilenerek tek nükleotid polimorfizmi (TNP), kopya sayısı çeşitliliği (KSÇ), ve yapısal çeşitlilik (YÇ) saptanacaktır.

Genom bir kişinin taşıdığı tüm genetik bilgidir. Bu da tüm kromozomlarındaki DNA dizilerin tümüne karşılık gelir. İnsanlar arasındaki farklılıkların çoğu genomlarındaki farklılıklar ile açıklanabilir. Uluslararası İnsan Genom Projesi'nin tamamlanması sonrasında HapMap Projesi, İnsan Genomu Çeşitlilik Projesi ve nihayetinde 2500 insan genomunun dizilenmesini amaçlayan 1000 Genom Projesi başlatılarak insan genomları arasındaki farklılıkların kataloglanması amaçlanmıştır. Bunların haricinde Çin, Kore, İrlanda, Hollanda başta olmak üzere bazı ülkelerde ulusal projeler başlatılmıştır.

Yukarıda bahsedilen uluslararası projelerde ne yazık ki Türkiye ve civarındaki coğrafyada yaşayan insanlardan örnekleme yapılmamış, böylece bölgemizdeki genomik çeşitliliğin keşfi mümkün olmamıştır. İşte bu nedenlerden dolayı başlatmış olduğumuz Türkiye Genom Araştırması bu boşluğu doldurmayı hedeflemektedir.

Türkiye Genom Araştırması'nın beklenen etkileri

Türkiye Genom Araştırması'nın amaçları arasında doğrudan olmasa da beklenen bazı etkileri şunlardır:

1 - Teknoloji ve bilgi transferi, Türkiye'de genom dizileme ve analizini içeren gelecekte yapılabilecek projeler için gerekli eğitime ve tecrübeye sahip genç araştırmacıların yetiştirilmesi.

2 - Türkiye'de sıklıkla rastlanan genomik çeşitliliğin keşfi ve sınıflandırılması genom boyu asosiyasyon çalışmalarına (genome-wide association study; GWAS) da katkıda bulunacaktır. Hâlihazırda alınıp kullanılabilen TNP (SNP) ve/veya yapısal çeşitlilik genotipleme array'leri ile çoğunlukla Batı Avrupa asıllı insanlarda sık görülen aleller incelenebilir. Ancak dışarıya oranla Türkiye'de daha çok rastlanan ve GWAS yöntemi kullanarak nedeni bulunması muhtemel olan bazı hastalıklar ile ilişkili olan genomik farklılıkların Türkiye içindeki rastlanma sıklığı, Türkiye dışına göre daha fazla olması beklenir. Böyle durumlarda Batı Avrupa temelli genomik testler bu alelleri içermediği için yeterli olmayabilir. Bu yüzden Türkiye Genom Araştırması'nın sonuçları Türkiye'de sıklıkla rastlanılan hastalıkların araştırılması için yeni testlerin geliştirilmesinde kullanılabilecektir.

Elde edilen verilerin kullanımı

Türkiye Genom Araştırması'nda elde edilen veriler, araştırma sonuçlarının bilimsel bir dergide yayınlanmasından sonra bilim insanlarının kullanımına açılacaktır.

DNA dizileme ve diğer ülkelerde yapılan araştırmalar

Dünyadaki ilk yerleşim birimlerinden biri olan Türkiye coğrafyası Asya ve Avrupa kıtaları arasında yer almış, yıllarca insanların dünyaya yayılmasında bir köprü konumunda bulunmuştur. Bu bakımdan Türkiye'deki genetik çeşitliliğin yapısını ve genetik çeşitliliğin derecesini anlamak insan çeşitliliğini anlamak için önem arz etmektedir. İnsan göçlerine ve dolayısıyla batı toplumlarının kökenine ışık tutacaktır.

Gerçekleştirdiğimiz proje sayesinde günümüze kadar tamamlanmış insan genom projesi (International Human Genome Sequencing Consortium 2001, 2004), J. Craig Venter (Venter et al., 2001), James Watson (Wheeler et al., 2008), Han Çinli genomu (Wang et al., 2008), Güney Afrika genomu (Schuster et al. 2010), Koreli genomu (Ahn et al., 2009; Kim et al., 2009), Çin, Avrupa ve Amerika Birleşik Devletleri'ndeki bilim adamlarının ortaklaşa başlattıkarı 1000 Genom Projesi (1000 Genomes Project Consortium, 2010) kapsamında genom dizileri belirlenen 185 birey ile karşılaştırılarak Türkiye'deki genetik çeşitliliğin yapısı belirlenecektir.

Ayrıca yeni başlatılması düşünülen Koreli ve Çinli bilim insanlarının başlattıkları 4000 Asyalı genom projesine paralel olarak Turkiye'de geliştirilebilecek olan kapsamlı bir genom projesinin başlangıc aşamasını oluşturması bakımından da önemlidir. Amacımıza ulaşmak için, önerdiğimiz projede, Türkiye'de sıklıkla görülen genetik çeşitliliğin aydınlatılması için genetik, biyoenformatik, hesaplamalı biyoloji, genom biyolojisi, karşılaştırılmalı ve işlevsel genomik yöntemlerinin temel unsurlarını birleştireceğiz. Temel amacımız ülkemizin ve üniversitemizin uluslararası düzeyde temel bilimler alanındaki saygınlığının ve rekabetçi gücünün artması için bu çalışmanın sonuçlarını uluslararası endekslere kayıtlı üst düzey dergilerde yayınlamaktır.

Dünyadaki Tüm Genom Dizilimi Devam Eden Projeler

Resmi büyütmek için lütfen resmin üzerine tıklayınız

PROJENİN LİTARATÜR, TEKNİK ÖZETİ VE  GÜNCEL UYGULANABİLİRLİĞİ:

İnsana özel fenotiplerin (dış görünüş, davranış gibi) temelini oluşturan genetik çeşitliliğin belirlenebilmesi, insan genomunun ayrıntılı bir şekilde anlaşılmasında yatmaktadır. İnsan genotip-fenotip ilişkisinin tamamıyla anlaşılması bir insan bireyinin DNA diziliminin tamamıyla belirlenmesi ile olur. Geçmişte 2005 yılına kadar DNA dizilim analizleri için temel olarak Sanger metodu kullanılmaktaydı. Bu metod belirli oranlarda dedioxy nükleotid kullanılarak polimeraz zincir reaksiyonun tesadüfi olarak sonlandırılması temeline dayanmaktadır. Daha sonra tesadüfi olarak sonlandırılmış bu DNA parçacıklarının çok küçük gözenekler içeren jel sistemlerinde yürütülmesi ve sonuç olarak DNA parçacıklarının diziler halinde ayrıştırılması ve sonuçda DNA diziliminin okunmasıyla gerçekleşir. 

Önceleri her bir nukleotid için farklı bir reaksiyon tasarlanırken özellikle 90’lı yıllara gelindiğinde floresan boyaların kullanılması ile sanger metodu çok gelişmiştir. Günümüzdeki en son Sanger teknolojisi tabanlı cihaz ABI3730Xl olup her bir çalışmada 96kb dizi üretebilmektedir. İlk insan genom projesi kapsamında insan DNA diziliminin çözülmesi Sanger metodu kullanılarak gerçekleştirilmiş olup J. Craig Venter’ın genomunun dizi analizi yaklaşık olarak 10 yılı aşkın bir zamanda 10 milyon dolara yapılmıştır (Venter et al., 2001). Her ne kadar Sanger metodu oturmuş ve başlangıcından beri cok gelişmiş olsa bile pahalı olması, çok iş yükü ve zaman gerektirmesi sebebiyle günümüz bilim dünyasındaki beklentileri karşılayamamaktadır. Bu yüzden bir çok bireyin aynı anda genom diziliminin tamamının belirlenmesi çok fazla zaman alması ve yüksek meblağlar gerektirmesi sebebiyle pratikte mümkün olmamaktaydı. Fakat son yıllardaki DNA dizilim metodlarındaki gelişmeler ve bu metodlarla birlikte ortaya çıkan alternatif uygulamalar sonucu insan genomunun dizilenmesi ve genom analizleri yaygın bir şekilde kullanılmaya başlanmıştır. Bu da 2005 yılında özellikle yeni nesil DNA dizilimi teknolojilerin ortaya çıkmasını sağlamıştır. Sanger metoduna alternatif olarak ilk kullanıma sunulan yeni nesil DNA dizilim analiz teknolojisi Roche tarafından piyasaya sürülen “pyrosequencing”, ya da ticari adıyla Roche/454 DNA dizilim yöntemidir. Bu teknoloji Sanger metodu ile karşılaştırıldığında daha ucuz olması ve cok hızlı bir şekilde data üretebilmesi bakımından önemlidir. Sanger metodunda günümüz teknolojileri kullanarak her bir okuyuşta yaklaşık 1000 baz uzunluğunda nucleotid okunsa da Roche/454 metodu ile ancak 400 ila 600 baz uzunlugunda DNA parçacıkları analiz edilebilmektedir. İlk piyasaya çıktığında cok ilgi çekmis olan bu metod özellikle karşılaştırmalı genom analizlerinde çok iyi oldugu ispatlanmıştır. DNA’nın yapısını keşfeden bilim adamlarindan biri olan ve Nobel ödüllü James D. Watson’ın genomu da Roche/454  teknolojisi kullanılarak yaklaşık 1 yıl gibi kısa bir zamanda $1 million kullanılarak bitirilmiş olup bilim dunyasinin kullanimina sunulmustur (Wheeler et al., 2008).

Bir diğer yeni nesil DNA dizilim analiz yöntemi ise Illumina/Solexa (“sequencing-by-synthesis”) adı verilen metoddur. İllumina/Solexa metodu Roche/454 teknolojisi ile karşılaştırıldığında daha ucuz ve daha cok data ureteilen bir yöntemdir. Illumina/Solexa metodu cok kisa uzunluklarda DNA parçacıklarının (yaklaşık 100bp) analizini sunması bakımından dezavantajlıdır. Bugüne kadar Illumina/Solexa platformu kullanılarak 3 bireyin genom analizi çok kısa bir zamanda bitirilip ortalama $250.000’a  mal olmuştur (Wang et al., 2008); (Ley et al., 2008); (Bentley et al., 2008). Günümüzde özellikle Illumina/Solexa platformundaki gelişmeler sayesinde bir insan genom diziliminin tamamının bitirilmesi 1-2 ay gibi kısa bir zaman diliminde yaklaşık $5.000 dolara mal olmaktadır. Bu miktarın önümüzdeki yıl başlarında yine özellikle Illumina/Solexa platformundaki parallel dizileme ve analiz yöntemlerinin gelişmesi ile $3000-$4000 kadar düşeceği öngörülmektedir. Yeni nesil DNA dizileme metodlarından olan Illumina/Solexa platformu günümüzdeki en ucuz DNA dizileme platformu olup 1 DNA baz dizileme fiyatı Roche/454  teknolojisi ile karşılaştırıldığında 70-80’de 1 kadar daha ucuzdur. Bu yüzdendir ki 1000 Genom Projesi (1000 Genomes Project Consortium, 2010) büyük oranda Illumina/Solexa platformu kullanılarak gerçekleştirilmektedir.

 

Referanslar

Ahn, S.M., Kim, T.H., Lee, S., Kim, D., Ghang, H., Kim, D.S., Kim, B.C., Kim, S.Y., Kim, W.Y., Kim, C., et al. (2009). The first Korean genome sequence and analysis: full genome sequencing for a socio-ethnic group. Genome research 19, 1622-1629.

Alkan, C., Kidd, J.M., Marques-Bonet, T., Aksay, G., Antonacci, F., Hormozdiari, F., Kitzman, J.O., Baker, C., Malig, M., Mutlu, O., et al. (2009). Personalized copy number and segmental duplication maps using next-generation sequencing. Nature genetics 41, 1061-1067.

Bentley, D.R., Balasubramanian, S., Swerdlow, H.P., Smith, G.P., Milton, J., Brown, C.G., Hall, K.P., Evers, D.J., Barnes, C.L., Bignell, H.R., et al. (2008). Accurate whole human genome sequencing using reversible terminator chemistry. Nature 456, 53-59.

Durbin, R.M., Abecasis, G.R., Altshuler, D.L., Auton, A., Brooks, L.D., Durbin, R.M., Gibbs, R.A., Hurles, M.E., and McVean, G.A. (2010) A map of human genome variation from population-scale sequencing. Nature 467, 1061-1073.

Hormozdiari, F., Alkan, C., Eichler, E.E., and Sahinalp, S.C. (2009). Combinatorial algorithms for structural variation detection in high-throughput sequenced genomes. Genome research 19, 1270-1278.

Kim, J.I., Ju, Y.S., Park, H., Kim, S., Lee, S., Yi, J.H., Mudge, J., Miller, N.A., Hong, D., Bell, C.J., et al. (2009). A highly annotated whole-genome sequence of a Korean individual. Nature 460, 1011-1015.

Ley, T.J., Mardis, E.R., Ding, L., Fulton, B., McLellan, M.D., Chen, K., Dooling, D., Dunford-Shore, B.H., McGrath, S., Hickenbotham, M., et al. (2008). DNA sequencing of a cytogenetically normal acute myeloid leukaemia genome. Nature 456, 66-72.

Ng, S.B., Turner, E.H., Robertson, P.D., Flygare, S.D., Bigham, A.W., Lee, C., Shaffer, T., Wong, M., Bhattacharjee, A., Eichler, E.E., et al. (2009). Targeted capture and massively parallel sequencing of 12 human exomes. Nature 461, 272-276.

Okou, D.T., Steinberg, K.M., Middle, C., Cutler, D.J., Albert, T.J., and Zwick, M.E. (2007). Microarray-based genomic selection for high-throughput resequencing. Nature methods 4, 907-909.

Porreca, G.J., Zhang, K., Li, J.B., Xie, B., Austin, D., Vassallo, S.L., LeProust, E.M., Peck, B.J., Emig, C.J., Dahl, F., et al. (2007). Multiplex amplification of large sets of human exons. Nature methods 4, 931-936.

Schuster, S.C., Miller, W., Ratan, A., Tomsho, L.P., Giardine, B., Kasson, L.R., Harris, R.S., Petersen, D.C., Zhao, F., Qi, J., et al. Complete Khoisan and Bantu genomes from southern Africa. Nature 463, 943-947.

Turner, E.H., Lee, C., Ng, S.B., Nickerson, D.A., and Shendure, J. (2009). Massively parallel exon capture and library-free resequencing across 16 genomes. Nature methods 6, 315-316.

Tuzun, E., Sharp, A.J., Bailey, J.A., Kaul, R., Morrison, V.A., Pertz, L.M., Haugen, E., Hayden, H., Albertson, D., Pinkel, D., et al. (2005). Fine-scale structural variation of the human genome. Nature genetics 37, 727-732.

Venter, J.C., Adams, M.D., Myers, E.W., Li, P.W., Mural, R.J., Sutton, G.G., Smith, H.O., Yandell, M., Evans, C.A., Holt, R.A., et al. (2001). The sequence of the human genome. Science (New York, NY 291, 1304-1351.

Wang, J., Wang, W., Li, R., Li, Y., Tian, G., Goodman, L., Fan, W., Zhang, J., Li, J., Zhang, J., et al. (2008). The diploid genome sequence of an Asian individual. Nature 456, 60-65.

Wheeler, D.A., Srinivasan, M., Egholm, M., Shen, Y., Chen, L., McGuire, A., He, W., Chen, Y.J., Makhijani, V., Roth, G.T., et al. (2008). The complete genome of an individual by massively parallel DNA sequencing. Nature 452, 872-876.