Genetik bilimi her geçen gün daha da gelişiyor. Bundan yıllar önce sadece çıplak gözle ve sonrasında mikroskop yardımıyla gözlem yapabiliyorken günümüzde bundan çok daha fazlasını yapabiliyoruz. Örneğin, CRISPR teknolojisi sayesinde genetikte birtakım değişiklikler yaparak yeri geldiğinde o organizmanın çok daha verimli halde çalışmasını sağlayabiliyoruz veya İnsan Genom Projesi sayesinde genetiğimiz hakkında oldukça fazla detaya ve bilgiye erişebiliyoruz. Bugün genetik alanında “Biyoinformatik” terimi oldukça sık kullanılıyor ve bizler de baş döndürücü bir hızla gelişen bu alan hakkındaki bilgimizi artırmak istiyoruz.
Georgy Kurakin
Röportaj ve Çeviri: Sedef Çakır
Genetik bilimi her geçen gün daha da gelişiyor. Bundan yıllar önce sadece çıplak gözle ve sonrasında mikroskop yardımıyla gözlem yapabiliyorken günümüzde bundan çok daha fazlasını yapabiliyoruz. Örneğin, CRISPR teknolojisi sayesinde genetikte birtakım değişiklikler yaparak yeri geldiğinde o organizmanın çok daha verimli halde çalışmasını sağlayabiliyoruz veya İnsan Genom Projesi sayesinde genetiğimiz hakkında oldukça fazla detaya ve bilgiye erişebiliyoruz. Bugün genetik alanında “Biyoinformatik” terimi oldukça sık kullanılıyor ve bizler de baş döndürücü bir hızla gelişen bu alan hakkındaki bilgimizi artırmak istiyoruz. “Biyoinformatik” denilince ilk akla gelen isimlerden biri olan ve bu konudaki çalışmalarıyla genetik bilimine büyük katkılar sağlayan Sayın Georgy Kurakin ile aydınlatıcı bir röportaj gerçekleştirdik.
Öncelikle GazeteBilimin röportaj teklifini kabul ettiğiniz için çok teşekkür ederiz. Temel bir sorudan başlayalım istiyorum. Biyoinformatik nedir ve hangi alanlarda kullanılır?
Biyoinformatik kavramının tanımlanması başlı başına zorlayıcı bir soru. Öngörülebilir şekilde, biyolojik problemleri çözmek için bilgisayar bilimi yöntemlerini kullanan bir bilim dalı olarak anlaşılabilir ve genellikle bu doğru bir yaklaşımdır. Fakat, bu kapsam içinde yer alan araştırma alanları vardır ve hangilerinin “gerçek” biyoinformatik olarak kabul edilmesi gerektiği konusunda uzun süreli bir tartışma sürmektedir.
Biyoinformatik kavramının tanımlanması başlı başına zorlayıcı bir soru. Öngörülebilir şekilde, biyolojik problemleri çözmek için bilgisayar bilimi yöntemlerini kullanan bir bilim dalı olarak anlaşılabilir ve genellikle bu doğru bir yaklaşımdır.
İlk büyük alan algoritmik biyoinformatiktir; bu, biyolojik soruları çözmeye yönelik bilgisayar programlarının tasarlanması ve geliştirilmesi anlamına gelir. Bilgi teknolojisi (BT) şirketleriyle karşılaştırıldığında, bu alanın araştırmacıları biyoinformatik dünyasında bir tür “geliştirici” konumundadır. Ana uzmanlık alanları programlama ve bilgisayar bilimidir, biyologların uygulamalı problemlerini çözmek için kullanabileceği yeni araçlar ve hesaplama yöntemleri geliştirirler. Bazı araştırmacılar algoritmik biyoinformatiği “gerçek” biyoinformatik olarak kabul ederler. Bu sebeple, tam anlamıyla biyoinformatik sadece algoritmik biyoinformatik olarak tanımlanır.

Evrimsel, yapısal veya genomik çalışmalarda algoritmik biyoinformatiğin bulgularını kullanmaya yönelik diğer alanlar ise hesaplamalı biyoloji olarak adlandırılır. Bu terim popülaritesini artırmaktadır; örnek verecek olursak, bu alandaki en saygın üyelik organizasyonlarından biri olan Uluslararası Hesaplamalı Biyoloji Derneği (ISCB) de bu terimi adında kullanmaktadır. Ancak hesaplamalı biyoloji ile biyoinformatik arasındaki sınır öyle belirsizdir ki birçok bilim insanı bu ayrımın önemli olmadığına ve tüm hesaplamalı yaşam bilimleri alanlarının “biyoinformatik” olarak adlandırılabileceğine inanmaktadır. Her halükarda, bu tartışmanın çok fazla zaman ve çaba gerektiren bir sorun olmadığını düşünüyorum; biyoinformatiğin ne daha çok biyoinformatik ya da ne daha az biyoinformatik tartışmasından daha ilginç faaliyetleri ve sorunları vardır.
Biyoinformatiğin klasik laboratuvar yöntemlerine göre avantajları nelerdir?
Biyoinformatik ve klasik laboratuvar yöntemleri (diğer bir deyişle “ıslak biyoloji”) rekabet içinde değil, birbirini tamamlayıcı niteliktedir. Bu sebeple avantajlar ve dezavantajlardan çok, bu yöntemlerin sunduğu ek imkanları ele almak istiyorum.
Modern biyolojiyi mümkün kılan bazı yöntemlerde “ıslak” ve “kuru” yöntemler bir bütün haline gelmiştir. Bu, genomik, proteomik, metabolomik gibi “-omik” yöntemlerde gözlemlenir. Örneğin, Yeni Nesil Dizileme (NGS) teknolojisi, nükleotid dizilerini inanılmaz bir hızla okuyabilir; fakat, elde edilen diziler çok kısadır ve biyolojik anlam taşıyan bir genomik dizi oluşturmak için çok sayıda kısa dizinin bir araya getirilmesi gereklidir. Bu, biyoinformatiğin sunduğu büyük veri işleme yöntemleri olmadan imkansızdır.
Diğer “-omik” alanlarında da durum benzerdir — yüksek performanslı otomatik deneysel yöntemlerle elde edilen ham veriler hesaplama yöntemleriyle işlenir. Bu durum, biyoinformatik ve “geleneksel” moleküler biyoloji arasındaki sıkı bağın bir örneğidir.
Deneysel veriler biyoinformatik olmadan var olabilir, ancak biyoinformatik deneysel veri olmadan tamamen işlevsizdir.
“-Omik” çalışmalar dışında, biyoinformatik ve laboratuvar yöntemlerinin birleştirildiği makale sayısında artış görülmektedir. Yeni veriler oluşturmak ve çıkarımları deneysel olarak doğrulamak için laboratuvar yöntemlerine ihtiyaç duyulur — fakat bu yöntemler çok miktarda veriyi bir anda işleyemez, yeni ilişkiler bulamaz ve yeni istatistiksel sonuçlar çıkaramaz. Bu sebeple biyoinformatik, daha ileri deneysel doğrulamalar için paha biçilmez bir hipotez kaynağıdır. Bu duruma espriyle yaklaşarak “Biyoinformatikçiler, ıslak biyologlara hangi tüpten pipetleme yapmaları gerektiğini söyler” denmiştir. Her espride bir gerçek payı vardır; biyoinformatik, araştırmacılara deneyleri tasarlama gücü verir. Fakat, “ıslak biyologlar”a yönelik herhangi bir küçümsemeyi kınıyorum — deneysel veriler biyoinformatik olmadan var olabilir, ancak biyoinformatik deneysel veri olmadan tamamen işlevsizdir.
Biyoinformatik alanında çalışmak isteyen bir moleküler biyolog nasıl uzmanlaşabilir?
Öncelikle, bir biyoloğun resmi bir eğitim programına girip yeniden öğrenci olması gerekmez. Biyoinformatik alanında birçok çevrimiçi eğitim platformunda esnek bir programla, iş başında öğrenme imkânı sunan çok sayıda kurs bulunuyor. Bu tür platformlardan ilki, elbette Coursera’dır. Bunun yanı sıra, dünyanın önde gelen bazı üniversiteleri, programlama ve veri bilimi de dahil olmak üzere çeşitli konularda çevrimiçi kurslar sunmakta. Harvard Üniversitesi’nin Profesyonel ve Yaşam Boyu Öğrenme Platformu (Professional and Lifelong Learning) buna bir örnektir. Son olarak, ISCB’nin hazırladığı biyoinformatik çevrimiçi kurslarının kapsamlı bir dizinini tavsiye ederim. Tüm bu kaynaklar yalnızca örnektir — daha birçok benzer kaynak bulunabilir.
Eğer bir “ıslak” moleküler biyolog iseniz, programlama ve veri bilimi öğrenmenin yanı sıra belirli biyoinformatik beceriler ve araçlar edinmelisiniz.
Eğer bir “ıslak” moleküler biyolog iseniz, programlama ve veri bilimi öğrenmenin yanı sıra belirli biyoinformatik beceriler ve araçlar edinmelisiniz. Çevrimiçi kursların yanında, veri bilimciler için faydalı kitaplar da bulunmakta. Veri bilimcilerine yönelik literatür, veri bilimcilerine olan artan talep nedeniyle yükselişte. Bu kitapların bazıları İngilizce olarak, bazıları ise çeviri olarak mevcuttur. Örnek olarak, Steven S. Skiena’nın “The Data Science Design Manual” (veri biliminin genel teorisi için) ve Mike X Cohen’in “Practical Linear Algebra for Data Science” (başlangıç seviyesinden itibaren öğrenmeye yönelik lineer cebir için) kitaplarını önerebilirim. Özel biyoinformatik becerilere yönelik literatür daha sınırlıdır — bu konuda çevrimiçi kurslara güvenmenizi tavsiye ederim.
Son olarak, yeni bir yeterlilik kazanmak için üniversitelerin tam teşekküllü programlarına katılma seçeneğiniz de var. Genellikle üniversiteler yaklaşık 2 yıl süren biyoinformatik yüksek lisans programları sunmaktadır. Örneğin, Türkiye’de Hacettepe Üniversitesi biyoinformatik alanında böyle bir program sunmaktadır.
Biyoinformatikte kullanılan temel programlama dilleri ve araçlar nelerdir?
Biyoinformatikte en önemli programlama dili kesinlikle Python’dur! Bu dil, veri biliminde aktif olarak kullanılır ve biyoinformatikçiler için başlıca araçlardan biridir. Python, kütüphanelerle kolayca genişletilecek şekilde tasarlanmıştır —bu da neredeyse her türlü işlemi gerçekleştirebilen mevcut kütüphane sayısının hızla artmasına neden olmuştur. Çoğu rutin biyoinformatik problemi Python kütüphaneleri ile çözülür; bunlar arasında Biopython (biyoinformatik araç seti), NumPy (lineer cebir için) ve pandas (veri çerçeveleri için) gibi veri bilimi kütüphaneleri bulunmaktadır. Biyoinformatik için gerekli daha birçok kütüphane mevcuttur —fakat, kütüphane seti belirli görevlere göre özelleştirilebilir.
İkinci önemli programlama dili ise R’dir. İstatistik için tasarlanmıştır ve geniş bir istatistiksel fonksiyon envanterine sahiptir. Ancak Python, R dilini neredeyse tamamen geride bırakmıştır ve teknik olarak R’nin yerini Python alabilir. Buna rağmen, ileri düzey istatistiksel araçların gerekli olduğu popülasyon genetiği gibi yaşam bilimlerinin bazı alanlarında hâlâ R kullanılmaktadır.

Programlamanın dışında, belirli biyoinformatik görevler için geliştirilmiş birçok hazır uygulama bulunmaktadır; bu uygulamalar spesifik sorunlar ve işlemler için tasarlanmıştır ve hepsini burada listelemek gerekli değildir. Bazı uygulamalar yalnızca komut satırında çalışırken, bazıları grafik arayüzlüdür ya da bir web sürümüne sahiptir. Yaygın bir özellik olarak, biyoinformatik uygulamaların çoğu Linux için tasarlanmıştır ve bazılarının Windows sürümü bulunmamaktadır. Dolayısıyla, biyoinformatik çalışmalarında Linux kullanımı gereklidir —fakat, neyse ki Ubuntu gibi pek çok ücretsiz ve kullanıcı dostu Linux dağıtımı bulunmaktadır.
Gelişen teknolojilerle birlikte biyoinformatik kavramının yönü nereye gidiyor olabilir?
Makine öğrenimindeki gelişmelerin, biyoinformatik hesaplamalarda yapay zekânın daha aktif şekilde uygulanmasına yol açacağını ve zamanla “katı algoritmaların biyoinformatiğinden” “makine öğreniminin biyoinformatiğine” doğru bir kayış yaşanacağını düşünüyorum. Bu durum, içeride bir hesaplama “kara kutusu” barındıran birçok yeni aracın ortaya çıkmasına neden olabilir. Bu da, biyoinformatikçilerin daha fazla zaman ve çaba harcayarak yapay zekânın temel sorunlarından biri olan yorumlama problemini çözmeye çalışmaları anlamına gelecektir. Günümüzde, AI’nin biyoinformatikte kullanımına yönelik umut verici yeni yöntemler zaten görülmeye başlanmıştır — fakat, bu yöntemlerin zorlayıcı sonuçları da olabilir. Ancak bilim, her zaman zorluklarla başa çıkmakla ilgili olmuştur. biyoinformatik de bu duruma bir örnektir.
Şimdiye kadar biyoinformatik alanındaki en çarpıcı gelişme sizce ne oldu?
Öncelikle, bu yılki Nobel Kimya Ödülü’nün protein yapısını tahmin eden, AI tabanlı bir yazılım olan AlphaFold’un geliştirilmesine verildiğini belirtmeliyim. Bu, biyoinformatiğin tam anlamıyla bir örneği ve daha önce bahsettiğim gibi yapay zekânın biyoinformatikteki yeni kullanım alanlarına dair bir örnektir.
Uzun zamandır, protein dizisinde yer alan tüm bilginin üçüncül yapı oluşumunu sağladığını biliyorduk —fakat, protein yapısını sıfırdan güvenilir bir şekilde tahmin edemiyorduk. Moleküller arası temaslar ve kuvvetler için fiziksel bir model oluşturamamıştık ve bu modeller mevcut kaynaklarla hesaplanabilir değildi. AlphaFold’un fikri ise nöral ağları, moleküller arası mesafe verileri ya da evrimsel verilerle eğitmek ve bu sayede yapısal bilgiyi bu verilerden çıkarmak yönündeydi. Bu yaklaşım başarılı oldu ve bu gerçekten büyüleyici bir gelişme.
Biyoinformatiğin diğer alanlarına gelince, biyoinformatik oldukça çeşitli bir alan olduğundan bu tür atılımları karşılaştırmak ve en çarpıcı gelişmeyi seçmek zor. Fakat, ben evrimsel bir biyoinformatikçi olarak bakteriyel enzimlerin filogenetiğini çalışıyorum.
Biyoinformatiğin diğer alanlarına gelince, biyoinformatik oldukça çeşitli bir alan olduğundan bu tür atılımları karşılaştırmak ve en çarpıcı gelişmeyi seçmek zor. Fakat, ben evrimsel bir biyoinformatikçi olarak bakteriyel enzimlerin filogenetiğini çalışıyorum —ve benim için (tamamen öznel bir değerlendirmeyle) en ilham verici gelişme, biyoinformatik sayesinde bakteriyel evrim hakkında elde edilen geniş veri yelpazesi. Genler aracılığıyla evrimlerini takip etme yöntemleri keşfedildiğinden beri, bilim camiası çok sayıda kültüre edilememiş mikrobu tanımladı —bunlar arasında, sonradan kültüre edilmiş olan ökaryotların ataları olan Asgard arkeleri de yer alıyor. Bakterilerin sınıflandırması değişti ve şimdi yeni, filogenetik temelli bir taksonomi ile tanışıyoruz.
Bu çalışmalar bize bakteriler hakkında giderek daha ilginç bilgiler sağlıyor. Örneğin, Dünya atmosferini oksijenli hale getiren siyanobakteriler, insan bağırsağında yaşayan bir bakteri taksonu ile yakın akrabadır. Dizanteriye yol açan Shigella, teknik olarak Escherichia coli’nin ayrı bir türü değil, sadece bir alt popülasyonudur. Ve her ay yeni ve büyüleyici bilgilerle filogenetik çalışmalar yayınlanmaya devam ediyor! Bazı meslektaşlarım prokaryotlarda ne bulduğumu ve onları neden bu kadar ilginç bulduğumu merak ediyor. Ancak, onları filogenetik yöntemlerle incelerseniz gerçekten ilham verici oluyor!
Çok teşekkür ederiz Sayın Kurakin.

