“Bu gelişmeler, Genel Yapay Zekaya (AGI) doğru atılan kritik adımlar- geleneksel biyoteknolojik yaklaşımlardan, yapay zekâ odaklı metodolojiye geçilmesi- olarak değerlendirildi.”
Çeviren: Gizem Özkabak
Büyük dil modelleri (LLMs) yazılı veya sözlü promptları işleyebilen, aldığı direktifler doğrultusunda tutarlı ve akılcı metinler üretebilen gelişmiş derin öğrenme algoritmalarıdır. Son dönemde kullanımı giderek yaygınlaşan bu modeller; uzun metinleri özetleme, marka ismi oluşturma, soruları hızlıca yanıtlama gibi daha birçok çeşitli alanda kullanılmaktadır.
Georgia Üniversitesi ve Mayo Clinic’teki araştırmacılar LLM altyapılı farklı dil modellerinin biyoloji alanında sahip olduğu bilgiyi kullanabilme, anlayabilme ve analiz edebilme yetkinliklerini ölçmek amacıyla bir araştırma geliştirdiler. Henüz sadece arXiv’de yayınlanan bu araştırmada, OpenAI’ın bir ürünü olan GPT-4’ün piyasadaki diğer dil modellerinden daha başarılı olduğunu öne sürdüler.
Araştırmacılardan Zhengliang, yapay zekânın biyoloji araştırmalarında hissedilir biçimde etkili olduğuna işaret ederek şu ifadeleri kullandı: “Bu çalışmanın doğuşunda, büyük dil modellerinin geliştirilmesi ve özellikle Kasım 2022’de Chat GPT’nin dikkatleri üzerine çeken tanıtımı ve sonrasında hızlıca benimsenmesi etkili oldu. Bu gelişmeler, Genel Yapay Zekaya (AGI) doğru atılan kritik adımlar- geleneksel biyoteknolojik yaklaşımlardan, yapay zekâ odaklı metodolojiye geçilmesi- olarak değerlendirildi.”
Daha önce yapılan çalışmalarda her ne kadar bu modellerin çeşitli alanlarda kullanılabilirlikleri belirtilmiş olsa da biyoloji araştırmalarını yönetebilme ve biyolojik temelli veriyi işleyebilme yetenekleri yeterince incelenmemişti. Bu sebeple Lui ve ekip arkadaşları, en çok kullanılan beş büyük dil modelini (GPT-4, GPT-3.5,PaLM2,Claude2 ve SenseNova) seçerek tutarlı-akılcı hipotez kurabilme ve biyolojiye ilişkin sorunları çözmede akıl yürütme becerilerini ölçmeye, sonuçları aralarında karşılaştırmaya yönelik; temel moleküler biyoloji, metabolik mühendislik, sentetik biyoloji gibi farklı alt alanlardan oluşan 108 soruluk çoktan seçmeli bir test hazırladı.
Jason Holmes’a göre çoktan seçmeli soruların tercih edilmesinde derecelendirme, değerlendirme ve karşılaştırmanın kolaylıkla yapılabilmesi etkili oldu. Holmes ve ekibi testteki her soruyu, yanıtlardaki ortalama performans ve varyasyonları görmek amacıyla, farklı biçimlerde kurgulayarak beşer defa sordu. Holmes: “Elde edeceğimiz sonucu fark etmeden ideal ya da yetersiz bir biçimde yapılandırılmış sorulara dayandırarak etkilemek istemedik bu sebeple aynı soruları farklı biçimlerde sorduk.”
Xinyu Gong’un bildirdiğine göre, GPT-4 ortalama 90 puanlık bir skor alarak beş büyük dil modelinden testi en başarılı tamamlayan model oldu. Bunun yanı sıra büyük bir tutarlılık da sergileyen GPT-4’ün biyolojik veriyle eğitilmiş yeni sürümlerinin bu alandaki araştırma ve eğitime– öğrencilere mentörlük ederek, interaktif materyaller ya da test edilebilir hipotezler üreterek- yardımcı olabileceği de öngörülüyor.
Lui bu araştırmanın sonucunda, yapay zekânın farklı edinçlerini bütüncül bir biçimde kullanarak, onu yalnızca yardımcı bir araç olmaktan çıkarıp aynı zamanda hız kesmeden gelişen ve değişen biyolojide yönlendirici ve çözümleyici bir araç olarak konumlandırıyor.
Yeni araştırmalar planlayan Liu, Holmes, Gong ve ekibi ilk olarak donanımsal (veri yığınlarının işlenmesi için gereken yüksek kapasiteli ve karmaşık algoritma ihtiyacı) ve hukuki (veri gizliliği) sorunları aşmak için strateji geliştirmeyi hedefliyorlar. Gen etiketleme ve fenotip-genotip eşleme gibi uygulamaların, geliştirilen açık kaynaklı yazılımlarca otomatikleştirilmesi ile bu sorunların giderilebileceğini düşünüyorlar. Zihao Wu: “GPT-4’ten bilgi damıtma yöntemini (knowledge distallation) kullanarak LLaMA temel modellerinde olduğu gibi detay odaklı modeller (fine-tune models) oluşturacağız” diyor.
Zihao Wu ayrıca, bu strateji GPT-4’e kaldıraç görevi görürken, aynı zamanda gizlilik gibi sorunları ortadan kaldırarak ve mâliyetin düşmesini sağlayarak ileri teknikleri biyoloji camiası için daha ulaşılabilir kılacağını ve buna ek olarak, GPT-4’ün görsel veri işleyebilme kapasitesinin de yardımıyla araştırmalarını, özellikle bilinmeyen biyosentetik dallanmalara sahip doğal ilaç moleküllerine odaklanarak (kanser önleyici etmenler ve aşı adjuvanları gibi) çok modlu analizlerine genişleteceklerini söyledi. Bu moleküllerin potansiyel kullanımlarını da araştırarak yeni ilaç buluşunu hızlandıracağını ve sentetik biyolojideki gelişmeleri daha iyi kavrayacaklarını belirtti.
Metnin orijinali:
https://techxplore.com/news/2023-12-biological-capabilities-large-language.html
Makale: https://arxiv.org/abs/2311.07582
Sözlük:
· Büyük Dil Modelleri(LLMs):
Doğal dil işleme(NLP) dilbilimi ve bilgisayar bilimini bir araya getirerek makinelerin insan dilini öğrenmesini, anlamasını, üretebilmesini ve insanlarla iletişim kurmasını sağlayan önemli bir yazılım biçimidir. Büyük dil modelleri edebiyat, kurgu, şiir ve araştırma gibi çeşitli dilbilimsel veri setleriyle eğitilerek dilsel yapıyı analiz eder ve doğal dili kullanmayı öğrenir.
· Prompt:
Promptlar, büyük dil modellerinden istenilen sonuca yönelik bilgiler ve yönlendirmeler içeren talimatlar girdisidir. İyi tasarlanmış promptlar özelleşmiş alanlarda, bu modellerin kapasitelerini ve hatta sofistike sorunları çözebilme edimlerini arttırabilir. Bu sebeple prompt mühendisliği de kullanıcı ve kullanılan dil modeli arasındaki verimi optimize etmede önemlidir.
· Derin Öğrenma Algoritmaları:
Derin öğrenme üç veya daha fazla katmanlı nöral ağlardan oluşan makine öğrenmesinin bir alt dalıdır. Bu nöral ağlar insan beyninin davranışlarını simule etmeye çalışır. Tek katmanlı nöral ağlar, iyi değerlendirmeler ve tahminler yürütebilirken, eklenen gizli katmanlarla daha rafine çalışarak doğru sonuç almayı optimize eder. Derin öğrenme, araçları otomatikleştirerek, analitik ve fiziksel güç gerektiren görevleri insanın dâhil olmasına gerek kalmadan gerçekleştirir. Bu teknoloji, dijital asistan, ses girdisine dayalı TV kontrolü, sürücüsüz araç kullanımı, kredi kartı dolandırıcılığının saptanması gibi çeşitli günlük eylemlerde de kendine yer bulabilmektedir.
· Nöral Ağlar Nedir?
Makine öğrenmesinin bir alt alanı ve derin öğrenmenin temeli olan nöral ağlar, biyolojik nöronların birbirine sinyal gönderme yöntemlerini baz alarak oluşturulmuş algoritmalardır. Boğum katmanlarından oluşan bu ağlar, girdi katmanı, bir ya da daha fazla gizli katman ve bir de çıktı katmanından oluşur. Bir diğerine bağlanan bu yapay nöronlar belirli bir ağırlığa ve eşik değere sahiptir. Eğer çıktı boğumu gereken eşik değerin üzerine çıkarsa, boğum aktive olur ve veriyi bir diğer katmana gönderir. Tersinin olduğu durumlarda, veri akışı kesilir.
Nöral ağlar, çok miktarda veriyle ve doğru sonuç odaklı eğitilirse, yüksek bir performansla verileri sınıflandırarak bilgisayar biliminde ve yapay zekada gelişmiş bir araç halini alır. Ses ve görsel tanımlamaları, uzmanalara kıyasla saatler yerine dakikalar içinde tamamlayabilen bu ağlardan en bilineni Google arama motorunun algoritmasıdır.
· Genel Yapay Zeka AĞI:
Prompt: Genel Yapay Zekâ nedir?
GPT-3.5’in yanıtı:
Genel Yapay Zekâ (AYZ), genellikle insan benzeri zeka yeteneklerine sahip bir yapay zeka türünü ifade eder. Bu, bir sistem veya entite için geniş bir zekâ yelpazesini içerir ve birçok farklı görevde insan benzeri zekâ düzeyine yakın performans gösterme yeteneğini içerir. Genel yapay zekâ, öğrenme, problem çözme, dil anlama, görüş, işitme, planlama ve diğer karmaşık zekâ görevlerini kapsar.
Narrow AI (Dar Yapay Zekâ) ile karşılaştırıldığında, genel yapay zekâ, sadece belirli bir görev veya alanla sınırlı olmayan, çok yönlü ve esnek bir zekâ sunmayı hedefler. Örneğin, dar yapay zekâ sistemleri genellikle belirli bir işlevi yerine getirir, örneğin, resim tanıma, dil çevirisi veya oyun oynama gibi, ancak genel yapay zekâ bir dizi farklı görevde başarılı olabilir.
Ancak, bu noktada, 2022’deki bilgi kesim tarihimde, genel yapay zekâ henüz gerçekleştirilmemiştir. Mevcut yapay zekâ sistemleri, genellikle belirli görevlerde çok iyi performans gösterirken, geniş bir zekâ yelpazesine sahip olma yeteneğine henüz ulaşamamıştır. AYZ’nin gerçekleştirilmesi, bir dizi zorlu teknik ve etik sorunu içermekte olup, bu alandaki araştırmalar devam etmektedir.
· Bilgi Damıtma (Knowledge distillation):
Bilgi damıtma yöntemi, veriyi büyük modellerden daha küçük modellere aktarma işlemidir.