Araştırmacılar, sağlık geçmişi, eğitim, iş ve gelir gibi yaşam olayları dizilerini kullanarak bir kişinin kişiliğinden ölüm oranına kadar her şeyi tahmin eden bir yapay zekâ aracı oluşturdular.
Çeviri: Suat Tatar
ChatGPT gibi büyük dil modellerine (LLM’ler) güç veren dönüştürücü modeller kullanılarak oluşturulan yeni araç life2vec, Danimarka nüfusunun tamamından (6 milyon kişi) alınan bir veri seti üzerinde eğitildi. Veri seti Danimarka hükümeti tarafından yalnızca araştırmacıların kullanımına sunuldu.
Araştırmacıların bu karmaşık veri setine dayanarak geliştirdikleri araç, bireylerin yaşam süreleri de dâhil olmak üzere geleceği, en gelişmiş modelleri aşan bir doğrulukla tahmin edebiliyor. Ancak tahmin gücüne rağmen, araştırmanın arkasındaki ekip, bunun kendi başına bir amaç değil, gelecekteki çalışmalar için bir temel olarak kullanılmasının en iyisi olduğunu söylüyor.
Northeastern Üniversitesi’nde bilgisayar bilimleri profesörü ve ilk Başkan Joseph E. Aoun Profesörü olan Tina Eliassi-Rad, “Bu modellerin ne kadar iyi olduğunu değerlendirmek için tahmin kullanıyor olsak da, bu araç gerçek insanlar üzerinde tahmin yapmak için kullanılmamalıdır” diyor. “Bu, belirli bir nüfusun belirli bir veri setine dayanan bir tahmin modelidir.”
Eliassi-Rad projeye yapay zekâ etiği uzmanlığını da kattı. “Bu araçlar toplumunuzu farklı bir şekilde görmenizi sağlıyor: Sahip olduğunuz politikalar, kurallar ve düzenlemeler” diyor ve ekliyor: “Bunu sahada neler olup bittiğinin bir taraması olarak düşünebilirsiniz.”
Ekip, sosyal bilimcileri bu aracı oluşturma sürecine dâhil ederek, yapay zekâ geliştirmeye insan merkezli bir yaklaşım getirmeyi ve araçlarının üzerinde eğitildiği devasa veri setindeki insanları gözden kaçırmamayı umuyor.
Nature Computational Science dergisinde kısa süre önce yayınlanan makalenin yazarı Sune Lehmann, “Bu model, insanoğlunun yaşadığı dünyayı diğer birçok modelden çok daha kapsamlı bir şekilde yansıtıyor” diyor. Konuyla ilgili bir Araştırma Brifingi de aynı dergi sayısında sunuldu.
life2vec’in merkezinde, araştırmacıların modellerini eğitmek için kullandıkları devasa veri seti yer alıyor. Veriler, Danimarka istatistiklerinin merkezi otoritesi olan Statistics Denmark tarafından tutuluyor ve sıkı bir şekilde düzenlenmiş olmasına rağmen, araştırmacılar da dâhil olmak üzere halkın bazı üyeleri tarafından erişilebiliyor. Bu kadar sıkı kontrol edilmesinin nedeni, her Danimarka vatandaşının ayrıntılı bir kaydını içermesidir.
Sağlık faktörlerinden eğitime ve gelire kadar bir yaşamı oluşturan pek çok olay ve unsur bu verilerde yer alıyor. Araştırmacılar bu verileri, LLM’leri dil üzerinde eğitmek için kullanılan dönüştürücü model yaklaşımını alıp bir dizi olay olarak temsil edilen bir insan yaşamına uyarlayarak modellerini beslemek için tekrar eden yaşam olaylarının uzun kalıplarını oluşturmak için kullandılar.
Danimarka Teknik Üniversitesi DTU Compute’ta ağlar ve karmaşıklık bilimi profesörü olan ve daha önce Northeastern’da doktora sonrası araştırmacı olarak çalışan Lehmann, “Bir insan hayatının tüm hikâyesi, bir bakıma, bir insanın başına gelebilecek birçok şeyin devasa uzun bir cümlesi olarak da düşünülebilir” diyor.
Model, milyonlarca yaşam olayı dizisini gözlemleyerek öğrendiği bilgileri, gelir, eğitim veya sağlık faktörleri gibi yaşam olaylarını kategorize etmeye ve bunlar arasında bağlantılar kurmaya başladığı gömme uzaylarında vektör temsilleri olarak adlandırılan şeyi oluşturmak için kullanıyor. Bu gömme uzayları, modelin sonunda yapacağı tahminler için bir temel oluşturuyor.
Araştırmacıların tahmin ettiği yaşam olaylarından biri, bir kişinin ölüm olasılığıydı.
Lehmann, “Modelin tahminlerde bulunmak için kullandığı alanı görselleştirdiğimizde, sizi düşük ölüm olasılığından yüksek ölüm olasılığına götüren uzun bir silindire benziyor” diyor. “Daha sonra, yüksek ölüm olasılığının olduğu yerde, bu insanların çoğunun gerçekten öldüğünü ve düşük ölüm olasılığının olduğu yerde, ölüm nedenlerinin araba kazaları gibi tahmin edemediğimiz bir şey olduğunu gösterebiliriz.”
Makalede ayrıca modelin, özellikle dışa dönüklük söz konusu olduğunda, standart bir kişilik anketine verilen bireysel yanıtları nasıl tahmin edebildiği de gösteriliyor.
Eliassi-Rad ve Lehmann, modelin son derece doğru tahminler yapmasına rağmen, bunların korelasyonlara, son derece spesifik kültürel ve toplumsal bağlamlara ve her veri setinde var olan önyargı türlerine dayandığını belirtiyor.
Eliassi-Rad, “Bu tür bir araç toplumun bir gözlemevi gibidir ve tüm toplumlar için geçerli değildir” diyor. “Bu çalışma Danimarka’da yapıldı ve Danimarka’nın kendi kültürü, kendi yasaları ve kendi toplumsal kuralları var. Bunun Amerika’da yapılıp yapılamayacağı farklı bir hikâye.”
Tüm bu uyarılar göz önüne alındığında, Eliassi-Rad ve Lehmann tahmin modellerini bir son üründen ziyade bir sohbetin başlangıcı olarak görüyor. Lehmann, büyük teknoloji şirketlerinin muhtemelen yıllardır kilitli odalarda bu tür tahmin algoritmaları oluşturduğunu söylüyor. Bu çalışmanın, bu araçların nasıl çalıştığı, neler yapabildikleri ve nasıl kullanılıp kullanılmamaları gerektiği konusunda daha açık ve kamuya açık bir anlayış yaratmaya başlayabileceğini umuyor.
Kaynak: https://phys.org/news/2023-12-ai-human-lifespan-good.html