Ekibin lideri olan Türk bilim insanı Prof. Dr. Aydoğan Özcan’a, yaptıkları çalışmanın performans ve enerji kullanımı açısından hangi yenilikleri getirdiğini sorduk.
Emrah Maraşo
GazeteBilim Genel Yayın Yönetmeni
ABD’deki UCLA’den bir grup bilim insanı, geliştirdikleri yapay zekâ görüntü üreticisiyle önemli bir atılıma imza attı.
Bu çalışma klasik modellerden farklı bir şekilde çalışıyor. Ekibin lideri olan Türk bilim insanı Prof. Dr. Aydoğan Özcan’a, yaptıkları çalışmanın performans ve enerji kullanımı açısından hangi yenilikleri getirdiğini sorduk. Prof. Dr. Özcan, şunları söyledi:
“Elimizdeki yapay zekâ görüntü üreticisi, klasik sayısal difüzyon modellerinden farklı olarak ‘hibrit’ bir mimari kullanıyor: Sığ ve hızlı bir dijital enkoder, rastgele gürültüyü faz desenlerine çevirerek ‘optik üretim tohumları’ oluşturuyor; bu tohumlar, serbest-uzayda çok katmanlı ve sabit bir kırınımsal (diffraktif) bir dekoder tarafından tek atımda görüntülere dönüştürülüyor.
“U-Net tabanlı difüzyonlarda binlerce adım gerekirken, bizde üretim, ışığın birkaç diffraktif katmandan geçişiyle sabit zamanlı (snapshot) gerçekleşir. Optik alan doğal olarak tüm pikselleri aynı anda işler; dalga boyu çoklama ile birden fazla görüntü veya kanal eşzamanlı üretilebilir (wavelength-multiplexing).”
Prof. Özcan liderliğindeki ekibin geliştirdiği yeni yapay zekâ görüntü üreticisi sürdürülebilirlik, enerji tasarrufu ve hız bakımından da dikkat çekici bir performans sergiliyor. Prof. Dr. Özcan, geliştirdikleri modelin hangi alanlarda kullanılacağı hakkında da şunları belirtiyor:
“Üretim tohumları optik faz alanında temsil edildiği için güvenlik ve mahremiyet açısından da donanım-bağlı (diffractive decoder-based) bir iz bırakır. Bu teknoloji, yaratıcı medya, oyun ve AR/VR uygulamalarinda donanım-bağlı, yüksek hızlı içerik üretimi ve telifsiz ‘benzersiz iz’ (hardware fingerprint) avantajıyla yeni içerik üretim hatları ve güvenli içerik damgalama çözümleri için kullanılabilir.”
Yeni model, ortaya koyduğu çerçeveyi deneysel sonuçlara da yansıttı. Buna göre el yazısıyla yazılmış rakamlar, moda ürünleri, kelebekler, insan yüzleri ve van Gogh’tan esinlenilmiş sanat eserlerinin görüntüleri başarılı bir şekilde üretildi.
Yeni model, muazzam bir şekilde enerji tüketen yapay zekâ görüntü üretici araçlarına karşı güçlü bir sürdürülebilir alternatif sunuyor.
Çalışmanın diğer yazarları arasında Dr. Shiqi Chen, Yuhang Li, Yuntian Wang, Hanlong Chen bulunuyor.

