Kendisine gösterilen veri üzerinden çıkarımlar yaparak kompleks öğrenme işlemlerini gerçekleştirebilen uygulamalar, son yıllarda hızla yaygınlaştı. Ses ve görüntü tanıma, diller arasında otomatik tercüme, akıllı ticari öneriler sunma gibi yeni nesil uygulamalarda gelinen noktanın ardında yapay öğrenme algoritmalarının rolü azımsanamayacak ölçüdedir. Bu uygulamalarda kullanılan modeller sınıflandırıcı olarak adlandırılır. Sınıflandırıcılar, kendilerine sunulan etiketli veri üzerinde çalışarak, verinin istatistiksel özelliklerini modeller ve böylece gelecekte karşısına çıkacak yeni örnekleri etiketleyebilmeyi amaçlar.Kendisine gösterilen veri üzerinden çıkarımlar yaparak kompleks öğrenme işlemlerini gerçekleştirebilen uygulamalar, son yıllarda hızla yaygınlaştı. Ses ve görüntü tanıma, diller arasında otomatik tercüme, akıllı ticari öneriler sunma gibi yeni nesil uygulamalarda gelinen noktanın ardında yapay öğrenme algoritmalarının rolü azımsanamayacak ölçüdedir. Bu uygulamalarda kullanılan modeller sınıflandırıcı olarak adlandırılır. Sınıflandırıcılar, kendilerine sunulan etiketli veri üzerinde çalışarak, verinin istatistiksel özelliklerini modeller ve böylece gelecekte karşısına çıkacak yeni örnekleri etiketleyebilmeyi amaçlar.
Veriye ait özelliklerin (örneğin bir insanın öz nitelikleri; cinsiyet, yaş, boy, kilo vb.) standart bir vektör olarak temsil edildiği düşünüldüğünde, modellerin yaptığı işlem, bu öz niteliklerin farklı etiketlerle ilişkisini tespit etmek olarak tanımlanabilir. Örneğin kadın/erkek sınıflandırmasını yapan bir model, farklı kilo/boy aralıklarını, kadınları ve erkekleri temsil edecek şekilde ayırmayı amaçlayacaktır. Bu öz nitelik uzayını sınıflara ayırma çabası, sınıflandırıcılara ismini veren işlemdir.
Çalışma mekanizmasının en iyi örneklerinden biri e-posta filtreleridir. Filtreler, önceden etiketlenmiş spam e-postalarını öğrenerek sonraki e-postaların sınıfına karar verir. Matematiksel olarak bu model, eğitimini, “Herhangi bir e-postanın spam sınıfına ait olma olasılığı nedir?” sorusunu cevaplayabilecek şekilde tamamlar.
Peki bu işlemi tersine çevirmek istersek ne yapmalıyız? Diğer bir deyişle, model eğitiminde kullanılan veriyi üreten mekanizmayı elde edebilir miyiz? İşte bu soru, günümüzün en heyecan verici yapay zekâ uygulamalarının bel kemiğini oluşturan Generative Modeller’in (GM) tam da sahneye çıktığı noktadır.
GM, kendini veriyi üretebilecek şekilde eğitmeyi amaçlar. Yani, başarıyla eğitilmiş bir GM, daha önce gördüğü resimlerden esinlenen; ama özgün resimler yapabilen, müzik besteleyebilen, metinler kaleme alabilen algoritmalardır. Bugün GM’ler sayesinde, Van Gogh stilinde resimler çizmekte ustalaşmış, daha önce yazılmamış Shakespeare metinleri kaleme alabilen makinelerle karşılaşmak hiç de şaşırtıcı değildir.
Bütün bu ileri seviye uygulamalar hakkında konuşmak oldukça keyifli olmakla beraber, GM’lerin çok ciddi matematiksel çaba gerektirdiğini düşünebilirsiniz. Oysa, sadece zekice bir mimari kullanarak bunları başarmak mümkündür: birbirleriyle kavga eden yapay sinir ağları ile!
GM gibi bir fikri hayata geçirebilmek için, en az kendisi kadar ilginç bir mimariye ihtiyaç duymamız hiç de şaşırtıcı değildir. Derin Öğrenme konusunun önemli isimlerinden Ian Goodfellow’un tasarladığı Generative Adversarial Networks (GAN), 2014 yılında tam da bu amaçla geliştirildi. GAN modeli, içerisinde birbirleriyle rekabet halindeki iki farklı yapay sinir ağını barındırır. Bunlardan ilki, “generator” olarak adlandırılmaktadır ve tek amacı, kendisine gösterilen gerçek eğitim setini taklit etmeye çalışmaktır. Bu taklit etme işlemi, aslında verinin gerçek dağılımını öğrenmekten başka birşey değildir ve yukarıda bahsettiğimiz GM mantığına eş değerdir. Generator her aşamada bir miktar “sahte” veri sentezler ve bu sahte veriler, gerçekleriyle birlikte “discriminator” isimli ikinci sinir ağına gönderilir. Discriminator seviyesinde amaç basittir: Kendisine girdi olan verilerin hangilerinin gerçek, hangilerinin sentetik olduğunu tespit edebilmek. Örneğin e-posta filtresinin, e-posta içeriğini spam olup olmadığına göre sınıflandırma çalışmasına benzer şekilde, discriminator sinir ağı, kendisine gelen verinin ne kadar gerçek ne kadar sahte olduğunu öğrenir. Generator, eğitimin başında oldukça başarısız veriler yaratır çünkü eğitim setini öğrenecek zamanı bulamamıştır. Bu başarısız sahte verileri, gerçeklerinden ayırt etmek oldukça kolaydır ve discriminator bu işi kısa sürede başarıyla tamamlar. Fakat, generator ve discriminator birbirlerine sıkıca bağlıdır ve generator, ürettiği verilerle discriminator’ü kandıramadıkça, kendini daha gerçekçi veriler sentezlemek üzere eğitmeye zorlar. Böylece, sentetik verilerin gerçekçilikleri gittikçe artar. Bütün bu işlem şu şekilde özetlenebilir:
Artık elimizdeki sınırlı bir veri setini kullanarak, verinin kaynağını anlamayı ve böylece daha önce hiç karşımıza çıkmayan veriler yaratmayı başarabiliyoruz. Bunun, düşünen ve üreten bilgisayarlara giden yolun çok önemli bir noktası olduğunu düşünüyorsanız haksız sayılmazsınız. Fakat, yolun çok başındayız ve henüz insanımsı robotların gezegenimizi istila etmeleri beklentisine girmek için biraz erken.
Günümüz araştırmacıları bu teknolojiyi barışçıl amaçlar için kullanmaktalar. Özgün sanat eserleri ortaya koymak, eksik kalmış ya da hasar görmüş resimleri tamamlamak, besteler yapmak gibi yetenekleri olan uygulamalar sıkça karşımıza çıkmakta. Daha yaratıcı yaklaşımlar da yavaş yavaş gün yüzüne çıkmaya başladı. Örneğin, GAN’ları kendisine verilen bir metne uygun resim çıkartacak şekilde eğitmek, böylece metinleri görüntüye çevirmek artık mümkün hale gelmiş durumda. Bu sayede, hem çocuklar hem de özel ihtiyaçları olan bireylerin, metinleri görsel olarak tecrübe edebilmeleri sağlanabilmektedir.
GAN’ların fonksiyonları sadece resim üretmekle sınırlı değildir. Insilico Medicine isimli ilaç şirketinde araştırmacılar, bu modelleri belirli hastalıklara karşı yeni ilaçlar üretmek için kullanmayı başardılar. Burada resimler yerine, farklı ilaç yapıları eğitim seti olarak kullanılmış, böylece GAN’ların ilaç olarak kullanılabilecek kimyasal formülasyonları üretmesi sağlanmıştır. Aynı enstitüde, Generative Autoencoder gibi benzer bir yöntem kullanılarak, kanser tedavisinde kullanılabilecek moleküler yapılar tespit edilebilmiştir.
Şüphesiz, bilgisayarların artan hesaplama gücü ve bu modellerin matematiksel davranışlarını daha iyi anlamasıyla birlikte, gelecekte bu üretici modellerin uygulamalarıyla çok daha fazla karşılaşacağız.