Robotların çevreyle ve insanlarla olan etkileşimlerini artırmak ve onlara yeni şeyleri hızlıca öğretebilmek için özel eğitim programları oluşturuldu. RoboNet ve ImageNet bunlardan ikisi. Robotik öğrenme daha küçük çaplı ve tek robot üzerinden ilerlerken artık bu süreç çok daha sistematik ve hızlı olabilecek. Video ve görsellerden robotların eylemleri öğrenebilmesini sağlayan bu sistemler sayesinde birçok sektör çeşitli faydalar sağlayabilecek.
Günümüzde robot öğrenme, görsel ile öğrenme tekniklerine yenisini ekliyor ve robotlar artık izledikleri videolarla etraflarıyla etkileşim kurma yeteneklerini geliştiriyor. Robotik öğrenme, gerçek dünyanın karmaşasını azaltmada pek çok kişiye ve sektöre umut veriyor. Ancak bu konuda aşılması gereken yollar var. Robotların “eğitimi” sözkonusu olunca çok küçük ölçekli ve tek robot üzerinden giden bir süreç oluyor. Fakat bu da aşılmak üzere. ImageNet ve RoboNet sayesinde robotların eğitimi büyük ölçüde kolaylaşıyor. Fotoğraflarla öğreten ImageNet, videolarla öğreten RoboNet sayesinde robotlar çevreyle etkileşimi öğreniyor.
Princeton Üniversitesindeki araştırmacılar tarafından geliştirilen imaj veritabanı ImageNet pek çok robot üreticisinin ve geliştiricisinin dikkatini çekiyor. Yapay zekâ konusunda araştırmalar yapan Fei-Fei Li, 2006 yılında ImageNet fikri üzerine çalışmaya başladı. Çoğu yapay zekâ araştırmasının model ve algoritmalara odaklandığı bir zamanda Li, yapay zekâ algoritmalarını eğitmek için mevcut verileri geliştirmeye yöneldi. Yapay zekâ devriminin pek de bilinmeyen kahramanlarından olan ImageNet, adı az bilinen bir veritabanı ve her bir görüntünün ne gösterdiğini metinlerle açıklayan 14 milyon görüntü içeriyor. Pek çok yapay zekâ ağının kesiştiği bir veritabanı olduğu için de önemli. Burada veritabanlarının büyüklüğü de ayrı bir önem taşıyor. Sinir ağları ilgili görüntü ve metinlere bakarak öğrendiği için kaynak ne kadar geniş olursa buna paralel olarak öğrenme de o kadar çok ve iyi oluyor. Görsel veriler ImageNet için olmazsa olmaz, zira bu setler olmadıkça hiçbir şey tanıyamıyor. ImageNet’te, aralarında balon veya çilek gibi kelimelerin olduğu, yüzlerce görüntüden oluşan 20 binden fazla kategori bulunuyor.
ImageNet’ten bahsederken WordNet’e değinmemek olmaz. 1980’lerin sonunda ortaya çıkan projede İngilizce kelimeler hiyerarşik bir şekilde sıralanıyordu. Başta kulağa sözlük gibi gelse de, WordNet’te kelimelerin diğer kelimelerle olan ilişkisi ve bağı da yer alıyordu. Buna bir tür kategorileme de denebilir. Örneğin köpek kelimesi, köpek ailesi ve memeli gibi başlıkların altında yer alıyordu. Bu şekilde makine tarafından okunabilen ve 155 binden fazla kelimenin endekslendiği bir sistem yaratıldı. ImageNet de WordNet hiyerarşisine göre düzenlenmiş bir resim veri kümesi. WordNet’te birden fazla kelime veya kelime öbekleriyle tanımlanmış her anlamlı konsepte “synset” deniyor ve 80 binden fazlası isim olmak üzere 100 binden fazla synset bulunuyor. ImageNet de, her bir synset için ortalama 1000 görüntü sağlamayı hedefliyor.
Robotik öğrenmede kabiliyet geliştirme ve ilerleme, örneklerin fazla olmasına dayanıyor. Bunun için geliştirilmiş olan sinir ağları, daha iyi tahmin yapmak için işlenen görüntüyü ve yazıyı tekrar ve benzer örneklerle karşılaştırıp iyileştiriyor. Derin öğrenme işlemlerinde sinir ağları önemli rol oynuyor. Sinir ağları diğer öğrenim modellerinde olduğu gibi sistemin isabetli tahmin yapabilmesi için çalışan arılara benziyor. Sinir ağlarının başarılı çalışabilmesi, yapılmak istenen harekette uzmanlaşabilmeleriyle ölçülüyor . Örneğin bir bardağı masanın üstünde ileri itebilmek gibi... Ağlar, beslenebildikleri veritabanlarıyla pratiklerini artırırken daha hatasız olmaya başlıyorlar.
Kaliforniya Üniversitesinden Sudeep Dasari ve ekip arkadaşlarının RoboNet adını verdikleri veritabanı, görsel veritabanlarında olduğu gibi notlarla ne olup bittiğini anlatan videolardan oluşuyor. Bu eğitim video örneklerini izleyen robotlar da videoda gerçekleşen hareketi öğrenebiliyor. Sudeep Dasari ve ekibi üzerinde çalıştıkları RoboNet ile tüm robotlara herhangi bir görevi başarıyla öğretebilmeyi hayal ediyor. Adeta bir robot okulu, üniversitesi gibi... Veritabanından bir video indirip kendi robotuna bu hareketleri yaptırmak isteyen biri, robotu daha önce masada bir bardak itmemiş olsa bile bunu ona öğretebiliyor. Bu yöntem aslında ImageNet’in de kullandığı standart öğretim metotlarından birisi. Fakat işlemler bir hareketi öğretmek bile olsa çok sayıda video örneği izletmeyi gerektiriyor. Bu videolarda da birçok farklı açı, konum, hatta ışıklandırma kullanılıyor. Videolar ne kadar detaylı ve çeşitliyse, öğrenme de o kadar etkili oluyor.
RoboNet ile ilgili yapılan çalışmalarda uzmanlar, öğrenilen algoritmaların yeni nesneler, yeni görevler, yeni alanlar, yeni kamera bakış açıları, yeni tutucular ve hatta tamamen yeni robotlar üzerinde çalışma yeteneğini test ediyor. 113 kamera açısından alınan 15 milyondan fazla robot nesne etkileşimi içeren video karesinin yer aldığı RoboNet’te yedi farklı robot platformundan veri toplanıyor. Düşük bütçeli robotlardan endüstriyel tasarımlara kadar farklı türlerle çalışmalar yapılarak ön eğitim veriliyor. Yapılan son deneyde Franka ya da Kuka gibi robotların RoboNet üzerinden aldığı eğitim ve bunlardan elde edilen verinin düzenlemesi yapıldı. Robot türüne özel performans deneylerinde geçmişe göre 4 ila 20 kat daha fazla veri kullanılabildi.
ImageNet ve Robonet gibi çalışmalar, çok çeşitli ortamlarda ve farklı donanımlarda çalışabilen robotları oluşturma yolunda ilk adımı atıyor. Bu robotların da çeşitli alanlarda kullanılması planlanıyor. Sağlıktan eğitime, turizmden orduya kadar pek çok sektörde bu robotları görebileceğiz.
Buna bir örnek de ABD ordusundan geliyor. Talimatları takip edebilen robotlar üzerinde çalışan ordu mensupları, uzun zamandır sürekli denetim gerektirmeyen emirleri takip edebilen akıllı robot ekip arkadaşları istiyordu. Ordunun araştırma laboratuvarı, robotların sözlü talimatları anlamalarını, görevlerini yerine getirmelerini ve raporlamalarını sağlayan bir yazılım geliştirdi. Komutları anlayabilen ve makine zekâsına sahip robotların yapabilecekleri ise sınırsız. Örneğin robotlar birliklerin önüne geçip mayınları veya pusuları kontrol edebilecek. Böylece hem daha tehlikeli işleri robotlar üstlenebilecek hem de daha az asker ile daha çok iş yapılabilecek. Ekip, robotların çevrelerindeki dünyayı anlamalarına yardımcı olmak için karma bir yaklaşım kullandı. Derin öğrenme, görüntü tanımada özellikle öne çıkıyor, bu nedenle fotoğraflardaki nesneleri tanımak için Google’ın kullandığına benzer algoritmalarla robotların binaları, bitki örtüsünü, araçları ve insanları tanımlamasına olanak sağlanıyor.
Savunmada kullanılan bir başka robot ise RoMan, yani Robotik Manipülatör’ün kısaltması. Robotik kolları ve elleri sayesinde askeri araçların yolunda bulunan ağır cisimleri ve diğer yol kalıntılarını kolayca tanıyıp yolu temizleyen bir robot. 10 yıllık bir çalışma sonucunda ortaya çıkan RoMan’a bir yolu temizlemesi görevi verildiğinde, robotun potansiyel olarak alakalı nesneleri tanımlaması, nerede ve hangi el şekliyle nesnelerin nasıl kavranabileceğini bulması ve hangi tür bir etkileşimi kullanacağına; kaldırma, itme, hareket ettirme gibi hareketlerin olup olmayacağına karar vermesi gerekiyor. Yapılan son çalışmalarda RoMan, birçok cismi içeren enkaz temizliği, ağaç dalı gibi ağır bir cismi sürükleme ve torbayı çıkarmak için bir konteyner açma gibi eylemleri başarıyla tamamladı. Uzmanlar, bu alandaki robot kullanımını özellikle tehlikeli görevlerde insan yerine geçebilecek askerler olmaları amacıyla planlıyor.
Robot, bir nesneyi tanımlamak için derin öğrenmeyi kullandığında, emirlerini yerine getirmesine yardımcı olan daha ayrıntılı bilgileri almak için bir bilgi tabanından faydalanıyor. Örneğin bir objeyi araba olarak tanımladığında bu kelimeyle bağlantılı olan tekerler, motor gibi diğer kelimelere de ulaşıyor. Eğer otonom robotlar karmaşık gerçek dünya ortamlarıyla başa çıkabiliyorsa, insanlarla birlikte çalışabiliyorsa ve sözlü talimatlar alıyorsa, endüstriden ve tarımdan iç cepheye kadar sayısız alanda kullanılabilirler. Öte yandan, bu robotların askeri alanda kullanılmasıyla ilgili şüpheler de var. Kritik görevleri olan bir robotun hack’lenmesi ihtimali de bunlardan biri.