Nicholo Machiavelli, siyaset biliminin eskimeyen eseri Prens adlı kitabında “Olması gerekenle olan arasındaki uçurum o kadar derindir ki, olması gerekenle ilgilenen ancak başına bela açmayı öğrenir” demektedir. Olması gereken ile olan arasındaki soyut uçurum, karar modelleri ile tahmin modelleri arasında da vardır. Karar modelleri “olması gereken” ya da “olmasına karar verilen” olguları ilgilendirirken, tahmin modelleri, olanı anlamaya çalışmaktadır. Her ikisinin de birer model olması ve matematiksel benzerlikleri nedeniyle karar modelleri ile tahmin modelleri zaman zaman birbirleri yerine kullanılmakta ve bu durum karışıklık yaratabilmektedir. Çalışma şekillerinin benzerliği, aslında amaçları ve sonuçları bakımından farklı olan bu iki tür modelin yanlış yorumlanmasına neden olabilir. Her birinin kısa bir tanımından sonra neden birbirleri yerine kullanılmaması gerektiği ifade edilecektir.
Bir karar modeli, birden fazla alternatifin söz konusu olduğu durumda rasyonel kararın verilebilmesi için kullanılan yöntemi ifade eder. Burada rasyonel terimi, karar vericilerin ellerindeki alternatifleri değerlendirirken göz önüne aldıkları parametreleri ifade etmektedir. Örneğin, bir barajın inşa edileceği yerin seçimi probleminde karar vericiler ellerindeki alternatifleri “yaratılan istihdam”, “enerji tüketim merkezlerine yakınlık” ve “inşaat maliyeti” gibi üç parametreye (ya da kritere) göre değerlendirmekte ise, verilecek kararın rasyonel hali bu üç parametrenin mümkün olduğunca en fazla istenen yönde sağlanmasını temin eden alternatifin seçimine yardımcı olur. Eğer herhangi bir ağırlıklandırma söz konusu ise bu durumda yine bu parametreleri ağırlıklarına göre optimize edecek alternatif seçilmiş olacaktır. Bu durumda “çevreye zarar” gibi azaltılması gereken bir parametre eğer karar vericiler tarafından göz önünde bulundurulmamış ise seçilen alternatifin bu durumda rasyonel olmadığı söylenmeyecektir. Burada karar modeli olması gereken ile ilgilenmektedir. Bu ise doğası gereği öznel bir tanım olarak karar vericilerin düşüncelerini ortaya koyacaktır.
Daha somut bir örnek verilecek olursa bir insan kaynakları veritabanı üzerinde kurulmuş olan karar modeli, kendisine tanıtılmış modeldeki aday profilinde yer alması gereken özelliklere göre seçim yapacaktır. Eğer bu model tecrübe lehine eğitimi göz ardı ediyorsa bu durumda birkaç dil bilen kalifiye bir aday daha tecrübeliler arasında elenecektir. Karar modelleri karar vericilerin görüşlerinden etkilenmektedir. Öyle ki Fransızca bilen bir tarih öğretmeni ile tarih bilen bir Fransızca öğretmeni aynı kişi olmayabilir.
Promethee, AHP, Electre, Vikor, Leksikografik karar kuralı, EBA gibi birçok farklı karar modeli mevcuttur. Bu modellerin her biri farklı matematiksel model ve varsayımlara sahiptir. Yukarıda örnek verilen her bir karar problemi için bu modeller tatbik edilebilir. Karar modellerinin gücü ve işlevi rasyonellik koşulları adı verilen bazı mantıksal koşullara bağlıdır. Bir örnek vermek gerekirse, H kuralı, karar modelinin bir kümede -diyelim ki dünya çapında- seçtiği en iyi alternatifi alt kümede -mesela Türkiye’de- en iyi alternatif olarak seçmesi gerekliliği kuralıdır. Bu kuralı ihlal eden bir karar modelinin bu mantıksal koşulu temin etmediği bilinir.
Bir tahmin modeli ise, eldeki verilere göre herhangi başka bir parametrenin tahmin edilmeye çalışıldığı modellerdir. Kişinin eğitimi, tecrübesi, branşı gibi bilgilere göre maaşını öngörmeye çalışan bir model tahmin modelidir. Tahmin modelleri de matematiksel ve istatistiksel ilkelere göre işlevlerini icra etmektedirler. Tahmin modelleri için en büyük sınanma bu modellerin tahmin ettikleri değerlerle (olması gereken/beklenen) gerçekte olan değerler arasındaki farklardır. Bu farklar ne kadar az ise modelin tahmin gücü o kadar yüksek olmaktadır.
Veri bilimi çalışmalarındaki ilerlemeler tam olarak ortaya çıkmadan önce tahmin modelleriyle ilgili yapılan en temel istatistiksel hata, bir veri setinde tahmin gücü yüksek bir model ortaya çıkarıldığında ona hemen özel bir değer atfetmek ve onu yorumlamaktı. Makine öğrenmesi modelleri ile ilgili ve deneyim geliştikçe veri setlerinin ikiye ya da daha fazla parçaya ayrılarak bir kısmının modelin eğitilmesi bir kısmının da test edilmesi için kullanımı bir standart haline gelmiştir. Bu standart kuşkusuz veri setinin hem modeli ortaya çıkarmak hem de eğitmek için kullanılmasından daha sağlıklıdır. Daha sonra “shuffling” adı verilen bir metotla eldeki veri setini rastgele ikiye bölmek yerine art arda tesadüfi bölme yapıp her denemede modelin gücünü test ederek sonuçların ortalamasını almak gibi daha güvenli yollar ortaya çıkmıştır.
Makine öğrenmesi modelleri denildiğinde kNN, NaiveBayes, Deep Neural Network, Convolutional Neural Network gibi mistik kavramlar akla gelse de makine öğrenmesi modelleri de özünde tahmin modelleridir. Hatta çok değişkenli regresyon da bir makine öğrenmesi modelidir. Makine öğrenmesi modellerinin gücü ve çalışma şekli derin öğrenme eşiğine kadar neredeyse tamamen geleneksel istatistikle açıklanabilirken, derin öğrenme ve sonraki modeller anlaşılması güç algoritmalardan meydana gelmektedir. Bu nedenle bazı modeller “blackbox (kara kutu)” olarak adlandırılmaktadır.
Bir tahmin modeli ile bir karar modeli işin sonunda bir çıktı değeri veya değerler seti sağlamaktadır. Bu noktada her ikisinin de yaptığı iş aynı kabul edilebilir. Hatta çok değişkenli regresyon gibi modeller hem karar modeli hem de tahmin modeli olarak kullanılabilmektedir. Ancak ilkinde çıkan sonuç karar vericilerin iradesinin ağırlıklı toplamıdır ve ağırlıklar karar vericiler tarafından belirlenmektedir. Bir tahmin modelinde ise çıkan sonuç bir tahmindir ve ağırlıklar daha önce gerçek gözlemleri elde etmeye yönelik en yakın sonuçları sağlayacak şekilde bir nevi tersine mühendislik kullanıp MSE veya RMSE değerleri ya da Gradient Descent metodu ile hesaplanır (Regresyon örneğinde). Tahmin modellerinde bağımsız değişkenlerin çarpılacağı ağırlıkları ortaya çıkarmak bir çaba iken ürün tahminlerdir. Karar modelinde ise ağırlıkları ortaya çıkarmaktan ziyade belirlemek söz konusudur ve bu ne kadar işe yaradığı genellikle ölçülmeyen görece daha kolay bir süreçtir. Ancak karar modelleri de genellikle kompleks hesaplamalar barındırmaktadır.
Bir model kurulması gündemde ise bunun ne tür bir model olacağına, yani karar mı yoksa tahmin modeli mi olacağına karar verilmelidir. Bu durum çıkacak sonuçlara dair sağlıklı bir açıklamanın yapılmasını sağlar.
Model tasarım kararları ya da toplantıları ile modelin gerçeğe dönüşmesi arasındaki uçurum için en yerinde söz, “evdeki hesabın çarşıya uymadığıdır”. Örneğin akademisyenlerin alacağı atıf sayısını öngörmeye çalışan bir modeli tasarlarken akademisyenlerin yaşının etken bir faktör olduğunu değerlendirilerek modele katmaya karar verilebilir ancak bu değerleri elle derlemek söz konusu olduğunda (böyle bir veri seti bulunmadığı varsayımı ile) modele insan eli değmekte ve ek külfet ortaya çıkmaktadır.
Modelin her girdisi için şu soru sorulmalıdır: Veri var mı ya da bu veri “scraping” gibi yollarla kolayca elde edilebilir mi? Eğer bir girdi ile ilgili veri “scrape” edilecek kaynak bunu aleni veya zımni olarak engelliyor ise bu durumda o girdiyi bir şekilde tek sefere mahsus olarak toplayarak modele dahil etmek bir akademik çalışma olabilir ancak otomatize edilmesi büyük ihtimalle olası değildir.
Makine öğrenmesi modelleri kullanılan modele göre genellikle “veriye aç” modellerdir. Örneğin el yazısı rakamları tanımak için kullanılacak bir algoritma 60.000 kadar gözleme ve 724 parametreye ihtiyaç duyar. Bu miktar, algoritmanın kabul edilebilir bir doğruluk içinde tahmin yapabilmesi için elzemdir. Bu nedenle makine öğrenmesi modelleri planlanırken verinin temini imkânları daha önceden değerlendirilmelidir.
Web scraping ile veriyi indirmek aynı şey değildir. Örneğin TÜİK web sayfasından indirdiğimiz bir veri için tek tıklama ya da tek satır bir “url fetch” kodu yeterli iken web scraping’de günün sonunda elde edeceğiniz tablodaki her satırın değil her hücrenin içeriği için aynı domain altında bile olsa farklı bir web sayfasına gider; o sayıdaki ilgili bilgiyi HTML kollarından (her sayfanın kod tasarımı başkadır) ayırır, ayrıca sayfalama, “infinite loading” gibi zorlayıcı alt kırılımları da düşünerek kod yazmak icap eder. Bu kodlar bir kere yapıldığında süreç bitmez. Kodun çalışıp her bir sayfayı tek tek dolaşması için çekilmek istenen veri miktarı arttıkça süreç uzar. Bu nedenle web scraping için harcanacak emeğin “modelin iyiliğine” katkısı her zaman sorgulanmalı, sadece işe yarayacağından emin olunan veri setleri modele dahil edilmelidir.
Milyonlarca veri ve birçok farklı parametreye göre sonuç üreteceği planlanan modelin, sonuç ele geçtiğinde ne yapılacağı sorgulanmalıdır. Veriden üretilecek sonuç ile verinin çokluğu arasındaki ilişki gül yağı üretimine benzetilebilir. Gülyağı üretiminde tonlarca yaprak damıtılarak birkaç gram gülyağı elde edilmektedir. Gülyağının katma değeri, harcanan gül toplama, damıtma ve kârı karşılamaktadır. Aynı soruyu modeli ile elde edilecek sonuçların (gülyağı metaforu) istekleri karşılama gücüne ve maliyetine deyip demeyeceği incelenmelidir. Eğer elde edilmesi planlanan sonuç ile modelin hazırlanması ve çalışması için harcanan efor dengelenmelidir.