2021’in ve belki de pandemi ile geçen son 2.5 yılın en önemli filmlerinden Matrix 4, Aralık sonunda izleyici ile buluştu. Sinema tarihinde insan ve makine arasındaki “mücadelenin” en önemli örneklerinden biri ama tek değil. Terminatör başta olmak üzere insanların yarattıkları akıllı makinaların kendi başlarına hareket ederek insanlığı yok etme çabaları on yıllardır eskimeyen bir konu. Her ne kadar Hollywood milyarlarca kez izlenmiş filmlerde makine ve insan ilişkisinin karanlık tarafına odaklansa da Alan Touring, 2. Dünya savaşı sırasında Enigma şifresini çözen makinayı şekillendirip 1 milyona yakın insanın ölmesini engellediğinde makine ve insan ilişkisinin temelinde barış vardı. Aslında her şey Touring’in 1950 yılında yayınladığı “computing machinery and intelligence” isimli makalenin ilk cümlesinde saklı diyebiliriz:
“ ’Makineler düşünebilir mi?’ sorusunu göz önüne almayı öneriyorum…”
Aynı makalenin 7.bölümünde makine öğrenmesi üzerine ilgili dönemin sınırlarını zorlayan bir açıklamayı bulmak mümkün ama biz bugünün gerçeğinde makine öğrenmesi nedir basitçe açıklayarak başlayalım.
Makine öğrenmesi (machine learning, ML), bir bilgisayarın ne yapacağına karar vermesi noktasında insanların net komutlarına ihtiyaç duymaksızın öğrenmesine yardımcı olacak matematiksel modellerin kullanımıdır diyebiliriz.
Başka bir deyişle makine öğrenmesini, insanların nasıl öğrendiğinden yola çıkan, verilerdeki kalıpları algoritmalar ile şekillendiren ve böylece tahmin yapabilen veri modeli oluşturan, yapay zekanın bir alt kümesi olarak konumlandırabiliriz.
Özetle veri ile deneyim kazanıp bunu kullanabilen makinalardan bahsediyoruz. Aslında tecrübe olarak adlandırdığımız bu durum insan beyni söz konusu olduğunda dışarıdan herhangi bir talimat almadan öğrenebilmek demektir. Uzun süre belirli bir ürünün ticaretini yaparsanız bir süre sonra o ürüne dair talep nasıl değişiyor, gelen müşteri o ürünü ister mi gibi ticari tahminlemeleri kolayca yapabilir. Bugün yapay zekanın gelmeye çalıştığı nokta tam da budur diyebiliriz. Tek farkla, makineler bizim gibi öğrenmezler…
Literatürde farklı şekilde isimlendirilse de genel olarak ML yöntemleri danışmanlı ya da denetimli (supervised), danışmansız ya da denetimsiz (unsupervised) ve yarı danışmanlı ya da takviyeli (semi-supervised) öğrenme olarak 3 ana başlık altında toplanabilir.
Aklımıza basit bir fonksiyon getirelim örneğin f(x)=y olsun. Buradaki girdi (x; bağımsız) değişkenlerin, çıktı (y; bağımlı) değişkenlerine eşleme amacını öğrenmek için etiketlenmiş veriler eğitim için kullanılır. Etiketlenmiş veriler bir öğretmen olarak görev yapar ve makineye tahminleme veya karar verme yeteneğini öğretiler.
Yukarıdaki akıştan da anlaşılacağı üzere burada da her bir verinin hangi kategoriye dahil olduğu (etiketlendiği) bilindiğinde danışmanlı öğrenme işlevseldir.
Denetimli öğrenme, sınıflama ve regresyon olarak iki gruba ayrılabilir.
Az önceki basit fonksiyonu hatırlayalım. Denetimli öğrenmede her bir x değeri için bir y değeri mevcuttu. Denetimsiz öğrenmede y değeri yoktur ve elimizde sadece x değerleri bulunur. Diğer bir deyişle, yalnızca girdinin olduğu ve bunun karşılığında çıktısının bilinmediği durumlara özgü öğrenme yöntemidir. Yani öğrenme sürecine destek verecek bir veri seti yoktur. Dolayısıyla veri setleri etiketlenmez, kümeler halinde gruplandırılarak kalıplar ve ilişkiler oluşturulmaya çalışılır.
Danışmansız öğrenmede amaç, verinin işaret ettiği yapıyı veya dağılımı modelleyerek veri hakkında daha fazla bilgi edinmektir.
Danışmansız Öğrenme, kümeleme ve birliktelik olarak iki gruba ayrılabilir.
Hibrit öğrenme modelidir diyebiliriz. Danışmanlı ve danışmansız öğrenme yöntemlerinin ikisini de içerir. Yine basit formülümüze dönecek olursak, x girdileri ve y çıktılarından sadece bazılarının etiketinin bilindiği durumlarda kullanılır.
Yarı danışmanlı öğrenme modeli oldukça pratik ve kıyasla ekonomik bir metod olarak karşımıza çıkar. Unutmayalım ki her bir veriyi etiketlemek başlı başına bir maliyettir ve her zaman da mümkün değildir. Etiketsiz verilerdeki öğrenmenin etkinliği de durumsallık gösterdiğinden, takviyeli öğrenme yaklaşımları, hibrit yaklaşımı ile en çok tercih edilen modellerdir.
Tüm bu öğrenme modellerini sıralarken spesifik olarak derin öğrenme nedir sorusuna cevap vermemiş olmamız onun makine öğrenmesi dışında bir kavram olduğu anlamına gelmez. Biraz isminden biraz da karmaşık yapısından ötürü öne çıkan derin öğrenme de makine öğrenmesi türlerinden biridir.
En basit tanımı ile derin öğrenme (deep learning) neural networks yani yapay sinir ağları üzerine kurgulanmış bir makine öğrenmesi alt kümesidir diyebiliriz. Yapay sinir ağlarının en temel özelliklerinden biri, çoklu girdi ve çıktıya sahip katmanlardan oluşmalarıdır.
Derin öğrenme, yukarıda bahsedilen çoklu doğrusal olmayan karmaşık işlemler katmanından oluşur. Her bir katman bir öncekinin çıktısını bir girdi olarak kabul eder. Buradaki her katmanı oluşturan işlemler denetimli veya denetimsiz algoritmalar olabilirler.
Derin öğrenmede, verilerin birden fazla özellik seviyesinin veya temsillerinin öğrenilmesine dayanan bir yapı söz konusudur. Üst düzey özellikler, alt düzey özelliklerden türetilerek hiyerarşik bir temsil oluşturur. Bu temsil, soyutlamanın farklı seviyelerine karşılık gelen birden çok temsil seviyesini öğrenmektedir . Derin öğrenme temel olarak verinin temsilinden öğrenmeye dayalıdır. Bir görüntü için temsil denildiğinde; piksel başına yoğunluk değerlerinin bir vektörü veya kenar kümeleri, özel şekiller gibi özellikler düşünülebilir. Bu özelliklerin içinden bazıları veriyi daha iyi temsil etmektedir. Bu aşamada yine bir avantaj olarak, derin öğrenme yöntemleri, elle çıkarılan özellikler (handcrafted features) yerine veriyi en iyi temsil eden hiyerarşik özellik çıkarımı için etkin algoritmalar kullanmaktadır .
Yapay zeka, makine öğrenmesi ve derin öğrenme arasındaki ilişki aslında oldukça nettir. Yapay zeka en büyük küme olarak insan zekasına benzemeyi amaçlayan yöntemler bütünüdür. Makine öğrenmesi benzerlik için gerekenlerden biridir ve derin öğrenme de makine öğrenmesinin karmaşık bir alt kümesidir.
Dolayısıyla bir hiyerarşi içinde dizilmiş kavramlardan bahsediyoruz. Birbirinden bağımsız olarak düşünemeyeceğimiz, farklılıkları olmakla beraber aralarındaki bağın
Makine öğrenmesi ve derin öğrenme farkını belirli alt başlıklar üzerinden incelemek daha açıklayıcı olacaktır.
Öncelikle donanım ihtiyaçlarından başlayalım. ML yüksek hesaplama ihtiyaçları duymayabilirken, DL tarafında güçlü makineler üzerinde çalışmak gerekliliği bulunmaktadır.
Bunun en önemli sebeplerinden biri, ML, DL ile kıyaslandığında tahminleme için çok daha küçük miktarda eğitim veri setleri üzerinde çalışması imkanı diyebiliriz.
ML öğrenme sürecini küçük parçalara bölerek yönetebilir, sonrasında da tamamını tek bir bütün içinde birleştirebilir. DL tarafında parça parça ilerlemek değil bütünsel ilerleme esastır.
O yüzden eğitim süresi ML’de DL ile kıyaslandığında çok daha kısa sürebilmektedir.
Tüm bunların sonunda ML çıktıları daha puan veya sınıflandırma gibi sayısal bir değer olurken DL’de çıktılar metin, puan veya ses gibi birden çok formda olabilir.
Özetle, her ne kadar derin öğrenme makine öğrenmenin bir alt kümesi olsa da yukarıda belirttiğimiz gibi belirgin farklar ayrıştırmaya imkan vermektedir.
Makine öğrenmesi uygulamaları günümüzde farklı sektör ve projelerde sıkılıkla kullanılmaktadır.
Bugün, kişiselleştirilmiş sağlık risk faktörlerini tahmin etmek için ML kullanılıyor. DL ile çok daha karmaşık olan MR görüntülerinden yola çıkarak olası kanser durumunu uzman hekimlere gerek duymaksızın teşhis edebilmekte.
Pazarlama da makine öğrenmeden önemli fayda sağlayabiliyor. Örneğin, e-posta veya sosyal medya mesajlarından duygu analizi yapılabiliyor. Derin öğrenme ile bir adım ileri giderek sadece metin üzerinden değil, multimedya (resim ve video) üzerinden de benzer hatta gerçek zamanlı duygu analizleri yapılabiliyor. Bunun neticesi olarak markalar müşteri duygu durumuna göre gerçek zamanlı içerik seçimi hatta öneri sunmayı başarabiliyorlar.
Bir başka pazarlama kullanım alanı da dinamik fiyatlama. Özellikle yoğun talep olan dönemlerde uçak fiyatlarının neredeyse anlık değişiminin arkasında rekabet, talep ve fırsat verilerinden öğrenen makineler var.
Belki de en çok kullanılan alanlardan biri trafik yoğunluğu ve optimal rota belirlenmesi. Hemen hemen her gün şehir trafiğinde en az zaman kaybederek ilerleyebilmemizi makine öğrenmesi algoritmalarına borçluyuz.
Son olarak yakın bir gelecekte otonom araçların ve insansız trafik deneyiminin mükemmel hale gelmesinin arkasında hiç şüphesiz makine ve derin öğrenme kaldıracını olacağını unutmayalım.
Farklı bir açıdan yaklaşıldığında, Gartner araştırmalarına göre, şirketlerin yapay zeka yatırımlarında tetikleyici rol oynayan en önemli üç etken müşteri deneyimini iyileştirmek (%59), maliyetleri azaltmak (%54) ve gelir artışı sağlamak (%43) olarak göze çarpıyor.
Makine öğrenme önümüzdeki dönemde dijital dönüşüm ve sürdürülebilir iş yapış biçimlerinin ayrılmaz bir parçası olacak. Bu noktada Etiya’nın gelişmiş makine öğrenme servisleri şirketlere geniş bir yelpazede faydalar sunuyor.
Etiya makine öğrenme servisleri sektörel ve kurumsal olarak deneyimin zenginleştirilmesi ve yatırımın geri dönüşüne katkılar sunmaktadır. Etiya standardize edilmiş, merkezi, anlaşılabilir iş yapış biçimlerinin güçlendirilmesi ve bunun başta müşteriler olmak üzere gelir ve verimliliğe olumlu etkiler sağlamaktadır. Kolay entegrasyon ve operasyonel destekler, teknoloji ekipleri açısından kolaylık yaratırken, Etiya makine öğrenme servisleri hakkında danışmanlık hizmetleri ile gerek ticari gerekse de teknoloji ekiplerinin makine öğrenme servislerinden azami faydayı sağlayacak katkılar sunulmaktadır.
Son olarak Alan Touring’in 62 yıl önce yayınladığı makale ilginizi çekiyorsa 9 yıl sonra Erzurum Halk Konferansı’nda Ord. Prof. Dr. Cahit Arf’ın yayımladığı “Makine Düşünebilir mi ve Nasıl Düşünebilir?” makalesini de okumanızı tavsiye ediyoruz.