Dijital Biz Dergisi | Yazar

 

Dr. Erol ÖZGÜNER

 

Temmuz 2021

 

 

Nedir Makine Öğrenmesi Dedikleri?

 

Corona’nın hayatlarımızı evlerimize kilitlediği, yaşam alışkanlıklarımızı kökünden değiştirdiği, hayatın birçok noktada artık eskisi gibi olamayacağı ama yavaş yavaşta bu yeni duruma insanlık olarak alıştığımız, aşı etkisiyle süreci minimize ettiğimiz zorlu bir dönemi hep birlikte yaşıyoruz. Aslında bu kapanma dönemi, insanların kendi kişisel yetkinliklerine, bilgi ve birikimlerine de çok fazla yatırım yapma şansı buldukları bir dönem oldu. Her zamankinden daha fazla okundu, izlendi, üzerinde çalışıldı.

Dünyanın bu zor dönemine baktığımızda teknolojinin ve teknoloji dünyasının krizin aksine büyüme gösterdiğini, her zamankinden daha önemli hale geldiğini ve teknoloji yatırımlarının artarak devam ettiğini görüyoruz.

Startup firmaları, girişimciler, yatırımcılar, öğrenciler, akademisyenler, bu yükselen trendin önemli aktörleri oldular, olmaya da devam edecekler. Teknolojik gelişimler kapanmanın etkisiyle inanılmaz bir kuluçka evresi geçirdi, şimdi ise kuluçkadan çıkma ve hayat geçme zamanı.

Bu gözle baktığımız zaman, yapay zekâ, makine öğrenmesi, derin öğrenme, büyük veri, açık veri, veri analitiği, IT güvenliği, oyunlaştırma, PaaS (Platform as a Service), SaaS (Software as a Service) vb. uygulamaların giderek artan bir önem kazandığını, bacasız sanayinin Turizm değil, Teknoloji olduğunu çok çarpıcı bir şekilde gördük.

Bu uzun girişten sonra, yukarıdaki paragrafa da konu olan Makine Öğrenmesi (Machine Learning – ML) konusunda birkaç sayılık bir yazı dizisi hazırlamayı uygun gördüm. Amacım, ML ile ilgili detaylı teknoloji bilgisi vermek değil, ML’in iş dünyasında kullanımı niye gerekmektedir, kullanım alanları nelerdir gibi, daha farklı açılardan düşüncelerimi paylaşmaktır.

O zaman başlayalım, işimiz veri, işimiz verinin toplanması, tekilleştirilmesi, etiketlenmesi, gruplandırılması ve anlamlandırılmasıdır. Bu noktadan, insan zekâsından farkı olmayan bir durum ortaya çıkmaktadır. İncelenecek verilere baktığınızda orada bazı gruplamalar, bazı modeller elde etmeye çalışırsınız. Aslında ML, tüm bu işlemlerin yapılıp, geçmiş data üzerinden modeller elde ederek, çok büyük doğruluk oranlarıyla verilerin anlamlandırılması ve karar destek olarak sunulmasını sağlamaktadır. Facebook’un yüz ve resim tanıma algoritmaları, Alexa, Siri, Cortana ve Google Asistant söylediklerimizi tanımak ve anlamak ve nasıl cevap verilebileceğini karar vermek için ML’i kullanmaktadırlar. Amazon ve Netflix hangi filmleri bize önereceği konusunda, Uber hangi aracın ne zaman çağırdığımız yere geleceği konusundaki hesaplamalarda, PayPal vb. dijital ödeme sistemleri, dolandırıcılık tespitlerine yönelik işlemlerde, Apple yüz tanıma ile telefonunuzun birçok işleminde ML’i kullanmaktadırlar.

ML’i dünyaya yeni gelen bir çocuğun yaşam evrelerinde insan, hayvan, bitki, sıcak-soğuk, mutlu-mutsuz vb. tanımları öğrenmesi gibi veri setlerini ayırarak modellemek gibi düşünebilirsiniz. Sonuçta ML de insanın tekrarlayarak öğrenme stratejisini takip etmektedir. ML’de temel olarak 2 aşama vardır;

  • Veri setlerini modelleyerek ÖĞRENMEK
  • Yeni veya olası veri setlerine uygulanarak TAHMİNLEMEK

Şu basit örnekle anlatımız zenginleştirelim. Elimizde bir veri seti var;

2*3=36

6*1=36

2*2=16

Yukarıdaki veri setinden kolaylıkla x*y = (x.y)2 ifadesini elde edebileceğimizi bulabiliriz. Bu ifadeye de veri modelimiz diyoruz. O zaman çok genel tanımlar veri setleri ve veri modeli tanımlarında anlaştığımızı düşünüyorum. Unutulmaması gereken kural, öğrenme aşamasındaki modeliniz ne kadar doğru olursa, çıkarım veya tahminleme aşamasındaki sonuçlarınız o kadar doğru olacaktır. Modelinizi belirledikten sonrası olası tüm girdiler için bir sonuç elde etmeniz mümkündür.

Veriler her zaman karşımıza rakamsal değerlerle gelmeyecektir, bu sebeple doğru etiketleme de gruplama, anlamlandırma ve model geliştirme için çok önemlidir. Veri setleri ad soyad, medeni durum, ehliyet tipi gibi etiketlemeler yapılabilmektedir. Ama bazen de etiketlenmemiş verileri kullanmamız gerekmektedir. Verilerle ilgili diğer önemli bir konu ise elimizdeki veri miktarıdır. Ne kadar çok verimiz olursa o kadar doğru bir model kurgulayabilir ve o kadar doğru çıkarımlar yapabiliriz.

Peki veri türleri nelerdir? Sensörlerden elde edilen veriler, yazılı sözlü veriler ve işlem (transaction) verileri olmak üzere 3 tür veri tanımı yapabiliriz. Burada Path AI’ın beyin tümörü ve kanser tanılarının konulmasını kolaylaştırmak için patologların kullanımına sunulan ML ürününü görüntü işleme teknolojisi ve ML’in ideal kullanım örneklerinden birisi olarak verebiliriz.

Bu aylık bu kadar, biraz merak uyandırmaya çalışarak ML’e giriş yaptık, bir daha ki ay, biraz regresyon, biraz sınıflandırma, biraz sinir ağları, öğrenme modelleri ve Airbus Dijital dönüşüm sorumlusu Matthew Evans’tan ML ile ilgili çarpıcı anekdotlar anlatacağım. Küçük bir ipucu, bir A320 bir uçuş sırasında 24.000’den fazla sensörden veri topluyor, bunları nasıl işledikleri ve ML’i nasıl kullandıklarını hikayesi de oldukça güzel.

Sağlığınızın yerinde olduğu, güzel bir yaz geçirmeniz dileği ile…