“Machine Learning” yani “Makine öğrenimi” son zamanlarda adını sıkça duyduğumuz terimler arasına girmiş durumda. Teknolojinin ilerlemesiyle gelişen makine, robot sektöründe çok önemli olan “Makine öğrenimi” kavramı en zor basamaklardan biridir. Bu yazımızda makine öğreniminin ne olduğunu, günümüz ve gelecekteki durumunu inceleyeceğiz.
Makine öğrenimi; Bilgisayar biliminin yapay zekada sayısal öğrenme ve model tanıma çalışmalarından geliştirilmiş bir alt daldır. Yapısal işlev olarak öğrenebilen ve veriler üzerinden tahmin yapabilen algoritmaların çalışma ve inşalarını araştıran bir sistemdir. Bu tür algoritmalar statik program talimatlarını harfiyen takip etmek yerine örnek girişlerden veri tabanlı tahminleri ve kararları gerçekleştirebilmek amacıyla bir model inşa ederek çalışırlar.
Makine öğrenimi araştırmalarının odaklandığı konu bilgisayarlara karmaşık örüntüleri algılama ve veriye dayalı akılcı kararlar verebilme becerisi kazandırmaktır. Bu, makine öğreniminin istatistik, olasılık kuramı, veri madenciliği, örüntü tanıma, yapay zekâ, uyarlamalı denetim ve kuramsal bilgisayar bilimi gibi alanlarla yakından ilintili olduğunu göstermektedir. Makine öğrenimi, sistemin açık programlamayla değil, verilerden öğrenmesini sağlayan bir yapay zeka biçimidir. Ancak, makine öğrenimi basit bir süreç değildir. Eğitim verileri algoritmalar tarafından alınır; daha sonra bu veriler temel alınarak daha doğru modeller üretilebilir. Makine öğrenimi algoritmanızı verilerle eğittiğinizde bir makine öğrenimi modeli ortaya çıkar. Eğitim sürecinden sonra, bir modele bir girdi sağladığınızda, size bir çıktı sunulur. Örneğin, tahmine dayalı bir algoritma tahmine dayalı bir model oluşturur. Ardından, tahmine dayalı modele veriler sağladığınızda modeli eğiten verilere dayalı bir tahmin alırsınız.
Günümüzde bazı alışveriş sitelerinde daha önce aldığınız ürünlere benzer ürünlerin size örnek olarak gösterilmesinden tutun da Netflix’in daha önce izlediğiniz dizi ve filmler ile kıyaslama yaparak size önerimde bulunması makine öğrenimine güzel bir örnek. Veri madenciliği makine öğreniminin vazgeçilmez bir unsuru aslında. Daha önce Facebook aracılığı ile Cambridge Analytica şirketinin veri madenciliği yaparak özellikle Amerika seçimlerini nasıl manipüle ettiğini bilmeyen yoktur. Bu zaten apayrı bir tartışma ve uzunca anlatılması gereken bir konu. Devam edelim… 🙂
Makine öğrenimi yaklaşımları arasında;
- Gözetimli Öğrenme
- Gözetimsiz Öğrenme
- Pekiştirmeli Öğrenme
- Derin Öğrenme
Bu dört öğrenim biçimini daha sonra ayrıntılı ve örnekleriyle açıklayacağım.
Makine Öğrenimi (Machine Learning) Nasıl Çalışır?
Makine öğrenimi algoritmaları genellikle denetlenen veya denetlenmeyen olarak kategorize edilir. Algılanan algoritmalar, algoritma eğitimi sırasında tahminlerin doğruluğu hakkında geri bildirim sağlamanın yanı sıra, hem girdi hem de istenen çıktıyı sağlamak için makine öğrenim becerileri ile bir veri bilimcisi veya veri analisti gerektirir. Veri bilimcileri, modelin hangi değişkenleri veya özellikleri analiz edeceğini ve tahminleri geliştirmek için kullanacağını belirler. Eğitim tamamlandığında, algoritma öğrenilenleri yeni verilere uygulayacaktır.
Denetlenmeyen algoritmaların istenen sonuç verileriyle eğitilmesi gerekmez. Bunun yerine, verileri gözden geçirmek ve sonuçlara varmak için derin öğrenme denen yinelemeli bir yaklaşım kullanırlar. Denetimsiz öğrenme algoritmaları (aynı zamanda sinir ağları olarak da adlandırılır) görüntü tanıma, konuşma-metin ve doğal dil üretimi de dâhil olmak üzere denetimli öğrenme sistemlerinden daha karmaşık işlem görevleri için kullanılır. Bu sinir ağları, milyonlarca eğitim verisi örneğini tarayarak ve birçok değişken arasında sıklıkla ince korelasyonları otomatik olarak tespit ederek çalışır. Eğitildikten sonra, algoritma yeni verileri yorumlamak için veri bankasını kullanabilir. Bu algoritmalar, büyük miktarlarda eğitim verisi gerektirdiğinden, büyük veri çağında ancak uygulanabilir hale gelmiştir.
Basit bir örnekleme yapacak olursak; Boy-kilo ve ayakkabı numarasını yazdığımız erkek ve kadın eşleşmelerini python aracılığı ile tahmin edelim.
from sklearn import tree #[Öğrenme kütüphanemiz]
clf = tree.DecisionTreeClassifier()
#[boy, kilo, ayakkabı numarası] #[ilk girdimiz]
X = [[181, 80, 44], [177, 70, 43], [160, 60, 38], [154, 54, 37], [166, 65, 40], [190, 90, 47], [175, 64, 39],
[177, 70, 40], [159, 55, 37], [171, 75, 42], [181, 85, 43]]
Y = ['erkek', 'erkek', 'kadın', 'kadın', 'erkek', 'erkek', 'kadın', 'kadın', 'kadın', 'erkek', 'erkek']#[ikinci girdimiz]
clf = clf.fit(X, Y)
tahmin = clf.predict([[190, 70, 43]])#[tahmin etmesini istediğimiz birey]
print (tahmin)
Burada boyunu 1.90, kilosunu 70, ayakkabı numarasını ise 43 olarak girdiğimiz bireyin tahmin çıkması erkek olacaktır.
Makine öğrenimini iş gereksinimlerine uygulama
Makine öğrenimi, büyük veriden yararlanmaya çalışan şirketlere potansiyel değer sunar ve davranış, tercihler ya da müşteri memnuniyetindeki küçük değişiklikleri daha iyi anlamalarına yardımcı olur. İş liderleri, kuruluşlarında birçok şeyin gerçekleştiğini ve sektörlerin bir sorguyla anlaşılamayacağını fark etmeye başlıyor. Bunlar sizin bildiğiniz sorular değil; bunlar verilerde gizlenen ve size yardımcı olabilecek veya zarar verebilecek olan kalıplar ve anormalliklerdir.
Makine Öğreniminin Geleceği
Makine öğrenimi algoritmaları onlarca yıl boyunca sürerken, yapay zekâ (AI) ön plana çıktıkça yeni yeni popülariteye eriştiler. Makine öğrenim platformları, Amazon, Google, Microsoft, IBM ve diğerleri de dâhil olmak üzere çoğu büyük satıcı ile veri toplama, veri hazırlama da dâhil olmak üzere makine öğrenimi etkinliklerinin yelpazesini kapsayan platform hizmetlerini imzalamak için yarışan kurumsal teknolojinin en rekabetçi firmalarıdır.
Derin öğrenmeye devam eden araştırmalar ve AI, giderek daha genel uygulamalar geliştirmeye odaklanmaktadır. Bugünün AI modelleri, bir görevi yerine getirmek için son derece optimize edilmiş bir algoritma üretmek içinkapsamlı bir eğitim gerektirir. Ancak araştırmacılar modelleri daha esnek hale getirmenin ve bir görevden öğrenilen bağlamı geleceğe, farklı görevlere uygulayabilmenin yollarını araştırmaya devam etmektedirler.
Yararlandığım kaynaklar: ibm.com, proente.com