Kayıtlar

Ekim, 2020 tarihine ait yayınlar gösteriliyor

Decision Tree (Karar Ağacı) Nedir ve Nasıl Çalışır

Resim
 Decision Tree (Karar Ağacı) böl ve fethet (divide and conquer) algoritmasını kullanan hiyerarşik bir veri yapısıdır. Hem sınıflandırma (classification) hem de regresyonda (regression) kullanılabilen etkili bir metoddur. Bu yazıda Decision Tree'nin nasıl çalıştığını ve bazı terimleri inceleyeceğiz. GİRİŞ Parametrik tahminlemede, bir modeli bütün data üzerine tanımlarız ve modelin parametreleri üzerinden öğrenmeye çalışırız. Daha sonra aynı modeli ve aynı parametereleri kullanarak test verisi üzerinde deneriz. Ancak parametrik olmayan (nonparametric) input uzayını belirli bölgelere ayırıp, daha sonra her bir input için bu bölgeleri kullanarak öğrenmeye çalışırız. Bir decision tree, bu bölgeleri bir dizi recursive ayırma yaparak bulmaya çalışan hiyerarşik bir yapıdır. Decision Tree içsel nodelardan oluşur. Bu her node belirli bir fonksiyon kullanarak belirli sonuçlar doğurur. Verilen her inputta, her node belli bir test uygular ve node   dallarından biri seçilir. Bu süreç tepede...

Cross Validation Nedir, Nasıl Çalışır ve Mantığı Nedir

Resim
 Makine Öğrenmesinde bazı durumlarda model verilen eğitim verisini (training data) çok iyi öğrenir ancak test için verilen veride ise kötü performans gösterebilir. Buna terimsel olarak aşırı uyma (overfitting) denir. Bu durum istenilen bir şey değildir. Bunun sebebi ise basitçe, bu modelin gerçek dünyadaki verilerle test edildiği zaman güzel performans vermesinin istenmesidir.  Peki bu durumu (overfitting) kaldırmak için neler yapılabilir, bugün onlardan birini göreceğiz.  CROSS VALIDATION    Üstte gösterilen şema kısaca makine öğrenmesinde eğitim nasıl olarak gerçekleştiğini gösteriyor.  parameters  modelin parametreleri olarak yer alır. Cross Validation'ı göreceğiz. Best Parameters modelin nasıl hangi parametreler ile en iyi performans vereceğini gösterir. Amacımız modelin en iyi çalıştığı parametreli bulmak. Böylece veriden en çok verimi alabiliriz. Peki bu Cross Validation nasıl çalışır. Varsayalım ki elimizde \(S\) eğitim verisi var. Diyelim ki el...

Tensorflow ile Türkçe Metin Sınıflandırma Nasıl Yapılır - Eksi Sozluk Örneği

Resim
Bu yazımızda Tensorflow ile nasıl metin sınıflandırma yapılır, ona bakacağız. Öncelikle metin sınıflandırma nedir ile başlayalım. Metin Sınıflandırma kısaca verilen metinleri istenilen kategorilere ayırmaktır. Metin sınıflandırmanın birden fazla örneği vardır.  İkili Metin Sınıflandırma (Binary) Bu tür metin sınıflandırmada verilen metinler iki ayrı kategoriye ayrılır. Örnek olarak, tweetlerin pozitif ya da negatif bir söylem içerdiğini bulmak.  Çoklu Metin Sınıflandırma (Multi-Class)  Bu tür metin sınıflandırmada ise istenilen kategoriler birden fazladır. Bu yazıda da verilen metinleri 5 ayrı sınıfa ayıracağız. Bu işlemleri yapabilmek için öncelikle elimizde etiketlenmiş bir veri olması gerekiyor. Ben "Web Scraping" metodu ile Ekşi Sözlükten 8000 adet veri çıkardım. Kaggle Sayfasından veriyi görebilirsiniz.  Buradan ise veriyi nasıl çektiğimi görebilirsiniz.  Şimdi kısaca yapmamız gerekenler Veriyi okumak ve temizlemek Tensorflow ile model oluşturmak Oluşturd...