Overfitting (Aşırı Uyum)

Overfitting Nedir?

Makine öğrenimi dünyasında, bir modelin eğitim verisinde son derece iyi performans göstermesi ancak yeni, görülmemiş verilerde kötü performans sergilemesi durumu, aşırı uyum veya overfitting olarak bilinir. Overfitting, modelin eğitim setine o kadar iyi uyum sağlamasıdır ki, eğitim verisindeki gürültüleri ve rastgeleliği de öğrenir. Bu durumda, model eğitim verisindeki örüntüleri olağanüstü bir şekilde yakalar, ancak bu öğrendiği bilgiler genelleştirilemeyen, çok spesifik ve eğitim setine özgü olgulardır. Sonuçta model, eğitim verisi dışında kalan yeni verilerle karşılaştığında yetersiz performans sergiler çünkü yeni verilerde mevcut olan genel geçer örüntüleri yakalayamaz.

Bu durumu daha iyi anlamak için bir örnek verelim: Bir sınıflandırma modeli geliştirdiğimizi ve modelin el yazısı rakamlarını tanımayı öğrendiğini varsayalım. Model, eğitilirken rakamların iyi tanımlanmış örneklerini öğrenir ve eğitim süreci boyunca gittikçe daha doğru tahminler yapar. Bu noktada, model eğitim setindeki her bir rakamın tüm detaylarını öğrenmiş olabilir, hatta belki de her bir rakamın belirli bir yazım stilindeki küçük farklılıklarını da belleğine kaydetmiş olabilir. Ancak, yeni bir el yazısı rakamı ile karşılaştığında, spesifik detayları bilmediği için bu rakamı doğru şekilde tanımlayamayabilir. İşte bu, overfitting’in somut bir örneğidir.

Overfitting’in önüne geçmek için çeşitli teknikler kullanılabilir. Bunlardan biri erken durdurma (early stopping) yöntemidir. Erken durdurma, modelin eğitim süreci sırasında doğrulama veri seti üzerindeki performansı izlenerek, performansın düşmeye başladığı noktada eğitimin durdurulmasıdır. Bir başka yaygın yöntem ise düzenlileştirme (regularization) olarak bilinir. Düzenlileştirme, modelin karmaşıklığını kontrol altına alarak aşırı uyumu engeller ve genellikle L1 veya L2 düzenlileştirme olarak adlandırılan teknikler kullanılarak gerçekleştirilir. Ayrıca, modelin eğitim verisini artırmak, çeşitli veri genişletme teknikleri (data augmentation) ile eğitim veri setini genişletmek de etkili bir yaklaşımdır. Bu tür önlemler, modelin eğitim seti üzerinde gereksiz yere uzmanlaşmasının önüne geçer ve genel veriler üzerinde daha yüksek performans göstermesini sağlar.

Overfitting