Bu makalede, iki makine öğrenme (ML) tekniğini (spam filtreleri ve sinir ağları) inceledik ve bunların nasıl çalıştığını keşfediyoruz.
Ve eğer makine öğreniminin ne olduğundan emin değilseniz, yapay zeka, makine öğrenimi ve derin öğrenme arasındaki farkı okuyun .
Basit Bir Örnek: Naive Bayes Sınıflandırıcısı
Bir yaygın makine öğrenme algoritması, spam e-postalarını filtrelemek için kullanılan Naive Bayes sınıflandırıcıdır. Gelen kutunuzdan “Nijeryalı Prens Para Yardımına İhtiyaç Duyar!” Gibi mesajlar tutar. Peki nasıl işliyor?
“Spam Olarak İşaretle” düğmesini her tıkladığınızda, örnek spam e-postalarının devasa bir veritabanını güncelliyorsunuz. Bu bilgi ile bir bilgisayar programı çeşitli kelimeler veya cümleler hakkında istatistikler toplayabilir. Örneğin, spam e-postalarının% 25’inde “erkek geliştirme” ifadesinin bulunduğu veya% 30’unun “hızlı para” ifadesini içerdiği belirtilebilir.
Bu numaralarla, Naive Bayes sınıflandırıcısı artık gelen e-postaları meşru veya spam olarak işaretlemek için gereken tüm bilgilere sahip. Yeni bir mesaj aldığınızda, algoritma içindeki tüm kelimelere ilişkin istatistikleri arar. Daha sonra, bu istatistikleri, e-postaları spam olarak sınıflandırmak için bazı matematikle (özellikle, Bayes kuralı olarak bilinen bir olasılık gerçeği ile birleştirir) birleştirir . Bu kadar!
Elbette, bu algoritmaya giren sayı çarpıklığını örtüştürdük, ancak bu ML programının gerçek “öğrenme” süreci oldukça basittir. Sadece kelime / cümle ile ilgili istatistikleri güncelliyor (örneğin “Nijeryalı Prens” ibaresi bulunan e-postaların% 40’ı spam’tir). Bu programın işleyişi ile ilgili gizemli bir şey yok.
Karmaşık Bir Örnek: Sinir Ağları
Popülerlikle artan bir ML algoritması sinir ağlarıdır. Geçen yılın Temmuz ayında, Google , veri merkezi soğutma maliyetlerini % 40 oranında kesmek için sinir ağları kullandıklarını açıkladı . Maliyetleri düşürmek için, PUE (güç kullanım etkinliği), sunucu yükü, su pompası sayısı, soğutma kulesi sayısı ve diğer veri merkezi özellikleri gibi değişkenlere göre nasıl değiştiğini tahmin etmenin bir yoluna ihtiyaç duydu.
Google , otopark zorluğunu tahmin etmek için makine öğrenmeyi de kullanır ve bunlar makine öğrenmesinin birçok uygulamasından sadece ikisidir. Böyle bir hesaplama, bir mühendisin elle formüle etmesi için çok karmaşıktır, bu nedenle bir sinir ağı kullandılar.
Google’ın sinir ağları karmaşıktır, ancak bilmeniz gereken tek şey, veriler girerken güncellenen parametreleri içermesidir . Veri merkezi örneği bağlamındaki “Veri”, zaman içindeki farklı noktalardaki PUE seviyeleri, sunucu yükü, # su pompaları vb. Anlamına gelir. Bu parametreler titreştikçe sinir ağının PUE’yi doğru bir şekilde hesaplama kabiliyeti gelişir. Sonuç, bir insan mühendisinin neyi beceremediğini, veri merkezi soğutma konfigürasyonuna dayanan enerji verimliliğinin nasıl değiştiğini anlatan bir programdır.
Google, bu algoritmayı, maliyetlerin inanılmaz% 40 oranında azaltılması için kullandı. Özetle, Google’ın sinir ağı, veri merkezinin konfigürasyonuna dayalı olarak PUE’yi nasıl öngörür “öğrendi”. Ancak unutmayın ki bu “öğrenme” süreci esrarengiz bir şey değildi. PUE tahminlerini daha doğru yapmak için, sinir ağında parametreleri (yani gerçek sayıları) düzeltmek gerekiyordu.