Bilgisayarlar, makine öğrenimi sayesinde yüz tanıma ve tıbbi tarama yapıp algılama gibi şeyleri kolaylıkla yapmaya başladı. Bu noktada iş videoları ve gerçek dünyadaki olayları yorumlamaya gelince, bilgisayarların makine öğrenimini mümkün kılan modeller zor ve zahmetli bir hal alabiliyor. Ancak MIT-IBM Watson Lab’den bir ekip, bu konu için bir çözüme sahip olduklarını belirtiyor.
Bu yöntem, video tanıma modellerinin boyutunu azaltırken eğitimi daha hızlı bir hale getiriyor ve mobil cihazlardaki performansı artırıyor. Bu teknoloji için yeni bir modül tasarlayan araştırmacılar, yeni teknolojiyi testlere de tabi tuttu. Testlere göre yöntem, derinlemesine öğrenme ve yapay zekâ destekli video tanımayı mevcut yöntemlerden üç kat daha hızlı bir şekilde eğitebildi.
Facebook ve YouTube’daki şiddet içerikli videolar tespit edilebilecek:
‘Temporal shift module’ adı verilen yöntemin, video tanıma modellerinin mobil cihazlardaki işleyişini kolaylaştıracağı iddia ediliyor. Yeni metot hakkında açıklamalarda bulunan ve bir MIT profesörü olan Song Han, “Amacımız, yapay zekâyı düşük güçlü bir cihazda herkes için erişilebilir hale getirmek. Bunu yapmak içinse daha az enerji kullanan daha verimli bir yapay zekâ ve çok fazla yapay zekânın yer aldığı uç cihazlarda sorunsuz çalışabilen bir model tasarlamamız gerekiyor” açıklamalarında bulundu.
Aynı zamanda bu metot, eğitim için gereken hesaplama gücünü azaltarak yapay zekânın karbon ayak izini azaltmayı da hedefliyor. Bu doğrultuda çalışması amaçlanan sistem, Facebook ve YouTube gibi platformlarda şiddet içerikli veya terörist görüntülerinin yer aldığı videoların tespit etmesine de yardımcı olabilir ve hastane gibi tıbbi kurumların bulutta değil, yerel olarak yapay zekâ uygulamalarını çalıştırmalarına olanak sağlayabilir.
Araştırmacılar, nesnelerin ve videoların daha hızlı taranmasına ve tanınmasına yardımcı olacak bu sisteme dair çalışmalarını bu ayın sonunda düzenlenecek olan Uluslararası Bilgisayarla Görü Konferansı’nda kamuoyuyla paylaşacaklar.