Otomatik Makine Öğrenmesi (AutoML) ile Model Geliştirme Süreçlerinin Optimizasyonu
Otomatik Makine Öğrenmesi (AutoML) ile Model Geliştirme Süreçlerinin Optimizasyonu
Eğitim Hakkında
Bu yoğunlaştırılmış ve stratejik program, makine öğrenmesi projelerinin en zaman alıcı ve uzmanlık gerektiren adımlarını (veri ön işleme, özellik mühendisliği, model seçimi ve hiperparametre optimizasyonu) otomatize etme bilimi ve sanatına odaklanır. Katılımcılar, geleneksel model geliştirme süreçlerini haftalardan saatlere indiren AutoML felsefesini ve bu felsefeyi hayata geçiren en güncel açık kaynaklı kütüphaneler ile bulut platformlarını uygulamalı olarak öğreneceklerdir. Program, AutoML'i bir "sihirli kara kutu" olarak değil, Otomatik Makine Öğrenmesi (AutoML), bir veri setinden en iyi performansı gösterecek makine öğrenmesi boru hattını (pipeline) otomatik olarak keşfeden ve oluşturan sistemler bütünüdür.
Ön Koşul
Bu eğitimin herhangi bir ön koşulu yoktur.
Eğitim İçeriği
- Zaman ve maliyet: İteratif denemelerin ve manuel optimizasyonun yüksek maliyeti.
- Uzmanlık ihtiyacı: "Algoritma hayvanat bahçesi" içinde doğru modeli seçme zorluğu.
- Tekrarlanabilirlik ve yanlılık sorunları.
- AutoML nedir ve ne değildir? (Sihirli bir değnek mi, güçlü bir araç mı?)
- AutoML'in kapsadığı adımlar: Veri ön işleme (Auto-Preprocess), özellik mühendisliği (Auto-FE), model seçimi (NAS) ve hiperparametre optimizasyonu (HPO).
- AutoML'in çözmeye çalıştığı temel matematiksel problemin tanımı.
- Bayesian Optimizasyon: AutoML'in en popüler motorlarından birinin çalışma mantığı.
- Genetik Programlama: TPOT'un arkasındaki "en uygun pipeline'ın evrimi" fikri.
- Meta-Learning: Geçmişteki benzer veri setlerinden öğrenerek, yeni bir problem için en iyi başlangıç noktalarını belirleme (Auto-Sklearn).
- Ensemble ve Stacking Teknikleri: Performansı maksimize etmek için en iyi modelleri otomatik olarak birleştirme.
- Scikit-learn ekosistemiyle tam entegrasyon.
- Zaman ve bellek bütçesi belirleyerek optimizasyonu çalıştırma.
- Sonuçların (model toplulukları ve performansları) analizi.
- TPOT'un genetik programlama yaklaşımının farkı.
- Atölye: Bir veri seti üzerinde TPOT'u çalıştırma ve en iyi performansı veren ML pipeline'ının Python kodunu otomatik olarak üretme. Bu, şeffaflık ve öğrenme için paha biçilmezdir.
- Küçük ve orta ölçekli veri setlerinde hız ve verimlilik odaklı yaklaşımının incelenmesi.
- Adım adım arayüz üzerinden bir sınıflandırma projesi: Veri setini yükleme, hedef değişkeni seçme, eğitim bütçesini (compute hours) belirleme.
- AutoML'in ürettiği model "leaderboard"unu yorumlama: Farklı modellerin metriklerini (AUC, LogLoss vb.) karşılaştırma.
- Özellik önemliliği (feature importance) ve model açıklanabilirlik raporlarını inceleme.
- En iyi modeli tek tıkla bir API endpoint'i olarak "deploy" etme.
- Arayüz, yetenek ve fiyatlandırma açısından temel farklılıkların karşılaştırılması.
- AutoML'in kötü veya anlaşılmamış veriyi sihirli bir şekilde düzeltmeyeceği gerçeği.
- Yüksek derecede özel (custom) model mimarisi gerektiren problemler.
- Derinlemesine nedensel çıkarım (causal inference) gerektiren analizler.
- Modelin her bir adımının tam olarak açıklanmasının yasal bir zorunluluk olduğu durumlar.
- Algoritma seçiciden, problem formülasyonu uzmanına, özellik mühendisliği sanatçısına ve sonuçların stratejik yorumcusuna dönüşüm.
- Bu modül, bir yarışma formatında, zaman baskısı altında bir proje çalışmasıdır.
- Senaryo: "Yeni bir müşteri veri seti geldi. Yönetim, 24 saat içinde bu veriden müşteri kaybını (churn) tahmin edecek en iyi temel (baseline) modelin prototipini istiyor."
- Görev:
- Katılımcıların gruplara ayrılarak, seçtikleri bir açık kaynak veya bulut AutoML aracıyla problemi çözmesi.
- Süreç sonunda, sadece elde ettikleri en iyi skoru değil, aynı zamanda AutoML aracının keşfettiği en iyi pipeline'ı, en önemli özellikleri ve sürecin ne kadar sürdüğünü sunmaları.
- Tartışma: Bir insanın aynı sürede bu sonuca ulaşıp ulaşamayacağı ve AutoML'nin hangi adımlarda en çok zaman kazandırdığı.
- Hangi projelerin AutoML için uygun olduğunu belirleme.
- "Vatandaş Veri Bilimci" (Citizen Data Scientist) programları oluşturma ve bu programlarda AutoML'i bir yetkinlik aracı olarak kullanma.
Kazanımlar
Hızlandırılmış Değer Elde Etme: Manuel olarak haftalar veya aylar sürebilecek model seçimi ve optimizasyon sürecini saatlere veya günlere indirerek, fikir aşamasından üretime geçiş süresini radikal bir şekilde kısaltır.
Yapay Zekanın Demokratikleşmesi: Derin algoritma bilgisi gerektirmeden, alanında uzman profesyonellerin kendi analitik modellerini güvenle oluşturabilmelerini sağlar, böylece yapay zeka yetkinliğini tüm kuruma yayar.
Performans Artışı ve Keşif: Bir insanın gözden kaçırabileceği binlerce farklı algoritma ve hiperparametre kombinasyonunu sistematik olarak deneyerek, genellikle manuel olarak ulaşılandan daha yüksek performanslı modeller keşfeder.
Uzman Verimliliğinde Sıçrama: Kıdemli veri bilimcileri, en yorucu ve tekrarlayan işlerden kurtarır, onların enerjisini problemin stratejik yönlerine, yaratıcı özellik mühendisliğine ve sonuçların yorumlanmasına odaklamalarını sağlar.
Standardizasyon ve Tekrarlanabilirlik: Model geliştirme süreci için standartlaşmış, tekrarlanabilir ve daha az hataya açık bir çerçeve sunarak, projelerin genel kalitesini ve güvenilirliğini artırır.
Hedef Kitle
Güçlü programlama veya algoritma bilgisine sahip olmadan, kendi verilerinden tahminsel modeller (örn: satış tahmini, müşteri segmentasyonu) oluşturmak isteyen İş Analistleri ve Veri Analistleri.
Tekrarlayan görevleri otomatize ederek, zamanlarını daha karmaşık problem formülasyonuna ve özellik mühendisliğine ayırmak isteyen Veri Bilimciler ve Makine Öğrenmesi Mühendisleri.
Müşterileri için hızlı bir şekilde yüksek performanslı temel (baseline) modeller geliştirmesi gereken Yönetim ve Teknoloji Danışmanları.
Yapay zeka yeteneklerini kurum içinde demokratikleştirmek ve yaygınlaştırmak isteyen Dijital Dönüşüm Liderleri.
Ekiplerinin proje teslim sürelerini kısaltmak ve daha fazla projeyi hayata geçirmek isteyen Yapay Zeka Takım Liderleri ve Teknoloji Yöneticileri.
Sertifika
Eğitimlerimize %80 oranında katılım gösterilmesi ve eğitim müfredatına göre uygulanacak sınav/projelerin başarıyla tamamlanması durumunda, eğitimin sonunda dijital ve QR kod destekli “BT Akademi Başarı Sertifikası” verilmektedir.
SEKTÖRÜN GÜVENDİĞİ ÇÖZÜM ORTAĞI
BT Akademi'yi tercih eden 4.000'den fazla kurum yanılmıyor.