Otomatik Makine Öğrenmesi (AutoML) ile Model Geliştirme Süreçlerinin Optimizasyonu Eğitimi
Otomatik Makine Öğrenmesi (AutoML) ile Model Geliştirme Süreçlerinin Optimizasyonu Eğitimi
Eğitim Hakkında
Bu yoğunlaştırılmış ve stratejik program, makine öğrenmesi projelerinin en zaman alıcı ve uzmanlık gerektiren adımlarını (veri ön işleme, özellik mühendisliği, model seçimi ve hiperparametre optimizasyonu) otomatize etme bilimi ve sanatına odaklanır. Katılımcılar, geleneksel model geliştirme süreçlerini haftalardan saatlere indiren AutoML felsefesini ve bu felsefeyi hayata geçiren en güncel açık kaynaklı kütüphaneler ile bulut platformlarını uygulamalı olarak öğreneceklerdir. Program, AutoML'i bir "sihirli kara kutu" olarak değil, Otomatik Makine Öğrenmesi (AutoML), bir veri setinden en iyi performansı gösterecek makine öğrenmesi boru hattını (pipeline) otomatik olarak keşfeden ve oluşturan sistemler bütünüdür.
Ön Koşul
Bu eğitimin herhangi bir ön koşulu yoktur.
Eğitim İçeriği
- Geleneksel ML İş Akışının Darboğazları
- Zaman ve maliyet: İteratif denemelerin ve manuel optimizasyonun yüksek maliyeti.
- Uzmanlık ihtiyacı: "Algoritma hayvanat bahçesi" içinde doğru modeli seçme zorluğu.
- Tekrarlanabilirlik ve yanlılık sorunları.
- AutoML'e Giriş: Felsefe ve Kapsam
- AutoML nedir ve ne değildir? (Sihirli bir değnek mi, güçlü bir araç mı?)
- AutoML'in kapsadığı adımlar: Veri ön işleme (Auto-Preprocess), özellik mühendisliği (Auto-FE), model seçimi (NAS) ve hiperparametre optimizasyonu (HPO).
- CASH Problemi (Combined Algorithm Selection and Hyperparameter optimization)
- AutoML'in çözmeye çalıştığı temel matematiksel problemin tanımı.
- Arama ve Optimizasyon Stratejileri
- Bayesian Optimizasyon: AutoML'in en popüler motorlarından birinin çalışma mantığı.
- Genetik Programlama: TPOT'un arkasındaki "en uygun pipeline'ın evrimi" fikri.
- Meta-Learning: Geçmişteki benzer veri setlerinden öğrenerek, yeni bir problem için en iyi başlangıç noktalarını belirleme (Auto-Sklearn).
- Ensemble ve Stacking Teknikleri: Performansı maksimize etmek için en iyi modelleri otomatik olarak birleştirme
- Auto-Sklearn ile Sağlam Baseline'lar Oluşturma
- Scikit-learn ekosistemiyle tam entegrasyon.
- Zaman ve bellek bütçesi belirleyerek optimizasyonu çalıştırma.
- Sonuçların (model toplulukları ve performansları) analizi.
- TPOT ile Şeffaf Pipeline Keşfi
- TPOT'un genetik programlama yaklaşımının farkı.
- Atölye: Bir veri seti üzerinde TPOT'u çalıştırma ve en iyi performansı veren ML pipeline'ının Python kodunu otomatik olarak üretme. Bu, şeffaflık ve öğrenme için paha biçilmezdir.
- FLAML ile Hızlı ve Hafif Optimizasyon
- Küçük ve orta ölçekli veri setlerinde hız ve verimlilik odaklı yaklaşımının incelenmesi.
- Bulut AutoML'in Avantajları: Ölçek, Entegrasyon ve Dağıtım
- Vaka İncelemesi: Google Cloud Vertex AI AutoML
- Adım adım arayüz üzerinden bir sınıflandırma projesi: Veri setini yükleme, hedef değişkeni seçme, eğitim bütçesini (compute hours) belirleme.
- AutoML'in ürettiği model "leaderboard"unu yorumlama: Farklı modellerin metriklerini (AUC, LogLoss vb.) karşılaştırma.
- Özellik önemliliği (feature importance) ve model açıklanabilirlik raporlarını inceleme.
- En iyi modeli tek tıkla bir API endpoint'i olarak "deploy" etme.
- Diğer Platformlara Bakış: Azure AutoML ve AWS SageMaker Autopilot
- Arayüz, yetenek ve fiyatlandırma açısından temel farklılıkların karşılaştırılması.
- "Garbage In, Garbage Out" Prensibi
- AutoML'in kötü veya anlaşılmamış veriyi sihirli bir şekilde düzeltmeyeceği gerçeği.
- AutoML Ne Zaman KULLANILMAMALIDIR?
- Yüksek derecede özel (custom) model mimarisi gerektiren problemler.
- Derinlemesine nedensel çıkarım (causal inference) gerektiren analizler.
- Modelin her bir adımının tam olarak açıklanmasının yasal bir zorunluluk olduğu durumlar.
- Veri Bilimcinin Evrilen Rolü
- Algoritma seçiciden, problem formülasyonu uzmanına, özellik mühendisliği sanatçısına ve sonuçların stratejik yorumcusuna dönüşüm.
- Bu modül, bir yarışma formatında, zaman baskısı altında bir proje çalışmasıdır.
- Senaryo: "Yeni bir müşteri veri seti geldi. Yönetim, 24 saat içinde bu veriden müşteri kaybını (churn) tahmin edecek en iyi temel (baseline) modelin prototipini istiyor."
- Görev: Katılımcıların gruplara ayrılarak, seçtikleri bir açık kaynak veya bulut AutoML aracıyla problemi çözmesi.
- Süreç sonunda, sadece elde ettikleri en iyi skoru değil, aynı zamanda AutoML aracının keşfettiği en iyi pipeline'ı, en önemli özellikleri ve sürecin ne kadar sürdüğünü sunmaları.
- Tartışma: Bir insanın aynı sürede bu sonuca ulaşıp ulaşamayacağı ve AutoML'nin hangi adımlarda en çok zaman kazandırdığı.
- Proje Sunumları ve Öğrenilen Dersler
- Kurum İçinde AutoML Stratejisi Geliştirme
- Hangi projelerin AutoML için uygun olduğunu belirleme.
- "Vatandaş Veri Bilimci" (Citizen Data Scientist) programları oluşturma ve bu programlarda AutoML'i bir yetkinlik aracı olarak kullanma.
- Gelecek Trendleri: Nöral Mimari Arama (NAS), Otomatik Özellik Mühendisliği (Auto-FE) ve Üretken AI ile Entegrasyon
Kazanımlar
- Manuel olarak haftalar veya aylar sürebilecek model seçimi ve optimizasyon sürecini saatlere veya günlere indirerek fikir aşamasından üretime geçiş süresini radikal şekilde kısaltabileceksiniz.
- Derin algoritma bilgisi gerektirmeden, alanında uzman profesyonellerin kendi analitik modellerini güvenle oluşturabilmesini sağlayarak yapay zekâ yetkinliğini tüm kuruma yayabileceksiniz.
- Binlerce farklı algoritma ve hiperparametre kombinasyonunu sistematik olarak deneyerek, manuel yöntemlerle ulaşılandan daha yüksek performanslı modeller keşfedebileceksiniz.
- Kıdemli veri bilimcileri için en yorucu ve tekrarlayan işleri azaltarak, stratejik problem çözümüne, yaratıcı özellik mühendisliğine ve sonuçların yorumlanmasına odaklanmalarını sağlayabileceksiniz.
- Model geliştirme sürecinde standartlaşmış, tekrarlanabilir ve daha az hataya açık bir çerçeve kullanarak projelerin genel kalitesini ve güvenilirliğini artırabileceksiniz.
Hedef Kitle
- İş Analistleri ve Veri Analistleri.
- Veri Bilimciler ve Makine Öğrenmesi Mühendisleri.
- Yönetim ve Teknoloji Danışmanları.
- Dijital Dönüşüm Liderleri.
- Yapay Zeka Takım Liderleri ve Teknoloji Yöneticileri.
Sertifika
Eğitimlerimize %80 oranında katılım gösterilmesi ve eğitim müfredatına göre uygulanacak sınav/projelerin başarıyla tamamlanması durumunda, eğitimin sonunda dijital ve QR kod destekli “BT Akademi Başarı Sertifikası” verilmektedir.
SEKTÖRÜN GÜVENDİĞİ ÇÖZÜM ORTAĞI
BT Akademi'yi tercih eden 4.000'den fazla kurum yanılmıyor.