
Eğitim Hakkında
Bu yoğunlaştırılmış ve stratejik program, makine öğrenmesi projelerinin en zaman alıcı ve uzmanlık gerektiren adımlarını (veri ön işleme, özellik mühendisliği, model seçimi ve hiperparametre optimizasyonu) otomatize etme bilimi ve sanatına odaklanır. Katılımcılar, geleneksel model geliştirme süreçlerini haftalardan saatlere indiren AutoML felsefesini ve bu felsefeyi hayata geçiren en güncel açık kaynaklı kütüphaneler ile bulut platformlarını uygulamalı olarak öğreneceklerdir. Program, AutoML'i bir "sihirli kara kutu" olarak değil,
Otomatik Makine Öğrenmesi (AutoML), bir veri setinden en iyi performansı gösterecek makine öğrenmesi boru hattını (pipeline) otomatik olarak keşfeden ve oluşturan sistemler bütünüdür. Bu eğitim, AutoML'in tüm katmanlarını ele alır:
- Temel Problem: CASH (Combined Algorithm Selection and Hyperparameter optimization): AutoML'in çözmeye çalıştığı temel problemi – hangi algoritmayı hangi hiperparametrelerle kullanmak en iyisidir – anlama.
- Arka Plandaki Motorlar: AutoML sistemlerini çalıştıran temel optimizasyon algoritmaları. Bayesian Optimizasyon, Genetik Programlama ve Ensemble (Topluluk) Yöntemleri gibi yaklaşımların sezgisel ve teknik incelenmesi.
- Açık Kaynak Kütüphaneler:
- Auto-Sklearn: Scikit-learn ekosistemi üzerine kurulmuş, meta-learning ile zenginleştirilmiş sağlam bir kütüphane.
- TPOT (Tree-based Pipeline Optimization Tool): Genetik programlama kullanarak, en iyi işlem adımlarını (örn: ölçeklendirme -> özellik seçimi -> model) içeren Python kodunu sizin için üreten bir "veri bilimi asistanı".
- FLAML: Microsoft Research tarafından geliştirilen, özellikle hız ve kaynak verimliliği odaklı, hafif bir kütüphane.
- Bulut Tabanlı Platformlar: Google Cloud Vertex AI AutoML, Microsoft Azure AutoML ve Amazon SageMaker Autopilot gibi büyük bulut sağlayıcılarının sunduğu, kod yazmadan veya çok az kodla (low-code) model geliştirmeyi sağlayan yönetilen servisler.
Kimler İçindir?
- Tekrarlayan görevleri otomatize ederek, zamanlarını daha karmaşık problem formülasyonuna ve özellik mühendisliğine ayırmak isteyen Veri Bilimciler ve Makine Öğrenmesi Mühendisleri.
- Güçlü programlama veya algoritma bilgisine sahip olmadan, kendi verilerinden tahminsel modeller (örn: satış tahmini, müşteri segmentasyonu) oluşturmak isteyen İş Analistleri ve Veri Analistleri.
- Ekiplerinin proje teslim sürelerini kısaltmak ve daha fazla projeyi hayata geçirmek isteyen Yapay Zeka Takım Liderleri ve Teknoloji Yöneticileri.
- Müşterileri için hızlı bir şekilde yüksek performanslı temel (baseline) modeller geliştirmesi gereken Yönetim ve Teknoloji Danışmanları.
- Yapay zeka yeteneklerini kurum içinde demokratikleştirmek ve yaygınlaştırmak isteyen Dijital Dönüşüm Liderleri.
Sertifika
Eğitimlerimize %80 oranında katılım gösterilmesi ve eğitim müfredatına göre uygulanacak sınav/projelerin başarıyla tamamlanması durumunda, eğitimin sonunda dijital ve QR kod destekli “BT Akademi Başarı Sertifikası” verilmektedir.
Eğitim İçeriği
1.1. Geleneksel ML İş Akışının Darboğazları
- Zaman ve maliyet: İteratif denemelerin ve manuel optimizasyonun yüksek maliyeti.
- Uzmanlık ihtiyacı: "Algoritma hayvanat bahçesi" içinde doğru modeli seçme zorluğu.
- Tekrarlanabilirlik ve yanlılık sorunları.
- AutoML nedir ve ne değildir? (Sihirli bir değnek mi, güçlü bir araç mı?)
- AutoML'in kapsadığı adımlar: Veri ön işleme (Auto-Preprocess), özellik mühendisliği (Auto-FE), model seçimi (NAS) ve hiperparametre optimizasyonu (HPO).
2.1. CASH Problemi (Combined Algorithm Selection and Hyperparameter optimization)
- AutoML'in çözmeye çalıştığı temel matematiksel problemin tanımı.
- Bayesian Optimizasyon: AutoML'in en popüler motorlarından birinin çalışma mantığı.
- Genetik Programlama: TPOT'un arkasındaki "en uygun pipeline'ın evrimi" fikri.
- Meta-Learning: Geçmişteki benzer veri setlerinden öğrenerek, yeni bir problem için en iyi başlangıç noktalarını belirleme (Auto-Sklearn).
- Ensemble ve Stacking Teknikleri: Performansı maksimize etmek için en iyi modelleri otomatik olarak birleştirme.
3.1. Auto-Sklearn ile Sağlam Baseline'lar Oluşturma
- Scikit-learn ekosistemiyle tam entegrasyon.
- Zaman ve bellek bütçesi belirleyerek optimizasyonu çalıştırma.
- Sonuçların (model toplulukları ve performansları) analizi.
- TPOT'un genetik programlama yaklaşımının farkı.
- Atölye: Bir veri seti üzerinde TPOT'u çalıştırma ve en iyi performansı veren ML pipeline'ının Python kodunu otomatik olarak üretme. Bu, şeffaflık ve öğrenme için paha biçilmezdir.
- Küçük ve orta ölçekli veri setlerinde hız ve verimlilik odaklı yaklaşımının incelenmesi.
4.1. Bulut AutoML'in Avantajları: Ölçek, Entegrasyon ve Dağıtım
- Adım adım arayüz üzerinden bir sınıflandırma projesi: Veri setini yükleme, hedef değişkeni seçme, eğitim bütçesini (compute hours) belirleme.
- AutoML'in ürettiği model "leaderboard"unu yorumlama: Farklı modellerin metriklerini (AUC, LogLoss vb.) karşılaştırma.
- Özellik önemliliği (feature importance) ve model açıklanabilirlik raporlarını inceleme.
- En iyi modeli tek tıkla bir API endpoint'i olarak "deploy" etme.
- Arayüz, yetenek ve fiyatlandırma açısından temel farklılıkların karşılaştırılması.
5.1. "Garbage In, Garbage Out" Prensibi
- AutoML'in kötü veya anlaşılmamış veriyi sihirli bir şekilde düzeltmeyeceği gerçeği.
- Yüksek derecede özel (custom) model mimarisi gerektiren problemler.
- Derinlemesine nedensel çıkarım (causal inference) gerektiren analizler.
- Modelin her bir adımının tam olarak açıklanmasının yasal bir zorunluluk olduğu durumlar.
- Algoritma seçiciden, problem formülasyonu uzmanına, özellik mühendisliği sanatçısına ve sonuçların stratejik yorumcusuna dönüşüm.
Senaryo: "Yeni bir müşteri veri seti geldi. Yönetim, 24 saat içinde bu veriden müşteri kaybını (churn) tahmin edecek en iyi temel (baseline) modelin prototipini istiyor."
Görev:
- Katılımcıların gruplara ayrılarak, seçtikleri bir açık kaynak veya bulut AutoML aracıyla problemi çözmesi.
- Süreç sonunda, sadece elde ettikleri en iyi skoru değil, aynı zamanda AutoML aracının keşfettiği en iyi pipeline'ı, en önemli özellikleri ve sürecin ne kadar sürdüğünü sunmaları.
- Tartışma: Bir insanın aynı sürede bu sonuca ulaşıp ulaşamayacağı ve AutoML'nin hangi adımlarda en çok zaman kazandırdığı.
- Hangi projelerin AutoML için uygun olduğunu belirleme.
- "Vatandaş Veri Bilimci" (Citizen Data Scientist) programları oluşturma ve bu programlarda AutoML'i bir yetkinlik aracı olarak kullanma.
Neden Bu Eğitimi Almalısınız ?
- Hızlandırılmış Değer Elde Etme: Manuel olarak haftalar veya aylar sürebilecek model seçimi ve optimizasyon sürecini saatlere veya günlere indirerek, fikir aşamasından üretime geçiş süresini radikal bir şekilde kısaltır.
- Yapay Zekanın Demokratikleşmesi: Derin algoritma bilgisi gerektirmeden, alanında uzman profesyonellerin kendi analitik modellerini güvenle oluşturabilmelerini sağlar, böylece yapay zeka yetkinliğini tüm kuruma yayar.
- Performans Artışı ve Keşif: Bir insanın gözden kaçırabileceği binlerce farklı algoritma ve hiperparametre kombinasyonunu sistematik olarak deneyerek, genellikle manuel olarak ulaşılandan daha yüksek performanslı modeller keşfeder.
- Uzman Verimliliğinde Sıçrama: Kıdemli veri bilimcileri, en yorucu ve tekrarlayan işlerden kurtarır, onların enerjisini problemin stratejik yönlerine, yaratıcı özellik mühendisliğine ve sonuçların yorumlanmasına odaklamalarını sağlar.
- Standardizasyon ve Tekrarlanabilirlik: Model geliştirme süreci için standartlaşmış, tekrarlanabilir ve daha az hataya açık bir çerçeve sunarak, projelerin genel kalitesini ve güvenilirliğini artırır.
Önemli Notlar
Program ücretlerine KDV dahil değildir.