Otomatik Makine Öğrenmesi (AutoML) ile Model Geliştirme Süreçlerinin Optimizasyonu

Eğitim Hakkında

Bu yoğunlaştırılmış ve stratejik program, makine öğrenmesi projelerinin en zaman alıcı ve uzmanlık gerektiren adımlarını (veri ön işleme, özellik mühendisliği, model seçimi ve hiperparametre optimizasyonu) otomatize etme bilimi ve sanatına odaklanır. Katılımcılar, geleneksel model geliştirme süreçlerini haftalardan saatlere indiren AutoML felsefesini ve bu felsefeyi hayata geçiren en güncel açık kaynaklı kütüphaneler ile bulut platformlarını uygulamalı olarak öğreneceklerdir. Program, AutoML'i bir "sihirli kara kutu" olarak değil,

Otomatik Makine Öğrenmesi (AutoML), bir veri setinden en iyi performansı gösterecek makine öğrenmesi boru hattını (pipeline) otomatik olarak keşfeden ve oluşturan sistemler bütünüdür. Bu eğitim, AutoML'in tüm katmanlarını ele alır:

Temel Problem: CASH (Combined Algorithm Selection and Hyperparameter optimization): AutoML'in çözmeye çalıştığı temel problemi – hangi algoritmayı hangi hiperparametrelerle kullanmak en iyisidir – anlama.
Arka Plandaki Motorlar: AutoML sistemlerini çalıştıran temel optimizasyon algoritmaları. Bayesian Optimizasyon, Genetik Programlama ve Ensemble (Topluluk) Yöntemleri gibi yaklaşımların sezgisel ve teknik incelenmesi.
Açık Kaynak Kütüphaneler:

Auto-Sklearn: Scikit-learn ekosistemi üzerine kurulmuş, meta-learning ile zenginleştirilmiş sağlam bir kütüphane.
TPOT (Tree-based Pipeline Optimization Tool): Genetik programlama kullanarak, en iyi işlem adımlarını (örn: ölçeklendirme -> özellik seçimi -> model) içeren Python kodunu sizin için üreten bir "veri bilimi asistanı".
FLAML: Microsoft Research tarafından geliştirilen, özellikle hız ve kaynak verimliliği odaklı, hafif bir kütüphane.

Bulut Tabanlı Platformlar: Google Cloud Vertex AI AutoML, Microsoft Azure AutoML ve Amazon SageMaker Autopilot gibi büyük bulut sağlayıcılarının sunduğu, kod yazmadan veya çok az kodla (low-code) model geliştirmeyi sağlayan yönetilen servisler.

Kimler İçindir?

Tekrarlayan görevleri otomatize ederek, zamanlarını daha karmaşık problem formülasyonuna ve özellik mühendisliğine ayırmak isteyen Veri Bilimciler ve Makine Öğrenmesi Mühendisleri.
Güçlü programlama veya algoritma bilgisine sahip olmadan, kendi verilerinden tahminsel modeller (örn: satış tahmini, müşteri segmentasyonu) oluşturmak isteyen İş Analistleri ve Veri Analistleri.
Ekiplerinin proje teslim sürelerini kısaltmak ve daha fazla projeyi hayata geçirmek isteyen Yapay Zeka Takım Liderleri ve Teknoloji Yöneticileri.
Müşterileri için hızlı bir şekilde yüksek performanslı temel (baseline) modeller geliştirmesi gereken Yönetim ve Teknoloji Danışmanları.
Yapay zeka yeteneklerini kurum içinde demokratikleştirmek ve yaygınlaştırmak isteyen Dijital Dönüşüm Liderleri.

Sertifika

Eğitimlerimize %80 oranında katılım gösterilmesi ve eğitim müfredatına göre uygulanacak sınav/projelerin başarıyla tamamlanması durumunda, eğitimin sonunda dijital ve QR kod destekli “BT Akademi Başarı Sertifikası” verilmektedir.

Eğitim İçeriği

1. Modül: Makine Öğrenmesi Süreçlerinde Otomasyon Devrimi

1.1. Geleneksel ML İş Akışının Darboğazları

Zaman ve maliyet: İteratif denemelerin ve manuel optimizasyonun yüksek maliyeti.
Uzmanlık ihtiyacı: "Algoritma hayvanat bahçesi" içinde doğru modeli seçme zorluğu.
Tekrarlanabilirlik ve yanlılık sorunları.

1.2. AutoML'e Giriş: Felsefe ve Kapsam

AutoML nedir ve ne değildir? (Sihirli bir değnek mi, güçlü bir araç mı?)
AutoML'in kapsadığı adımlar: Veri ön işleme (Auto-Preprocess), özellik mühendisliği (Auto-FE), model seçimi (NAS) ve hiperparametre optimizasyonu (HPO).

2. Modül: AutoML'in Perde Arkası: Temel Algoritmalar ve Yaklaşımlar

2.1. CASH Problemi (Combined Algorithm Selection and Hyperparameter optimization)

AutoML'in çözmeye çalıştığı temel matematiksel problemin tanımı.

2.2. Arama ve Optimizasyon Stratejileri

Bayesian Optimizasyon: AutoML'in en popüler motorlarından birinin çalışma mantığı.
Genetik Programlama: TPOT'un arkasındaki "en uygun pipeline'ın evrimi" fikri.
Meta-Learning: Geçmişteki benzer veri setlerinden öğrenerek, yeni bir problem için en iyi başlangıç noktalarını belirleme (Auto-Sklearn).
Ensemble ve Stacking Teknikleri: Performansı maksimize etmek için en iyi modelleri otomatik olarak birleştirme.

3. Modül: Açık Kaynak AutoML Kütüphaneleri ile Uygulamalı Atölye

3.1. Auto-Sklearn ile Sağlam Baseline'lar Oluşturma

Scikit-learn ekosistemiyle tam entegrasyon.
Zaman ve bellek bütçesi belirleyerek optimizasyonu çalıştırma.
Sonuçların (model toplulukları ve performansları) analizi.

3.2. TPOT ile Şeffaf Pipeline Keşfi

TPOT'un genetik programlama yaklaşımının farkı.
Atölye: Bir veri seti üzerinde TPOT'u çalıştırma ve en iyi performansı veren ML pipeline'ının Python kodunu otomatik olarak üretme. Bu, şeffaflık ve öğrenme için paha biçilmezdir.

3.3. FLAML ile Hızlı ve Hafif Optimizasyon

Küçük ve orta ölçekli veri setlerinde hız ve verimlilik odaklı yaklaşımının incelenmesi.

4. Modül: Bulut Tabanlı AutoML Platformları

4.1. Bulut AutoML'in Avantajları: Ölçek, Entegrasyon ve Dağıtım

4.2. Vaka İncelemesi: Google Cloud Vertex AI AutoML

Adım adım arayüz üzerinden bir sınıflandırma projesi: Veri setini yükleme, hedef değişkeni seçme, eğitim bütçesini (compute hours) belirleme.
AutoML'in ürettiği model "leaderboard"unu yorumlama: Farklı modellerin metriklerini (AUC, LogLoss vb.) karşılaştırma.
Özellik önemliliği (feature importance) ve model açıklanabilirlik raporlarını inceleme.
En iyi modeli tek tıkla bir API endpoint'i olarak "deploy" etme.

4.3. Diğer Platformlara Bakış: Azure AutoML ve AWS SageMaker Autopilot

Arayüz, yetenek ve fiyatlandırma açısından temel farklılıkların karşılaştırılması.

5. Modül: AutoML'in Sınırları, Tuzakları ve İnsan Rolü

5.1. "Garbage In, Garbage Out" Prensibi

AutoML'in kötü veya anlaşılmamış veriyi sihirli bir şekilde düzeltmeyeceği gerçeği.

5.2. AutoML Ne Zaman Kullanılmamalıdır?

Yüksek derecede özel (custom) model mimarisi gerektiren problemler.
Derinlemesine nedensel çıkarım (causal inference) gerektiren analizler.
Modelin her bir adımının tam olarak açıklanmasının yasal bir zorunluluk olduğu durumlar.

5.3. Veri Bilimcinin Evrilen Rolü

Algoritma seçiciden, problem formülasyonu uzmanına, özellik mühendisliği sanatçısına ve sonuçların stratejik yorumcusuna dönüşüm.

6. Modül: Uçtan Uca Proje: AutoML ile Hızlı Prototipleme ve Baseline Oluşturma

Senaryo: "Yeni bir müşteri veri seti geldi. Yönetim, 24 saat içinde bu veriden müşteri kaybını (churn) tahmin edecek en iyi temel (baseline) modelin prototipini istiyor."

Görev:

Katılımcıların gruplara ayrılarak, seçtikleri bir açık kaynak veya bulut AutoML aracıyla problemi çözmesi.
Süreç sonunda, sadece elde ettikleri en iyi skoru değil, aynı zamanda AutoML aracının keşfettiği en iyi pipeline'ı, en önemli özellikleri ve sürecin ne kadar sürdüğünü sunmaları.
Tartışma: Bir insanın aynı sürede bu sonuca ulaşıp ulaşamayacağı ve AutoML'nin hangi adımlarda en çok zaman kazandırdığı.

7. Modül: Sonuç, Kurumsal Strateji ve Gelecek Trendleri

7.1. Proje Sunumları ve Öğrenilen Dersler

7.2. Kurum İçinde AutoML Stratejisi Geliştirme

Hangi projelerin AutoML için uygun olduğunu belirleme.
"Vatandaş Veri Bilimci" (Citizen Data Scientist) programları oluşturma ve bu programlarda AutoML'i bir yetkinlik aracı olarak kullanma.

7.3. Gelecek Trendleri: Nöral Mimari Arama (NAS), Otomatik Özellik Mühendisliği (Auto-FE) ve Üretken AI ile Entegrasyon

Neden Bu Eğitimi Almalısınız ?

Hızlandırılmış Değer Elde Etme: Manuel olarak haftalar veya aylar sürebilecek model seçimi ve optimizasyon sürecini saatlere veya günlere indirerek, fikir aşamasından üretime geçiş süresini radikal bir şekilde kısaltır.
Yapay Zekanın Demokratikleşmesi: Derin algoritma bilgisi gerektirmeden, alanında uzman profesyonellerin kendi analitik modellerini güvenle oluşturabilmelerini sağlar, böylece yapay zeka yetkinliğini tüm kuruma yayar.
Performans Artışı ve Keşif: Bir insanın gözden kaçırabileceği binlerce farklı algoritma ve hiperparametre kombinasyonunu sistematik olarak deneyerek, genellikle manuel olarak ulaşılandan daha yüksek performanslı modeller keşfeder.
Uzman Verimliliğinde Sıçrama: Kıdemli veri bilimcileri, en yorucu ve tekrarlayan işlerden kurtarır, onların enerjisini problemin stratejik yönlerine, yaratıcı özellik mühendisliğine ve sonuçların yorumlanmasına odaklamalarını sağlar.
Standardizasyon ve Tekrarlanabilirlik: Model geliştirme süreci için standartlaşmış, tekrarlanabilir ve daha az hataya açık bir çerçeve sunarak, projelerin genel kalitesini ve güvenilirliğini artırır.

Önemli Notlar

Program ücretlerine KDV dahil değildir.

Paylaş:

Süre
18 Saat (3 Gün)
Ücret
Sorunuz

Önemli kampanyalardan haberdar olmak için Rıza Metni kapsamında bilgilendirilmek istiyorum.