Spark Programlama - İleri Eğitimi
Spark Programlama - İleri Eğitimi
Eğitim Hakkında
Apache Spark, büyük veri analizi ve işleme alanında kullanılan güçlü bir açık kaynaklı veri işleme motorudur. Bu eğitim, Spark'ın temellerinden başlayarak, Spark ve Hadoop ekosistemi arasındaki ilişkiyi, Spark'ın temel kavramlarını ve mimarisini kapsar. Son olarak, katılımcılar Spark'ın dağıtılmış işlemlerini, RDD bölümlerini, aşamaları ve görevleri ve iş yürütme planlamasını inceleyeceklerdir. Bu eğitim, büyük veri işleme ve analizi alanında çalışmak isteyenler için kapsamlı bir giriş sunar.
Ön Koşul
Katılımcıların programlama tecrübesine sahip olmaları ve Spark bilmesi gerekmektedir.
Eğitim İçeriği
- Spark ve Hadoop
- Spark Kavramları ve Mimarisi
- Spark Ekosistemi (Core, Spark SQL, ML, Streaming)
- Spark SQL
- RDD
- Spark API / RDD API'ye Giriş
- İlk Programın Spark'a Gönderilmesi
- Hata Ayıklama / Günlükleme
- Yapılandırma Özellikleri
- ML ve DL Temelleri
- Regresyon
- Sınıflandırma
- Kümeleme
- Özellik İşlemleri
- ML için Verinin Hazırlanması
- One-Hot Encoding, Ölçeklendirme...
- Modellerin Eğitilmesi
- Sınıflandırma, Regresyon
- Hiper Parametre Ayarlama
- Katlamalı Çapraz Doğrulama, Eğitim Doğrulama Bölme
- Tekst Verileri Üzerinde Temel Duygu Analizi
- Apache Spark Streaming Genel Bakışı
- Akış Veri Çerçeveleri Oluşturma
- Veri Çerçevelerini Dönüştürme
- Akış Sorgularını Yürütme
- Kafka Mesajlarını Alma
- Kafka Mesajlarını Gönderme
- Akış Birleştirme
- Akış Veri Çerçevelerini Birleştirme
- Bir Kümede Apache Spark
- RDD Bölümleri
- Aşamalar ve Görevler
- İş Yürütme Planlama
Kazanımlar
Apache Spark'ın temel kavramlarını ve mimarisini anlamak
Spark ekosisteminin farklı bileşenlerini (Core, Spark SQL, ML, Streaming) kullanmayı öğrenmek
RDD (Resilient Distributed Datasets) ve Spark SQL gibi Spark'ın veri işleme yapılarını anlamak ve kullanmak
Spark API programlama becerilerini geliştirmek ve ilk Spark programını gönderme yeteneği kazanmak
Makine öğrenimi temellerini kavramak ve Spark ML kullanarak büyük veri üzerinde model eğitmek
Yapılandırılmış akış (Structured Streaming) kavramlarını öğrenmek ve Apache Kafka ile entegrasyonunu gerçekleştirmek
Akış veri çerçevelerini birleştirme, dönüştürme ve analiz etme becerilerini kazanmak
Spark'ın dağıtılmış işlemlerini anlamak ve uygulamak
Hedef Kitle
Büyük veri analizi ve işleme konularında temel bilgi sahibi olmak isteyen bireyler
Veri bilimi ve yapay zeka alanlarında kariyer yapmak isteyenler
Veri analitiği ve büyük veri projelerinde çalışan profesyoneller
Yazılım geliştirme veya veri mühendisliği alanında deneyimi olanlar
Sertifika
Eğitimlerimize %80 oranında katılım gösterilmesi ve eğitim müfredatına göre uygulanacak sınav/projelerin başarıyla tamamlanması durumunda, eğitimin sonunda dijital ve QR kod destekli “BT Akademi Başarı Sertifikası” verilmektedir.
SEKTÖRÜN GÜVENDİĞİ ÇÖZÜM ORTAĞI
BT Akademi'yi tercih eden 4.000'den fazla kurum yanılmıyor.