
Eğitim Hakkında
Eğitimimiz, bilgisayarların insan dilini anlaması, yorumlaması ve üretmesi için geliştirilen yapay zeka tekniklerinin bir alt alanıdır. NLP, metin analizi, duygu analizi, çeviri, metin sınıflandırma, chatbot geliştirme gibi birçok alanda kullanılmaktadır. Python, geniş kütüphane desteği ve güçlü araçları sayesinde NLP uygulamalarını geliştirmek için en çok tercih edilen dillerden biridir.
Bu eğitim, NLP’nin temel kavramlarından başlayarak, Python kullanarak metin ön işleme, özellik mühendisliği, model eğitimi ve değerlendirme gibi süreçleri öğretmeyi amaçlamaktadır.
Doğal Dil İşleme (NLP), insan dilini analiz etmek, anlamlandırmak ve otomatikleştirmek için istatistiksel, makine öğrenmesi ve derin öğrenme tekniklerini kullanan bir bilim dalıdır. NLP, dilbilimsel analiz teknikleri ve yapay zeka yöntemlerini bir araya getirerek, bilgisayarların doğal dildeki girdileri anlamasını sağlar.
Bu eğitim, katılımcılara metin verisiyle çalışmanın temel ilkelerinden başlayarak ileri seviyede NLP uygulamalarına kadar kapsamlı bir bilgi sunacaktır.
Kimler İçindir?
- Programlamaya aşina olan yeni başlayanlar, doğal dil işleme tekniklerini öğrenmek isteyenler,
- Veri bilimciler ve analistler, metin verisini işleyerek anlamlı içgörüler çıkarmak isteyenler,
- Yazılım geliştiriciler, chatbot ve metin tabanlı otomasyon projeleri geliştirmek isteyenler,
- Akademisyenler ve araştırmacılar, dil modellerini araştırmalarına entegre etmek isteyenler,
- Pazarlama ve müşteri hizmetleri profesyonelleri, müşteri geri bildirimlerini analiz etmek isteyenler,
- Üniversite öğrencileri, NLP alanında kariyer yapmak isteyenler.
Sertifika
Eğitimlerimize %80 oranında katılım gösterilmesi ve eğitim müfredatına göre uygulanacak sınav/projelerin başarıyla tamamlanması durumunda, eğitimin sonunda dijital ve QR kod destekli “BT Akademi Başarı Sertifikası” verilmektedir.
Eğitim İçeriği
- NLP’nin Tanımı ve Evrimi
- Dil bilimi ⇄ bilgisayar bilimi kesişimi
- Kural-tabanlı dönemin (1950-90) sınırları
- İstatistiksel patlama (Brown Corpus → n-gram)
- Derin öğrenme & Transformer devrimi
- NLP’nin Günlük Hayatta Görünümü
- Akıllı klavye, otomatik altyazı, spam filtresi, e-ticaret arama
- Dil Seviyeleri & Analiz Katmanları
- Fonoloji · Morfoloji · Sözdizim · Budaksal (Phrase) · Anlamsal
- Pragmatik & söylem (discourse) analizi
- NLP–AI–ML İlişkisi
- NLP ⊂ ML · ML ⊂ AI
- Symbolic vs probabilistic vs neural NLP
- Araştırma Trendleri (2025 ve sonrası)
- Multimodal LLM, Retrieval-Augmented Generation (RAG)
- Tool-Augmented LLM, Agentic NLP
- Veri sorumluluğu & sürdürülebilir AI
- Ortam Hazırlığı & Python NLP Ekosistemi
- Conda / venv, Python 3.11 tavsiyesi
- Google Colab Pro, JupyterLab inside Docker
- Kütüphane panoraması
- NLTK · spaCy · gensim · transformers / datasets / accelerate
- Stanza, flair, sentence-transformers
- GPU/TPU kullanım ipuçları
- Ham Veri Kaynakları
- Web scraping (BeautifulSoup, Scrapy)
- API & stream kaynakları (Twitter, Reddit, NewsAPI)
- PDF / Word / OCR (Tesseract, pytesseract)
- Temizleme & Normalize Etme
- Unicode NFKC, emoji & diakritik işleme
- Contractions & slang genişletme
- E-posta, URL, mention, hashtag desensitization
- Dil Tespiti & Romanizasyon
- langdetect, fastText lid.176
- Tokenization Derinleşmesi
- Kelime, cümle, karakter, sub-word (BPE, WordPiece, SentencePiece)
- Dil-özel segmentasyon (Çince Jieba, Japonca MeCab)
- Stop Word Stratejileri
- Domain-spesifik stop-list üretimi, tf-idf tabanlı trimming
- Lemmatization vs Stemming
- Türkçe Zemberek, spaCy lemmatizer; Snowball, Porter, Lancaster
- Grammatical Error Correction (GEC)
- transformers-based GECToR pipelini
- Named Entity Recognition (Giriş)
- spaCy NER, rule-based gazetteer, regex NER
- Metin Anonimleştirme / PII Maskesi
- Regex + NER + hashing örneği
- Klasik Temsiller
- One-Hot, Bag-of-Words, binarize/TF/TF-IDF varyantları
- n-gram (1-5) & karakter n-gram
- Yoğun Temsiller (Embeddings)
- Word2Vec (Skip-gram, CBOW) – negatif örnek, subsampling
- GloVe, fastText (sub-word)
- Doc2Vec – PV-DM & PV-DBOW
- Bağlama-Duyarlı Temsiller
- ELMo, flair, BERT embeddings
- Sentence-level: Universal Sentence Encoder, SBERT, LASER
- Ortogonal Teknikler
- Hashing Vectorizer, semantic hashing, feature hashing
- Görselleştirme
- t-SNE, UMAP, PCA ile embedding space keşfi
- Dil Modellemesi & N-gram
- Katz & Kneser-Ney smoothing, perplexity ölçümü
- POS Tagging & Morfolojik Analiz
- HMM, CRF, perceptron tagger örnekleri
- Özellik Mühendisliği
- PMI, Chi-square, Information Gain seçimi
- Character n-gram & stylometry özellikleri
- Metin Sınıflandırma
- Multinomial NB, SVM + SGD, Logistic Regression
- Sınıf dengesizliği → SMOTE-TE, focal loss
- Topik Modelleme
- LSA, PLSA, LDA (Gibbs Sampling vs VI)
- Dynamic Topic Models, HDP
- Sentiment Analizi
- VADER, SO-CAL, SentiWordNet
- ML pipelines: GridSearchCV, cross-val, threshold tuning
- Kümeleme & Benzerlik
- agglomerative cluster, DBSCAN, cosine similarity index
- Sinir Ağlarının Temelleri – backprop, activations, embeddings katmanı
- CNN for Text – Kim CNN, region-based CNN, char-CNN
- RNN Ailesi
- LSTM, GRU, peephole, stacked & bidirectional, attention augmented
- Sequence-to-Sequence & Attention
- Bahdanau vs Luong attention, teacher forcing, scheduled sampling
- Hierarchical Models
- HAN (Hierarchical Attention Network)
- Pointer-Generator & Coverage – abstractive summarization
- Reinforcement Learning for NLP – RL-from-human-feedback (RLHF) temelleri
- Transformer Mimarisi – multi-head attention, positional encoding, scaling laws
- Maskeli & Otoregresif Ön-Eğitim Hedefleri
- MLM, NSP, SOP, next-token prediction
- Popüler Modeller
- BERT/RoBERTa/DeBERTa, GPT-2/3/3.5/4-o, T5, XLNet, Longformer
- Parametre-Verimli İnce Ayarlama
- LoRA, Prefix/Prompt Tuning, Adapter, PEFT
- RAG & Toolformer
- FAISS + Retriever, vector DB entegrasyonu
- Prompt Engineering
- Zero/Few-Shot, Chain-of-Thought, ReAct, Self-Consistency
- Türkçe LLM Ekosistemi – BERTurk, TR-BERT, AiTLAM, Llama-Tr
- Adlandırılmış Varlık Tanıma (NER)
- IOB2 etiketlemesi, BiLSTM-CRF, spaCy custom training
- Soru-Cevap (QA)
- Extractive vs Generative QA, SQuAD fine-tuning, RAG-QA
- Özetleme
- TextRank (Extractive), BART/T5 abstractive, RL-rewards (ROUGE)
- Makine Çevirisi
- Transformer-NMT, MarianMT, mBART, BLEU/chrF++ ölçümü
- Diyalog Sistemleri & Chatbot
- Retrieval vs Generative, Rasa, LangChain agents
- Coreference & Entity Linking
- NeuralCoref, spanBERT coref, Elasticsearch in-document linking
- Event Extraction & Knowledge Graph
- OpenIE, ACE-05 pipeline, Neo4j ingestion
- Klasik Metri̇kler: Accuracy, Precision-Recall, F1, ROC-AUC
- Dil-Özel Metri̇kler: BLEU, ROUGE-L, METEOR, BERTScore, MoverScore
- Toksisite & Yanlılık Ölçümleri: Perspective API, SEAT, StereoSet
- Hata Analizi Çerçevesi: Confusion Matrix, data slicing, error spans
- Açıklanabilirlik Araçları: LIME, SHAP, Captum, Ecco
Neden Bu Eğitimi Almalısınız ?
- Geniş Kullanım Alanı: NLP, e-ticaret, sağlık, hukuk, eğitim gibi birçok sektörde kullanılmaktadır.
- Güçlü Kütüphane Desteği: Python, NLTK, spaCy, Transformers gibi güçlü NLP kütüphaneleri sayesinde metin işleme süreçlerini kolaylaştırır.
- Büyük Veri Analizi: Doğal dil işleme teknikleri, büyük metin veri kümelerini analiz ederek işletmeler için anlamlı içgörüler sağlar.
- Otomasyon ve Verimlilik: Chatbotlar, otomatik metin özetleme ve duygu analizi gibi uygulamalar iş süreçlerini hızlandırır.
- Kariyer Olanakları: NLP uzmanlığı, günümüz teknoloji dünyasında en çok aranan yeteneklerden biridir ve yüksek maaşlı iş fırsatları sunmaktadır.
- Dil ve Teknoloji Arasında Köprü Kurma: NLP, insan dilini makinelerin anlayabileceği bir forma dönüştürerek kullanıcı deneyimini iyileştirir.
Önemli Notlar
Program ücretlerine KDV dahil değildir.