Eğitim

LLM Nedir? Büyük Dil Modelleri Nasıl Çalışıyor?

Garip gelecek ama, “ChatGPT neden bazen çok iyi cevap veriyor da bazen saçmalıyor?” diye soran çok kişi gördüm. İşin arkasında duran ana motorlardan biri LLM, yani Large Language Model; Türkçesiyle Büyük Dil Modeli. Kulağa biraz laboratuvar kokulu geliyor, kabul. Ama günlük hayatta karşımıza çıktığı yer sayısı bayağı fazla: arama asistanları, müşteri hizmetleri botları, kod yazan araçlar, özet çıkaran uygulamalar… Hepsinin içinde bir yerlerde bu mantık dönüyor.

Ben bu konuyu ilk kez 2023 yazında, Kadıköy’deki küçük bir editör toplantısında “metin üretimi” başlığıyla tartışırken ciddiye almıştım (en azından benim deneyimim böyle). O gün herkes LLM’leri sadece “yazı yazan bot” sanıyordu — hani şu “soru sor, cevap al” kadar basit bir şey gibi. Sonra birkaç demo açtık, modelden hem e-posta taslağı hem de teknik özet istedik; sonuç fena değildi, hatta bazı kısımlarda şaşırtıcı derecede iyiydi. Ama dur bir dakika — aynı model, aynı soruya başka bir gün bambaşka tonda cevap da verebiliyor. İşin büyüsü biraz burada. Can sıkıcı tarafı da biraz orada.

💡 Bilgi: LLM’ler metni “anlamaya çalışan” sistemler gibi görünür ama aslında büyük ölçüde örüntü yakalar. Yani kelimeler arasındaki olasılık ilişkisini öğrenir; insan gibi düşünmez, ama insan diline bayağı yaklaşır.

LLM tam olarak ne demek?

Large Language Model ifadesindeki “large” kelimesi yalnızca boyut gösterişi değil. Modelin öğrendiği parametre sayısına işaret ediyor. Bu parametreleri kabaca beynin bağlantıları gibi düşünebilirsiniz — sayı arttıkça model daha karmaşık ilişkileri yakalıyor, daha geniş bağlam kuruyor ve daha doğal cümleler üretiyor. En azından teoride böyle.

Bak şimdi, “Dil modeli” kısmı ise işin omurgası. Modelin görevi, verilen bir metinde sıradaki kelimenin ne olacağını tahmin etmekten başlayıp cümlenin devamını şekillendirmeye kadar uzanıyor. Basit görünüyor değil mi? Değil aslında (evet, doğru duydunuz). Çünkü model bunu milyarlarca örnek üzerinden öğreniyor ve zamanla dil bilgisi, tonlama, üslup — hatta bazı mantık kalıplarını bile taklit edebiliyor.

Geçen sene Berlin’deki bir ürün demosunda bunu birebir gördüm. Ekip üyeleri modele hukuki metin özeti verdiler; çıktı kötü değildi. Kritik bir maddeyi yumuşatıp neredeyse önemsiz göstermişti. Kağıt üstünde süper. Pratikte? Göreceğiz. En çok da hassas alanlarda insan kontrolü hâlâ şart.

Neden “büyük” deniyor?

Buradaki büyüklük sadece veri miktarıyla ilgili değil; eğitim süresi, işlem gücü. Mimari karmaşıklığı da işin içine giriyor. Milyarlarca parametreyi eğitmek için ciddi GPU kaynakları gerekiyor. Küçük bir startup için bu maliyet çoğu zaman duvara tosluyor; enterprise tarafta ise bütçe var ama bu sefer de güvenlik. Yönetişim devreye giriyor.

Yani mesele sadece “model kurduk, oldu” değil. Veri kalitesi düşükse sonuçlar da çamura yatıyor. Temiz veriyle beslenen model ile rastgele internet çorbasıyla beslenen model arasındaki fark gece-gündüz gibi. Bu kadar.

Bu modeller nasıl çalışıyor?

Lafı gevelemeden söyleyeyim: LLM’lerin temel numarası sonraki token’ı tahmin etmek. Token dediğimiz şey genelde tek kelime olmak zorunda değil; bazen kelimenin bir parçası oluyor, bazen noktalama işareti bile olabiliyor. Model metni parçalara ayırıyor, sonra bu parçaların birbirine nasıl bağlandığını — hangi kombinasyonların daha olası olduğunu — öğreniyor.

Bunu tren raylarına benzetiyorum ben hep. Bir vagonun ardından hangisinin geleceğini tek tek ezberlemiyor model; rayların hangi yöne kıvrıldığını çözüyor. Hangi istasyonda hangi vagonun daha olası olduğunu hesaplıyor diyelim. Kaba bir benzetme, evet. Ama akılda kalıyor. MCP ve A2A: 2025’te Çok Ajanlı Mimari Neden İkisine de Muhtaç? yazımızda bu konuya da değinmiştik.

Aşama Ne oluyor? Kısaca etkisi
Eğitim verisi Kitaplar, web sayfaları, kodlar ve başka metinler okunuyor Dilin yapısı öğreniliyor
Tokenizasyon Metin küçük parçalara ayrılıyor Model için işlem kolaylaşıyor
Transformer mimarisi Kelimeler arası ilişki ağı kuruluyor Bağlam daha iyi tutuluyor
Tahmin aşaması Sıradaki en olası token seçiliyor Cevap veya metin üretiliyor

Transformer neden bu kadar önemli?

Büyük kırılma noktası burası aslında. Transformer mimarisi sayesinde model cümlenin başını unutup sonuna savrulmuyor; farklı kelimeler arasındaki uzak ilişkileri de takip edebiliyor — valla güzel iş çıkarmışlar —. Eskiden uzun metinlerde bağlam kayması çok olurdu — şimdi hâlâ oluyor ama eskisine göre çok daha az sinir bozucu.

Bunu 2024’te kendi test ortamımda denedim. Aynı paragrafın başına koyduğum kilit detayı model sona doğru nispeten düzgün hatırladıysa “tamam” dedim; ama üç paragraf sonra yine dağılıyorsa notu kırdım, açıkçası. Bu konuyla ilgili Butterfly CSS: 2026’da Dikkat Çeken Hafif Bir Seçenek yazımıza da göz atmanızı tavsiye ederim.

LLM’lerin gücü “ezber” değil; büyük ölçekte örüntü kurma becerisi.
Ama bu güç bazen özgüvenli yanlışlara da dönüşebiliyor.

Lütfen gözünüzü korkutmasın: Nerelerde kullanılıyor?

Büyük dil modelleri bugün yalnızca sohbet robotlarında yok. Kod tamamlama araçlarında varlar, müşteri destek panellerinde varlar, doküman arama sistemlerinde varlar. Hatta içerik ekiplerinin günlük iş akışına sessizce girmiş durumdalar — fark etmeden kullananlar bile var.

Editör masasında buna çok net şahit oldum. İstanbul’da Şubat ayında yaptığımız bir denemede teknik bir haberi önce klasik yöntemle özetledik, sonra aynı işi LLM’e bıraktık. İlk taslak daha hızlı geldi ama ikinci turda insan eli değmeden yayınlanacak kadar güvenilir değildi; birkaç detay düzeltmesi yapmak gerekti. Hız veriyor mu? Evet. Son sözü söylüyor mu? Hayır. OpenAI’nin 100 Dolarlık ChatGPT Pro Paketi Ne Anlatıyor? yazımızda bu konuya da değinmiştik.

Hmm, bunu nasıl anlatsamdı…

Kullanım alanları neler?

  • Müşteri desteği: SSS yanıtları ve ilk seviye destek akışları için işe yarıyor.
  • Kod üretimi: Fonksiyon önerisi, hata açıklaması ve refactor fikri veriyor.
  • İçerik üretimi: Taslak yazılar, başlık önerileri ve özetler hazırlıyor.
  • Eğitim: Konu anlatımı ve soru çözümü için yardımcı rol üstleniyor.
  • Arama deneyimi: Belgelerin içinden anlamlı cevap çıkarmayı kolaylaştırıyor.

Ne yalan söyleyeyim, E tabi her kullanım senaryosu aynı derecede parlak değil. Müşteri desteğinde kısa ve standart yanıtlar gayet iyi çalışırken; hukukta, sağlıkta ya da finansal kararlarda işler çetrefilleşiyor. Bu ne anlama geliyor? Çünkü hata toleransı düşüyor ve “yaklaşık doğru” cevap yetmiyor orada.

Peki neden bazen iyi bazen berbat?

İşin aslı şu: LLM’ler harika görünen ama sınırları olan sistemler. En büyük sorunlardan biri halüsinasyon denen durum — yani model eminmiş gibi yanlış bilgi uydurabilir. Bu kötü alışkanlık özellikle belirsiz sorularda, ya da modelin bilgi tabanında boşluk olan konularda ortaya çıkıyor. PDF Dünyasında Bir Nefes: Ücretsiz ve Limitsiz Araçlar yazımızda bu konuya da değinmiştik.

Açık konuşayım, beni en çok şaşırtan şeylerden biri şu oldu: model doğru tonu yakalayıp yanlış içeriği çok tatlı biçimde servis edebiliyor. Kullanıcı tarafında güven hissi oluşuyor ama içerik gerçeğe uymayabiliyor. Tam da tehlike burada.

Zayıf tarafları neler?

  1. Zaman zaman uydurma cevap verir: Mesela eksik veri varsa risk artar. — bunu es geçmeyin
  2. Maliyetlidir: Büyük modelleri çalıştırmak ucuz değildir.
  3. Tutarlılık sorunu yaşar: Aynı soruya farklı günlerde farklı tonda cevap verebilir.
  4. Eğitim verisine bağımlıdır: Çöp veriyle mucize beklemek boşuna olur.

Bunu yaşayan biri olarak söyleyeyim, Neyse uzatmayalım. İyi prompt yazmak önemli ama tek başına yetmiyor. Modeli mutfağa benzetirseniz prompt tarif oluyor; malzeme kötüyse şef de bir yere kadar toparlıyor işte (en azından benim deneyimim böyle). Kullanıcı tarafında beklentiyi doğru ayarlamak şart. Daha fazla bilgi için OpenRig Neden Doğdu: Ajan Karmaşasına Son Veren Fikir yazımıza bakabilirsiniz.

Küçük startup ile kurumsal ekip aynı şekilde mi kullanmalı?

Bir bakıma, küçük bir startup için LLM genelde hız kazandıran bir kaldıraç. Tek kişilik ya da üç kişilik ekiplerde taslak çıkarma, mail düzenleme. Basit analiz işleri için ciddi fayda sağlıyor. Ama bütçe sınırlıysa API maliyetlerini dikkatle izlemek gerekiyor — çünkü kullanım arttıkça fatura sessizce şişebiliyor.

Çok konuştum, örnekle göstereyim.

Bir arkadaşım İzmir’deki SaaS girişiminde tam da bunu yaşadı. İki ay sonra aylık yapay zekâ faturası beklediğinin iki katına çıkınca istek limitleri koymak zorunda kaldılar. Farkında olmadan düşülen bir tuzak.

Bi saniye — Kurumsal tarafta tablo değişiyor. Orada mesele hızdan çok kontrol: günlük loglama, veri gizliliği, uyumluluk, kim neyi görebilir… Hepsi ayrı dert. Bir de entegrasyon işi var tabii; CRM’den bilgi çekip modele yedirmek kağıt üstünde kolay durur. Pratikte yetkilendirme duvarına çarpabilirsiniz.

Kullanım stratejisi nasıl değişir?

Sahne Küçük Startup Enterprise
Amaç Hızlı çıktı Süreç standardizasyonu
Bütçe Sınırlı Daha yüksek ama kontrollü
Kritik risk Maliyet sürprizi Veri sızıntısı / uyumluluk
Sürdürülebilirlik Ara sıra API kullanımı yeter Mimarinin içine gömme ihtiyacı var

Doğru yerde kullanılan LLM zamandan kazandırır.
Yanlış yerde kullanılırsa sadece pahalı bir oyuncak olur.

LLM yerine neden hâlâ insan lazım?

Yani, Mesele teknolojiye karşı olmak değil. Editoryal doğrulukta insan gözü hâlâ altın değerinde. Model size güzel cümle kurar, hatta ikna edici kurar — ama kaynağın sağlam olup olmadığını her zaman anlayamaz (en azından benim deneyimim böyle)

Ben bunu Nisan 2025’te Ankara’da yapılan küçük bir atölyede tekrar gördüm. Katılımcılardan biri modele eski tarihli haber özeti verdirdi; çıktının dili pürüzsüzdü. Tarihsel sıralamada minik kaymalar vardı. İnsan okuyucu bunu fark ederdi. Model ise geçip gidiyordu.

O yüzden en sağlıklı yaklaşım hibrit kullanım: önce modelden taslak al, sonra uzman gözünden geçir. Bu yöntem özellikle teknik bloglarda, ürün dökümanlarında ve destek süreçlerinde bayağı işe yarıyor.

Birkaç pratik ipucu — LLM kullanırken neye bakmalı?

  • Cevabı doğrudan kopyalamayın; önce kontrol edin.
  • Kritik bilgilerde kaynak isteyin.
  • Aynı soruyu farklı biçimde sorun; tutarlılığı ölçün.
  • Dil tonu gerekiyorsa örnek verin; “resmi yaz”, “samimi yaz”, “kısa tut” gibi.
  • Büyük veri yüklemelerinde gizlilik politikasını mutlaka okuyun.
💡 Bilgi: Eğer modeli kendi şirket verinizle kullanacaksanız, erişim izinleri ve kayıt politikaları en başta net olsun. Sonradan toparlamak çoğu zaman çok daha zor oluyor.

Sıkça Sorulan Sorular

# LLM ile ChatGPT aynı şey mi?

# >

# Hayır,
ChatGPT bir uygulama/arayüzdür;
LLM ise o arayüzün altında çalışan dil modeli ailesidir. Yani araba başka şeydir,
motor başka şey. Kullanıcı çoğu zaman arabayı görür,
kaputu değil. # h3 > LLM eğitmek için kaç veri gerekir? # >

# p > Tek sayı vermek zor çünkü modele göre değişir. Genelde devasa metin koleksiyonları gerekir;
ancak bugün sıfırdan eğitim yapmak yerine hazır modelleri uyarlamak çok daha yaygın. Kısacası, # h3 > Küçük işletmeler LLM’den faydalanabilir mi? Neyse, # >

# p > Evet,
hatta çoğu zaman en hızlı faydayı küçük ekipler görüyor. E-posta taslağı,
müşteri yanıtı
ve içerik özetleme gibi işlerde ciddi vakit kazandırabiliyor. İşte, # h3 > LLM çıktısına ne kadar güvenmeliyim? Neyse, # >

# p > Orta karar güvenebilirsiniz diyeyim;
kritik konularda asla körlemesine güvenmeyin. Neyse, en çok da tarih,
sayı
ve mevzuat içeren cevaplarda mutlaka doğrulama yapın.

# Kaynaklar ve İleri Okuma

# >

OpenAI Research Blogu
#a>

Anthropic Research Sayfası
#a>

Hugging Face Dokümantasyonu
#a>

CI/CD’de Test Katmanı Build’den Sonra Asıl Sınav
#a>

Yazılımı Yapay Zekâya Bırakmak Çok Ajanlı Sistemler
#a>

Aşkın KILIÇ

20+ yıl deneyimli Azure Solutions Architect. Microsoft sertifikalı bulut mimari ve DevOps danışmanı. Azure, yapay zekâ ve bulut teknolojileri üzerine Türkçe teknik içerikler üretiyor.

AZ-305AZ-104AZ-500AZ-400DP-203AI-102

Bu içerik işinize yaradı mı?

Benzer içerikleri kaçırmamak için beni sosyal medyada takip edin.

Haftalık Bülten

Her pazar özenle seçilmiş teknoloji yazıları doğrudan e-postanıza gelsin.

← Onceki Yazi
Instagram Hesabı Kapandıysa Ne Yapmalı? Açma Yolları
Sonraki Yazi →
525 Beygirlik Ariel Atom 4RR: Pist Canavarı Yola Çıkıyor

Yorum Yaz

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haftalık Bülten

Azure, DevOps ve Yapay Zeka dünyasındaki en güncel içerikleri her hafta doğrudan e-postanıza alın.

Spam yok. İstediğiniz zaman iptal edebilirsiniz.
📱
Uygulamayı Yükle Ana ekrana ekle, çevrimdışı oku
Kategoriler
Ara
Paylaş
İçindekiler
← Instagram Hesabı Kapandıysa Ne...
525 Beygirlik Ariel Atom 4RR: ... →
📩

Gitmeden önce!

Her pazar özenle seçilmiş teknoloji yazıları ve AI haberleri doğrudan e-postanıza gelsin. Ücretsiz, spam yok.

🔒 Bilgileriniz güvende. İstediğiniz zaman ayrılabilirsiniz.

📬 Haftalık bülten: Teknoloji + AI haberleri