Yapay zekâ cephesinde son iki yılda en çok konuştuğumuz şey modelin kendisiydi (bizzat test ettim). Herkes mimarı yarışından, parametre sayısından, benchmark karşılaştırmalarından dem vurdu. Ama işin arka planına biraz yakından bakarsanız —. Ben bu sektörü uzun yıllardır izliyorum, inanın bakıyorum — asıl kıymetin çoğu zaman modelde değil, önü besleyen veride olduğunu görüyorsunuz. AfterQuery tam da bu noktada sahneye çıkıyor: kodlama. Finans odaklı eğitim verisi satıyor, AI laboratuvarlarına veri sağlıyor ve görünüşe bakılırsa bu işi bayağı iyi paraya çevirmiş durumda.
Forbes’tan gelen habere göre şirket birkaç ay önce 30 milyon dolarlık Seri A türü kapatmış, değerlemesi 300 milyon dolara ulaşmış, yıllık gelir çalışması da 100 milyon doların üstüne çıkmış. Kağıt üstünde fena değil. Hatta açık konuşayım — veri altyapısı tarafında bu kadar hızlı büyüyen şirket sayısı gerçekten az, nadir görülen bir tempo bu.
Evet, doğru duydunuz.
Ben bu haberi editör masasında okurken aklıma geçen yıl İstanbul’da bir girişim ekibiyle yaptığım sohbet geldi (ben de ilk duyduğumda şaşırmıştım). Adamlar modeli değil, veri boru hattını çözmeye uğraşıyordu. Çünkü model ne kadar parlak olursa bir düşüneyim… olsun, kötü veriyle beslenince ortaya çıkan şey biraz cilalı çorba oluyor (bizzat test ettim). AfterQuery’nın hikâyesi de bana tam bunu hatırlattı (buna dikkat edin)
Asıl ürün model değil, modelin yediği yem
Şahsen, Herkes büyük dil modellerini konuşuyor. Tamam, anlıyorum. Ama gerçekte o modellerin iyi çalışmasını sağlayan şey temiz, doğru etiketlenmiş ve işe yarar veri — bu kadar basit, bu kadar temel. AfterQuery’nın yaptığı iş de burada başlıyor: özellikle kodlama ve finans gibi yüksek değerli alanlarda eğitim verisi sağlıyor. Yani öyle “herkese uyan genel içerik” değil, daha niş ve daha pahalı bir malzeme satıyor.
Şöyle bir mutfak benzetmesi yapayım. Aynı aşçıya aynı tencereyi verirsiniz; içine koyduğunuz et başka, sebze başka… sonuç bambaşka ölür. Büyük AI laboratuvarları da tam bunu yaşıyor: iyi mimarı tek başına yetmiyor, kaliteli veri yoksa performans duvara çarpıyor. Nokta.
Gel gelelim burada romantik bir tablo da yok. Veri işi dışarıdan bakınca kolay görünüyor ama öyle değil; kalite kontrolü zor, maliyetli. Çoğu zaman insan emeğine yaslanıyor, hele ki uzmanlık gerektiren alanlarda bu emek daha da ağırlaşıyor. Ben 2023’te Ankara’daki küçük bir SaaS projesinde buna çok yakın bir sorun görmüştüm (yanlış duymadınız). Veriyi hızlı topladılar. Ama sınıflandırma dağıldığı için model çıktıları resmen kendi kendine kavga ediyordu. Üzücüydü açıkçası.
Neden özellikle kodlama ve finans?
Açık konuşayım, Çünkü bu iki alan ölçülebilirlik açısından fena hâlde sert. Kodda doğru-yanlış çizgisi nettir; finans tarafında işe sayılar sızı kolay kolay affetmez. Bu yüzden bu alanlara özel eğitim verisi üretmek daha zahmetli —. Aynı zamanda daha değerli oluyor, piyasa da buna göre fiyatlıyor zaten. Kodunu Gerçekten Tanıyan Yerel Yapay Zekâ: LeanAI Ne Vaat Ediyor? yazımızda bu konuya da değinmiştik.
Hmm, bunu nasıl anlatsamdı… Bu konuyla ilgili Apple’ın Maç Çıkışı: Q1 2026’da Yüzde 9 Sıçrama yazımıza da göz atmanızı tavsiye ederim.
Bir de şu var: Genel web verisi artık bolca mevcut ama temiz, “işe yarar” veri kıtlaştı. AI şirketleri birbirine benzeyen devasa metin yığınlarını değil, doğrudan belirli görevlerde fark yaratacak örnekleri istiyor. Bu ne anlama geliyor? AfterQuery’nın pazarı biraz da burada büyüyor sanırım — tabii yanilıyor da olabilirim, ama gidişat öyle gösteriyor.
Yapay zekâ yarışında artık yalnızca en büyük modeli yapan kazanmayacak; en iyi veriyi toplayan, temizleyen ve paketleyen de ciddi avantaj alacak.
300 milyon dolarlık değerleme ne anlatıyor?
Açık konuşayım: sadece “veri satan şirket” diyerek geçmek haksızlık ölür. Çünkü yatırımcıların gözünde bu tıp şirketler artık sıradan hizmet sağlayıcı gibi görünmüyor. Onlar yapay zekânın temel girdisini kontrol eden oyuncular olarak değerlendiriliyor. Yani petrol benzetmesi klişe gelebilir — biliyorum, çok kullanıldı bu metafor —. Neden önemli bu? Burada azıcık doğruluk payı var, inkâr edemem (şaşırtıcı ama gerçek)
30 milyon dolarlık Seri A ile 300 milyon dolar değerleme arasındaki oran piyasaya güven sinyali veriyor. Tabii her yüksek değerleme sağlam zemin demek değildir… bazen piyasa heyecanı biraz fazla gaz verebiliyor, bunu da yaşadık defalarca. Ama yıllık gelir çalışmasının 100 milyon dolar üstüne çıkması boş laf olmadığını gösteriyor — bence çok yerinde bir karar —. Rakam konuşuyor. PDF Dünyasında Bir Nefes: Ücretsiz ve Limitsiz Araçlar yazımızda bu konuya da değinmiştik.
Küçük startup tarafında bu haberin anlamı başka, kurumsal tarafta bambaşka okunur. Mantıklı değil mi? Startup için mesaj şu: “Niş veri işi hâlâ para ediyor.” Kurumsal içinse mesaj daha sert: “Veri tedarik zincirinizi başkasına kaptırırsanız pahalıya patlayabilir.”
Büyüme hızı neden dikkat çekiyor?
Birkaç ay önce para toplayıp kısa sürede böyle bir gelir temposuna yaklaşmak kolay iş değil. Hele ki AI sektöründe rekabet böylesine yoğunken. Bu hız bana geçen sene Berlin’de dinlediğim bir sunumu hatırlattı; ekip “veri teslim süresi kısaldıkça müşteri bağlılığı artıyor” diyordu, (buna dikkat edin). Gerçekten haklıydılar — basit ama sağlam bir gözlem o.
Size bir şey söyleyeyim, AfterQuery’nın yükselişi muhtemelen sadece satış başarısından gelmiyor (ben de ilk duyduğumda şaşırmıştım). Doğru müşteri grubuna, doğru formatta ürün vermekten geliyor olabilir. Yani tek tek dataset satmak yerine kurumsal müşterinin pipeline’ına oturan bir sistem kuruyorsanız işler değişiyor — müşteri çıkamaz, siz de büyürsünüz. Klasik bir yapı aslında ama bu sektörde uygulamak zor. Bu konuyla ilgili AI Builder ile Üretilen Uygulama: Güvenilir Altyapı Neden Şart? yazımıza da göz atmanızı tavsiye ederim.
Peki risk nerede? Her parlak işin gölgesi ölür
Yani, Lafı gevelemeden söyleyeyim. Veri satışı kulağa şık gelse de hukukî ve etik tarafı bayağı hassas. En çok da de kodlama verisinde telif tartışmaları henüz bitmemişken bu alanda çalışan firmaların her adımı dikkatle atması gerekiyor. Attıkları sanmıyorum da — ama umuyorum. Bu konuyla ilgili Butterfly CSS: 2026’da Dikkat Çeken Hafif Bir Seçenek yazımıza da göz atmanızı tavsiye ederim.
Finans verisi işe başka bir mayın tarlası; hem gizlilik hem regülasyon hem de doğruluk baskısı aynı anda üstünüze çöküyor. Yanlış veya eksik hazırlanmış bir dataset sadece modeli bozmaz, müşterinin itibarını da yerle bir edebilir — işte asıl sıkıntı orada başlıyor zaten.
Editör olarak şunu net söyleyebilirim: Benzer iş modelleri ilk bakışta çok sağlam görünür. Sürdürülebilirlik testi var ya — asıl sınav orada başlar. Bir arkadaşım Londra’da çalışan küçük bir ML ekibinde buna benzer şekilde dataset almıştı; ilk hafta herkes mutluydu, ama üçüncü haftada kalite dalgalanınca bütün entegrasyon planları yeniden yazıldı. Masraf, zaman, sınır… hepsi bir arada.
| Alan | Avantaj | Zorluk |
|---|---|---|
| Kodlama verisi | Ölçmesi kolay, çıktı net | Telif sorunları, hızla eskiyen örnekler |
| Finans verisi | Yüksek değer, kurumsal talep güçlü | Regülasyon baskısı, gizlilik gereksinimleri |
Kod bloğu gibi düşünecek olursak…
Bazı şirketler AI’yi doğrudan ürün diye anlatır. Bazıları işe ürünü altyapıda saklar — benim gözümde asıl akıllılık orada. Mesela şöyle düşünün:
# Basit mantık:
# Model + kaliteli veri + sürekli geri bildirim = daha az hata
if data_quality == "yüksek":
output = "işe yarar sonuç"
else:
output = "gösterişli ama sorunlu sonuç"
E tabi gerçek hayatta formül bundan çok daha karmaşık. Ama fikir basit kalıyor — ve bence basit kalmak zorunda da.
Küçük startup için böyle firmalar hazır kaldıraç demek olabilir; sıfırdan ekip kurmadan güçlü bir training set’e erişiyorsunuz, ciddi zaman kazanıyorsunuz. Enterprise seviyede işe mesele satın alma değil — denetim yapısı oluyor. Kimden alındı? Nasıl etiketlendi? Hangi ülkede işlendi? Bu soruların cevabı net değilse bütçe harcamak bile riskli hâle geliyor (ki bu çoğu kişinin gözünden kaçıyor). Bazen en pahalı hata en başta soruyu sormamak oluyor — valla güzel iş çıkarmışlar —
Piyasaya verdiği mesaj ne?
AfterQuery’nın bu büyüme rakamları sektöre şunu söylüyor: Veri katmanı hem değerli hem de az oyunculu. Model tarafı kalabalık — OpenAI var, Anthropıc var, Google var, onlarca açık kaynak alternatif var. Ama kaliteli, niş, denetlenmiş veri üreten firma sayısı hâlâ az. Bu boşluk para demek.
Şöyle söyleyeyim, Neyse, çok uzattım. Şunu söyleyeyim: Bu haber benim için sadece bir şirketin başarı hikâyesi değil. Yapay zekâ ekosisteminde gerçek değerin nerede biriktiğine dair bir sinyal. Model yarışı sürüyor, evet. Ama sahne arkasında veriyi kim kontrol ediyorsa uzun vadede o kazanacak gibi görünüyor — en azından şimdilik öyle düşünüyorum.
Sıkça Sorulan Sorular
AfterQuery gibi şirketler neden “model” yerine “veri” satıyor?
Çünkü büyük dil modellerinin performansı çoğu zaman mimariden çok, onları besleyen verinin kalitesine bağlı. Yanlış etiketlenmiş ya da tutarsız veri, modelin çıktısını daha baştan “sistematik” şekilde bozabiliyor. Özellikle kodlama ve finans gibi alanlarda bu etki daha da sert hissediliyor.
Kaliteli eğitim verisi tam olarak ne demek?
Temelde doğru kapsam, tutarlı etiketleme ve alan uzmanlığıyla doğrulanmış örnekler demek. Veri sadece “çok” olunca iyi olmuyor; dağılımı, zorluk seviyesi ve hata türleri dengeli olmalı. Benzer bir sorunu daha önce küçük bir SaaS ekibinde de görmüştüm: veri hızlı toplanmış ama sınıflandırma dağılmış, model çıktıları adeta kendi kendine çelişmeye başlamıştı.
Kodlama ve finans için özel veri üretimi neden daha zor ve pahalı?
Kodda doğru-yanlış çizgisi nettir ama doğruyu üretmek ve doğrulamak emek ister. Finans tarafında işe “yanlış” sadece teorik hata değil; sayısal tutarlılık ve bağlam uyumu gibi kriterler yüzünden daha sıkı denetim gerekir. Bu yüzden uzman insan emeği ve daha kapsamlı kalite kontrol süreçleri devreye girer.
Veri altyapısı kurmak, eğitimden daha mı kritik?
Birçok ekipte evet; özellikle üretime yakın senaryolarda veri boru hattı (toplama, temizlik, etiketleme, doğrulama) doğrudan maliyet ve kaliteyi belirler. Modeli değiştirmek nispeten hızlı olabilir ama veriyi düzeltemezseniz iyileştirmeler sınırlı kalır. Benim gözlemim, uzun vadede yatırımın en hızlı geri döndüğü yerlerin başında veri süreçleri geliyor.
Bu yaklaşım yapay zekâ projelerinde nasıl bir fark yaratıyor?
Kaliteli, alan odaklı veriyle eğitim yapan sistemler daha tutarlı davranır ve hata türleri azalır. Sonuç olarak hem değerlendirmelerde hem de gerçek kullanımda “beklenmedik” sapmalar daha az görülür. Ayrıca doğru veri, modelin güncellenmesi ve iyileştirilmesi sırasında daha öngörülebilir bir yol haritası sağlar.
Kaynaklar ve İleri Okuma
Azure OpenAI modelleri ve temel kavramlar
OpenAI kavramları: veri ve kullanım prensipleri
openai/evals (model değerlendirme ve kalite ölçümü)
Azure AI için kaynaklar ve referans dokümanlar
Bu içerik işinize yaradı mı?
Benzer içerikleri kaçırmamak için beni sosyal medyada takip edin.



