Yapay zekâ cephesinde son iki yılda en çok konuştuğumuz şey modelin kendisiydi (bizzat test ettim). Herkes mimari yarışından, parametre sayısından, benchmark karşılaştırmalarından dem vurdu. Ama işin arka planına biraz yakından bakarsanız —. Ben bu sektörü uzun yıllardır izliyorum, inanın bakıyorum — asıl kıymetin çoğu zaman modelde değil, onu besleyen veride olduğunu görüyorsunuz. AfterQuery tam da bu noktada sahneye çıkıyor: kodlama. Finans odaklı eğitim verisi satıyor, AI laboratuvarlarına veri sağlıyor ve görünüşe bakılırsa bu işi bayağı iyi paraya çevirmiş durumda.
Forbes’tan gelen habere göre şirket birkaç ay önce 30 milyon dolarlık Seri A turu kapatmış, değerlemesi 300 milyon dolara ulaşmış, yıllık gelir çalışması da 100 milyon doların üstüne çıkmış. Kağıt üstünde fena değil. Hatta açık konuşayım — veri altyapısı tarafında bu kadar hızlı büyüyen şirket sayısı gerçekten az, nadir görülen bir tempo bu.
Evet, doğru duydunuz.
Ben bu haberi editör masasında okurken aklıma geçen yıl İstanbul’da bir girişim ekibiyle yaptığım sohbet geldi (ben de ilk duyduğumda şaşırmıştım). Adamlar modeli değil, veri boru hattını çözmeye uğraşıyordu. Çünkü model ne kadar parlak olursa bir düşüneyim… olsun, kötü veriyle beslenince ortaya çıkan şey biraz cilalı çorba oluyor (bizzat test ettim). AfterQuery’nin hikâyesi de bana tam bunu hatırlattı (buna dikkat edin)
Asıl ürün model değil, modelin yediği yem
Şahsen, Herkes büyük dil modellerini konuşuyor. Tamam, anlıyorum. Ama gerçekte o modellerin iyi çalışmasını sağlayan şey temiz, doğru etiketlenmiş ve işe yarar veri — bu kadar basit, bu kadar temel. AfterQuery’nin yaptığı iş de burada başlıyor: özellikle kodlama ve finans gibi yüksek değerli alanlarda eğitim verisi sağlıyor. Yani öyle “herkese uyan genel içerik” değil, daha niş ve daha pahalı bir malzeme satıyor.
Şöyle bir mutfak benzetmesi yapayım. Aynı aşçıya aynı tencereyi verirsiniz; içine koyduğunuz et başka, sebze başka… sonuç bambaşka olur. Büyük AI laboratuvarları da tam bunu yaşıyor: iyi mimari tek başına yetmiyor, kaliteli veri yoksa performans duvara çarpıyor. Nokta.
Gel gelelim burada romantik bir tablo da yok. Veri işi dışarıdan bakınca kolay görünüyor ama öyle değil; kalite kontrolü zor, maliyetli. Çoğu zaman insan emeğine yaslanıyor, hele ki uzmanlık gerektiren alanlarda bu emek daha da ağırlaşıyor. Ben 2023’te Ankara’daki küçük bir SaaS projesinde buna çok yakın bir sorun görmüştüm (yanlış duymadınız). Veriyi hızlı topladılar. Ama sınıflandırma dağıldığı için model çıktıları resmen kendi kendine kavga ediyordu. Üzücüydü açıkçası.
Neden özellikle kodlama ve finans?
Açık konuşayım, Çünkü bu iki alan ölçülebilirlik açısından fena halde sert. Kodda doğru-yanlış çizgisi nettir; finans tarafında ise sayılar sizi kolay kolay affetmez. Bu yüzden bu alanlara özel eğitim verisi üretmek daha zahmetli —. Aynı zamanda daha değerli oluyor, piyasa da buna göre fiyatlıyor zaten. Kodunu Gerçekten Tanıyan Yerel Yapay Zekâ: LeanAI Ne Vaat Ediyor? yazımızda bu konuya da değinmiştik.
Hmm, bunu nasıl anlatsamdı… Bu konuyla ilgili Apple’ın Mac Çıkışı: Q1 2026’da Yüzde 9 Sıçrama yazımıza da göz atmanızı tavsiye ederim.
Bir de şu var: Genel web verisi artık bolca mevcut ama temiz, “işe yarar” veri kıtlaştı. AI şirketleri birbirine benzeyen devasa metin yığınlarını değil, doğrudan belirli görevlerde fark yaratacak örnekleri istiyor. Bu ne anlama geliyor? AfterQuery’nin pazarı biraz da burada büyüyor sanırım — tabii yanılıyor da olabilirim, ama gidişat öyle gösteriyor.
Yapay zekâ yarışında artık yalnızca en büyük modeli yapan kazanmayacak; en iyi veriyi toplayan, temizleyen ve paketleyen de ciddi avantaj alacak.
300 milyon dolarlık değerleme ne anlatıyor?
Açık konuşayım: sadece “veri satan şirket” diyerek geçmek haksızlık olur. Çünkü yatırımcıların gözünde bu tip şirketler artık sıradan hizmet sağlayıcı gibi görünmüyor. Onlar yapay zekânın temel girdisini kontrol eden oyuncular olarak değerlendiriliyor. Yani petrol benzetmesi klişe gelebilir — biliyorum, çok kullanıldı bu metafor —. Neden önemli bu? Burada azıcık doğruluk payı var, inkâr edemem (şaşırtıcı ama gerçek)
30 milyon dolarlık Seri A ile 300 milyon dolar değerleme arasındaki oran piyasaya güven sinyali veriyor. Tabii her yüksek değerleme sağlam zemin demek değildir… bazen piyasa heyecanı biraz fazla gaz verebiliyor, bunu da yaşadık defalarca. Ama yıllık gelir çalışmasının 100 milyon dolar üstüne çıkması boş laf olmadığını gösteriyor — bence çok yerinde bir karar —. Rakam konuşuyor. PDF Dünyasında Bir Nefes: Ücretsiz ve Limitsiz Araçlar yazımızda bu konuya da değinmiştik.
Küçük startup tarafında bu haberin anlamı başka, kurumsal tarafta bambaşka okunur. Mantıklı değil mi? Startup için mesaj şu: “Niş veri işi hâlâ para ediyor.” Kurumsal içinse mesaj daha sert: “Veri tedarik zincirinizi başkasına kaptırırsanız pahalıya patlayabilir.”
Büyüme hızı neden dikkat çekiyor?
Birkaç ay önce para toplayıp kısa sürede böyle bir gelir temposuna yaklaşmak kolay iş değil. Hele ki AI sektöründe rekabet böylesine yoğunken. Bu hız bana geçen sene Berlin’de dinlediğim bir sunumu hatırlattı; ekip “veri teslim süresi kısaldıkça müşteri bağlılığı artıyor” diyordu, (buna dikkat edin). Gerçekten haklıydılar — basit ama sağlam bir gözlem o.
Size bir şey söyleyeyim, AfterQuery’nin yükselişi muhtemelen sadece satış başarısından gelmiyor (ben de ilk duyduğumda şaşırmıştım). Doğru müşteri grubuna, doğru formatta ürün vermekten geliyor olabilir. Yani tek tek dataset satmak yerine kurumsal müşterinin pipeline’ına oturan bir sistem kuruyorsanız işler değişiyor — müşteri çıkamaz, siz de büyürsünüz. Klasik bir yapı aslında ama bu sektörde uygulamak zor. Bu konuyla ilgili AI Builder ile Üretilen Uygulama: Güvenilir Altyapı Neden Şart? yazımıza da göz atmanızı tavsiye ederim.
Peki risk nerede? Her parlak işin gölgesi olur
Yani, Lafı gevelemeden söyleyeyim. Veri satışı kulağa şık gelse de hukuki ve etik tarafı bayağı hassas. En çok da de kodlama verisinde telif tartışmaları henüz bitmemişken bu alanda çalışan firmaların her adımı dikkatle atması gerekiyor. Attıkları sanmıyorum da — ama umuyorum. Bu konuyla ilgili Butterfly CSS: 2026’da Dikkat Çeken Hafif Bir Seçenek yazımıza da göz atmanızı tavsiye ederim.
Finans verisi ise başka bir mayın tarlası; hem gizlilik hem regülasyon hem de doğruluk baskısı aynı anda üstünüze çöküyor. Yanlış veya eksik hazırlanmış bir dataset sadece modeli bozmaz, müşterinin itibarını da yerle bir edebilir — işte asıl sıkıntı orada başlıyor zaten.
Editör olarak şunu net söyleyebilirim: Benzer iş modelleri ilk bakışta çok sağlam görünür. Sürdürülebilirlik testi var ya — asıl sınav orada başlar. Bir arkadaşım Londra’da çalışan küçük bir ML ekibinde buna benzer şekilde dataset almıştı; ilk hafta herkes mutluydu, ama üçüncü haftada kalite dalgalanınca bütün entegrasyon planları yeniden yazıldı. Masraf, zaman, sinir… hepsi bir arada.
| Alan | Avantaj | Zorluk |
|---|---|---|
| Kodlama verisi | Ölçmesi kolay, çıktı net | Telif sorunları, hızla eskiyen örnekler |
| Finans verisi | Yüksek değer, kurumsal talep güçlü | Regülasyon baskısı, gizlilik gereksinimleri |
Kod bloğu gibi düşünecek olursak…
Bazı şirketler AI’yi doğrudan ürün diye anlatır. Bazıları ise ürünü altyapıda saklar — benim gözümde asıl akıllılık orada. Mesela şöyle düşünün:
# Basit mantık:
# Model + kaliteli veri + sürekli geri bildirim = daha az hata
if data_quality == "yüksek":
output = "işe yarar sonuç"
else:
output = "gösterişli ama sorunlu sonuç"
E tabi gerçek hayatta formül bundan çok daha karmaşık. Ama fikir basit kalıyor — ve bence basit kalmak zorunda da.
Küçük startup için böyle firmalar hazır kaldıraç demek olabilir; sıfırdan ekip kurmadan güçlü bir training set’e erişiyorsunuz, ciddi zaman kazanıyorsunuz. Enterprise seviyede ise mesele satın alma değil — denetim yapısı oluyor. Kimden alındı? Nasıl etiketlendi? Hangi ülkede işlendi? Bu soruların cevabı net değilse bütçe harcamak bile riskli hale geliyor (ki bu çoğu kişinin gözünden kaçıyor). Bazen en pahalı hata en başta soruyu sormamak oluyor — valla güzel iş çıkarmışlar —
Piyasaya verdiği mesaj ne?
AfterQuery’nin bu büyüme rakamları sektöre şunu söylüyor: Veri katmanı hem değerli hem de az oyunculu. Model tarafı kalabalık — OpenAI var, Anthropic var, Google var, onlarca açık kaynak alternatif var. Ama kaliteli, niş, denetlenmiş veri üreten firma sayısı hâlâ az. Bu boşluk para demek.
Şöyle söyleyeyim, Neyse, çok uzattım. Şunu söyleyeyim: Bu haber benim için sadece bir şirketin başarı hikâyesi değil. Yapay zekâ ekosisteminde gerçek değerin nerede biriktiğine dair bir sinyal. Model yarışı sürüyor, evet. Ama sahne arkasında veriyi kim kontrol ediyorsa uzun vadede o kazanacak gibi görünüyor — en azından şimdilik öyle düşünüyorum.
Bu içerik işinize yaradı mı?
Benzer içerikleri kaçırmamak için beni sosyal medyada takip edin.



