Bulut Bilişim

Claude Code Gateway: Kurumsal Erişimde Fark Yaratan Katman

Geçen ay Şişli’de bir startup ekibinin toplantısına denk geldim. Herkes Claude Code’a bayılıyor, kimse faturanın nasıl şiştiğini net anlatamıyor. İşin özü şu: üretken yapay zekâ tarafında asıl problem çoğu zaman modelin kalitesi değil — kontrolsüz kullanım. Anthony Max’in öne çıkardığı “gateway” yaklaşımı tam da bu yüzden ilginç geliyor bana; ekipler için maliyeti görünür kılıyor, istekleri dizginliyor. Her şeyi merkezi bir noktadan yönetmeye olanak tanıyor.

Peki, açık konuşayım. Ben bu tür araçlara ilk başta mesafeli yaklaşırım. 2023’te kendi yan projelerimde benzer bir katman kurmaya çalışmıştım; basit rate limit ile işi çözerim diye düşünüyordum, ama token maliyeti başka taraftan patladı. Yani “kaç istek geldi” diye bakmak yetmiyor. Kim geldi, ne kadar kullandı, hangi takım yaktı, hangi endpoint gereksiz konuştu — bunların hepsi önemli, hepsine bakman lazım.

Durun, bir saniye.

Neden bir gateway’e ihtiyaç duyuluyor?

Kurumsal tarafta Claude Code gibi araçlar tek kişilik oyuncak olmaktan çıkınca tablo değişiyor. Bir ekip düşünün: ürün yöneticisi deneme yapıyor, geliştirici kod üretiyor, QA aynı akışları tekrar tekrar tetikliyor… Ay sonu geliyor. Finans soruyor: “Bu rakam nereden çıktı?” Hani klasik bulut hikâyesi var ya — aynen o.

Gateway dediğimiz şey aslında araya giren bir trafik polisi gibi çalışıyor. Ama polis deyince sakın sert bir şey canlandırma aklında; daha çok kontrollü kavşak düzeni gibi. Kim ne kadar çağrı yapacak, hangi model kullanılacak, günlük kota ne olacak — bunlar merkezden yönetiliyor. Küçük ekipte belki idare eder, enterprise seviyede bu katman neredeyse şart.

Bir de güvenlik boyutu var. API anahtarlarını her geliştiricinin makinesine saçıp “aman dikkat edin” demek artık eski usul. Ben bunu geçen sene Kadıköy’de görüştüğüm orta ölçekli bir yazılım evinde bizzat duydum — tek bir anahtar sızsa tüm bütçe iki günde uçabiliyor. Güzel özellik, ham bırakılırsa can yakar.

Maliyet takibi neden sadece rapor değil?

Bilmem anlatabiliyor muyum, Çoğu kişi cost tracking’i Excel’e düşen sayılar sanıyor (bizzat test ettim). Değil. Aslında davranış analizi gibi çalışıyor bu iş — hangi takımın hangi saatte yoğunlaştığını görüyorsun, hangi otomasyonun gereksiz konuştuğunu fark ediyorsun, hatta bazen botların insanlardan daha çok kredi yediğini görünce küçük çaplı şok yaşıyorsun. Evet, cidden oluyor.

Bu noktada iyi bir gateway sana sadece toplam harcamayı vermemeli; takım bazlı dağılım da göstermeli. Pazarlama ekibi içerik üretimi için modeli kullanıyorsa ayrı etiketlenmeli, mühendislik ekibi debug için ayrı izlenmeli. Aksi halde herkes birbirini suçlamaya başlıyor ve o meşhur toplantı uzadıkça uzuyor… tanıdık değil mi?

Durun, bir saniye.

💡 Bilgi: İyi bir gateway’de ideal olan şey yalnızca “kaç token gitti” bilgisini göstermek değil; bunu ekip, proje, kullanıcı ve zaman penceresi bazında ayırabilmek.

Küçük ekip için ne işe yarar?

Küçük startup’larda avantaj net: birkaç saat içinde görünürlük sağlanıyor, bütçe sürprizi azalıyor. Geliştirici sayısı az olduğu için kurulum karmaşası da fazla büyümüyor. Ama dürüst olayım — fazla bürokrasi ters tepebiliyor bu tip ekiplerde, çok sıkı limit koyarsan insanlar çözümü dolambaçlı yollarla aşmaya başlıyor zaten.

Bunu Mart 2024’te İzmir’den çalışan iki kişilik bir ürün ekibinde gördüm. Önce her şey düzgün gidiyordu. Sonra biri test ortamını canlıya bağlamış gibi davranınca fatura küçük çapta uçtu. O gün anladım ki ölçmediğin şeyi yönetemiyorsun; hele AI tüketimi söz konusuysa hiç yönetemiyorsun. Daha fazla bilgi için YouTube TV’de 90 Saniyelik Reklam Şoku: Neler Oluyor? yazımıza bakabilirsiniz.

Büyük organizasyonda durum neden farklı?

İtiraf edeyim, Enterprise tarafta mesele yalnızca para değil. Uyumluluk da var, loglama da var, erişim politikaları da var. Bir banka ya da büyük perakende şirketinde kim neyi neden çağırdı sorusunun cevabı tutulmazsa işler karışır — denetçi gelir, güvenlik ekibi gelir, finans gelir… masa kalabalıklaşır. Daha fazla bilgi için iOS 26.4.1 sessiz geldi ama iki kritik şey değişti yazımıza bakabilirsiniz.

İşte gateway burada merkezi sinir sistemi gibi çalışıyor (buna dikkat edin). Trafiği kesmeden düzenliyor, ama aynı zamanda geriye dönük iz bırakıyor. Bu izler sayesinde hangi agent’ın verimsiz davrandığı anlaşılabiliyor ve optimizasyon yapılabiliyor. Fena iş değil yani.

Senaryo Küçük Startup Enterprise
Maliyet görünürlüğü Temel seviye yeterli olabilir Ekip/proje/kullanıcı kırılımı şart
Rate limiting Sert olmayan limitler iş görür Kota + politika + istisna yönetimi gerekir
Güvenlik Anahtar saklama odakta olur SAM/SSO/log denetimi öne çıkar

Rate limiting gerçekten neyi çözüyor?

Lafı gevelemeden söyleyeyim. Rate limiting olmadan AI servisleri kısa sürede ortak musluk gibi oluyor — herkes açıyor, su bitiyor. E peki, sonuç ne oldu? Ama şunu da ekleyeyim: bu mekanizma kötü niyetliyi engellemekten önce yanlış konfigüre edilmiş otomasyonları dizginliyor bence.

Bir şey dikkatimi çekti: Bazen sorun saldırı değildir. Sadece aşırı heveslidir. Bir geliştirici debug sırasında döngüyü açık unutuyor mesela — gece boyunca binlerce istek gidiyor. Sabah kahvesiyle gelen grafik pek iç açıcı olmuyor. Benzer sahneyi Nisan 2024’te Berlin’den çalışan uzaktan ekipte gördüm; küçük hata, büyük fatura.

Kurumsal yapay zekâ kullanımında rate limiting yalnızca hız sınırı değildir; bütçe koruması, hizmet sürekliliği ve ekip disiplininin tek pakette toplanmış hâlidir.

Peki böyle bir sistem nasıl kurgulanmalı?

Bence iyi bir kurgu üç parçaya dayanıyor: kimlik doğrulama, politika motoru ve gözlemlenebilirlik. Kim geldiğini biliyorsan kural uygulamak kolaylaşıyor. Politika motoru ile kimi durduracağını ya da yavaşlatacağını seçiyorsun. Gözlemlenebilirlik ise tüm oyunun kamera arkası… Daha fazla bilgi için Butterfly CSS: 2026’da Dikkat Çeken Hafif Bir Seçenek yazımıza bakabilirsiniz.

{
"tenant": "product-team",
"user": "ayse",
"model": "claude-code",
"limits": {
"rpm": 30,
"daily_tokens": 120000,
"burst_window_sec": 60
},
"tracking": ["team", "project", "request_type"]
}

Bunu görünce bazıları “bu kadar detay fazla mı?” diye soruyor. Kısmen evet. Hızlı prototip aşamasındaysan basit tutmak mantıklı — katılıyorum. Ama kullanım büyüyorsa ilk gün sade görünen yapı altıncı haftada çöpe dönüyor. İşin acı tarafı tam da bu.

Neleri kaçırmamalısınız?

  • Kullanıcı bazlı kota tanımları
  • Ekip/proje etiketleme zorunluluğu — bunu es geçmeyin
  • Anlık alarm mekanizmaları
  • Acil durumda devre dışı bırakma anahtarı
  • Aylık maliyet raporu yerine günlük trend takibi

Tam olarak nerede hayal kırıklığı yaşanabilir?

Açık konuşayım. Her gateway çözümü mucize değil. Bazıları harika sunuluyor ama pratikte ayaru ağır geliyor. Bazıları ucuz ama raporlama kısmı zayıf. Benim en çok canımı sıkan nokta genelde dokümantasyon oluyor — güzel görünen araç iki örnek JSON’dan sonra dağılıyor. Orada biraz hayal kırıklığı yaşadığımı söylemeliyim, evet.

Doğrusu, Buna rağmen doğru yerde kullanıldığında faydası net hissediliyor. Mesela de LLM maliyetlerinin görünmez olduğu şirketlerde böyle ara katmanlar nefes aldırıyor. Daha önce yayımladığımız “LLM maliyeti neden görünmez olur? OpenTelemetry ile çözüm:” yazısında anlattığımız gözlemlenebilirlik meselesiyle de birebir örtüşüyor zaten. İran’ın Kripto Ticareti: Hürmüz’den Geçen Yeni Yol yazımızda bu konuya da değinmiştik. Bu konuyla ilgili PDF Dünyasında Bir Nefes: Ücretsiz ve Limitsiz Araçlar yazımıza da göz atmanızı tavsiye ederim.

Nerede değer yaratır, nerede gereksiz kalır?

Haftada birkaç kez Claude Code kullanan küçük bir ekipseniz fazla karmaşık altyapıya gerek yok. Basit kota, temel loglama, bir de uyarı sistemi çoğu zaman yeter. Yeter mi? Yeter. Ama onlarca geliştiriciniz varsa, test otomasyonları sürekli çalışıyorsa, agent tabanlı görevler devreye girdiyse iş değişiyor — kökten değişiyor.

Büyük resimde bakınca gateway aslında maliyet kontrolünden ibaret değil. Erişim disiplini sağlıyor, takımlar arasında adalet duygusu oluşturuyor ve en önemlisi “neden bu kadar harcadık?” sorusunu teknik veriyle cevaplıyor. Bu arada geçen hafta Beyoğlu’nda oturduğum kafede not alırken tam buna benzeyen bir tartışma duydum; finops ekibiyle mühendislik aynı dili konuşmuyordu. Tanıdık sahne.

Daha önce “Ajanlar Artık İş Yapıyor: API Kullanan Görev Motoru:” yazısını okuyanlar hatırlayacaktır; ajan sayısı arttıkça kontrol ihtiyacı da katlanarak büyüyor. Bir de “Claude Code’u Kanban’a Bağlayan Açık Kaynak Köprü:” gibi entegrasyon senaryolarını düşününce konu iyice netleşiyor. Ara katman yoksa işler kolayca kaosa kayabiliyor.

Sıkça Sorulan Sorular

Claude Code Gateway tam olarak ne işe yarar?

Garip gelecek ama, Ekiplerin Claude Code kullanımını merkezi şekilde yönetir. Maliyet takibi rate limiting ve erişim kontrolünü tek noktadan sağlar. Böylece hem bütçe hem güvenlik daha rahat kontrol edilir.

Küçük startup’larda buna gerçekten ihtiyaç var mı?

Eğer kullanım seyrekse şart olmayabilir. Ama AI çağrıları artmaya başladıysa temel bir gateway erken aşamada ciddi rahatlık verir. Hele bir de sürpriz faturalardan korunmak için faydalıdır.

Rate limiting performansı düşürür mü?

Doğru kurulduğunda hissedilir derecede düşürmez.Zaten amaç trafiği öldürmek değil,dengelemekdir.Yanlış ayarlanmış limitler sorun çıkarabilir ama bu konfigürasyon meselesidir.

Maliyet takibinde en önemli metrik hangisi?

Tek başına toplam harcama yetmez. Ekip bazlı token tüketimi ve zaman içindeki trend daha anlamlıdır.Çünkü asıl problem genelde ani sıçramalarda ortaya çıkar.

Kaynaklar ve İleri Okuma

Anthropic DocsGitHub Ana Sayfası — İlgili Açık Kaynak Projeler İçin Başlangıç NoktasıOpenTelemetry Resmi Dokümantasyonu

Aşkın KILIÇ

20+ yıl deneyimli Azure Solutions Architect. Microsoft sertifikalı bulut mimari ve DevOps danışmanı. Azure, yapay zekâ ve bulut teknolojileri üzerine Türkçe teknik içerikler üretiyor.

AZ-305AZ-104AZ-500AZ-400DP-203AI-102

Bu içerik işinize yaradı mı?

Benzer içerikleri kaçırmamak için beni sosyal medyada takip edin.

Haftalık Bülten

Her pazar özenle seçilmiş teknoloji yazıları doğrudan e-postanıza gelsin.

← Onceki Yazi
İran’ın Kripto Ticareti: Hürmüz’den Geçen Yeni Yol
Sonraki Yazi →
One UI 8.5: Galaxy S23’e Gelen Güncelleme Ne Anlama Geliyor?

Yorum Yaz

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haftalık Bülten

Azure, DevOps ve Yapay Zeka dünyasındaki en güncel içerikleri her hafta doğrudan e-postanıza alın.

Spam yok. İstediğiniz zaman iptal edebilirsiniz.
📱
Uygulamayı Yükle Ana ekrana ekle, çevrimdışı oku
Kategoriler
Ara
Paylaş
İçindekiler
← İran’ın Kripto Ticareti: Hürmü...
One UI 8.5: Galaxy S23’e Gelen... →
📩

Gitmeden önce!

Her pazar özenle seçilmiş teknoloji yazıları ve AI haberleri doğrudan e-postanıza gelsin. Ücretsiz, spam yok.

🔒 Bilgileriniz güvende. İstediğiniz zaman ayrılabilirsiniz.

📬 Haftalık bülten: Teknoloji + AI haberleri