Yapay Zeka

Üç Ajanla Kod İncelemesi: Gerçekten İşe Yarayan Akış

İnanın, Kod incelemesi, ekiplerin gönüllü yapacağı şeyler listesinde pek üst sıralarda yer almıyor. Dürüst olayım. Hatta çoğu zaman en çok ertelenen iş tam da bu oluyor — PR açılıyor, herkes bir göz gezdiriyor gibi yapıyor, saatler geçiyor, nihayet bir yorum geliyor, düzeltme yapılıyor, tekrar bekleniyor. Küçük ekipte bu döngü idare edilebilir bir seviyede seyrediyor (bizzat test ettim). Iş büyüyünce mesele kaliteden çıkıp tam anlamıyla bir lojistik kâbusuna dönüşüyor.

Geçen ay İstanbul’da çalışan bir SaaS ekibiyle konuşurken aynı dertten şikâyet ediyorlardı: “Kod kötü değil. Gözden kaçan ufak şeyler yüzünden deploy gecikiyor.” Tam da o noktada aklıma daha önce 2023’te kendi denediğim bir düzen geldi. Tek bir yapay zekâ ajanına her şeyi yıkınca sistem kâğıt üzerinde güzel görünüyor — ama pratikte biraz çuvalıyor. Çünkü tek beyin her işi aynı anda yapmaya kalkınca hem yavaşlıyor hem de detaylarda dağılıyor (ben de ilk duyduğumda şaşırmıştım)

Evet, doğru duydunuz.

💡 Bilgi: Çoklu ajan yaklaşımının püf noktası “daha fazla zeka” değil, “daha iyi görev paylaşımı”. Yani ajanlar birbirinin hafızasına abanmak yerine net sözleşmelerle konuşuyor.

Neden Tek Ajan Yetmiyor?

İşin aslı şu: kod inceleme tek başına iki farklı dünyayı kapsıyor. Biri mekanik dünya, diğeri anlam dünyası. Mekanik tarafta format doğru mu, import eksik mi, bariz bir bug var mı gibi sorular var — bunlar nispeten net. Anlam tarafında ise mimari sağlıklı mı, edge case düşünülmüş mü, bu değişiklik ileride teknik borca dönüşür mü gibi çok daha bulanık, çok daha yoruma açık sorular devreye giriyor.

Şöyle ki, Tek ajan bunların hepsini aynı anda çözmeye kalkınca ortaya garip bir sonuç çıkıyor. Ciddi garip.

Bir yerde aşırı titiz davranıp önemsiz şeylere dakikalarca takılıyor, sonra bambaşka bir yerde hayati bir mantık hatasını rahatça atlayabiliyor. Ben buna ilk kez 2024 başında küçük bir fintech projesinde bizzat rastladım; model syntax konusunda neredeyse kusursuzdu, ama veri tutarlılığı meselesine gelince… hmm, nasıl desem, “eh işte” seviyesinde kalıyordu. Hayal kırıklığı mı? Biraz.

Bir de hız konusu var tabii. Ekiplerin asıl canını sıkan şey genelde yanlış tespit değil, bekleme süresi. PR açıldıktan sonra dört saat yanıt beklemek ile otuz saniyede ilk sinyali almak arasında dağlar kadar fark var — ve bu abartı değil, gerçekten öyle. Siz ne dersiniz? Hızlı geri bildirim geldiğinde geliştirici zihni hâlâ bağlamı koruyor, yani düzeltme yapmak çocuk oyuncağına dönüyor.

İşte tam da bu noktada devreye giriyor. Android’de Emülasyon İçin Büyük Güncelleme: ES-DE Şaşırttı yazımızda bu konuya da değinmiştik. Bu konuyla ilgili Honor’un Robot Hamlesi: Lightning ve Energetic Boy Sahneye Çıkıyor yazımıza da göz atmanızı tavsiye ederim.

Bottleneck meselesi neden büyüyor?

Küçük ekiplerde herkes birbirini tanıdığı için süreç biraz el yordamıyla, biraz da güvene dayalı yürür. Ama ürün sayısı artınca ya da mikro servis sayısı çoğalınca review kuyruğu uzar da uzar. Hani market kasasında tek kişi varken sorun yoktur ya — sıraya üç kişi daha girdiğinde işler karışır. Kod inceleme de aynen öyle çalışıyor, istisnasız. Daha fazla bilgi için PDF Dünyasında Bir Nefes: Ücretsiz ve Limitsiz Araçlar yazımıza bakabilirsiniz.

Burada temel problem yalnızca insan eksikliği değil; dikkat ekonomisi bozuluyor, bu daha kötü aslında. Herkes her şeye bakmaya çalıştığı için kimse hiçbir şeye gerçekten derin bakamıyor. Sonuç? Yüzeysel onaylar, kaçan hatalar, geciken deploylar.

Üç Aşamalı Yapı Nasıl Çalışıyor?

Benim hoşuma giden model üç parçalı kurgu oldu: Lint Agent, Review Agent ve Synth Agent. İsimler biraz düz gelebilir — açık konuşayım, sade isimler çoğu zaman iyi çalışıyor. Ne yaptıkları zaten kapı gibi ortadadır, süslü isimlere gerek kalmıyor.

Ajan Görev Çıktı tipi Gücü
Lint Agent Sözdizimi ve bariz hatalar Kural tabanlı uyarılar Hızlı ve deterministik
Review Agent Mimari ve mantık analizi Anlamsal yorumlar Daha derin düşünür
Synth Agent Tüm bulguları toparlar Sıralı aksiyon listesi Önceliklendirir, gürültüyü azaltır

Lafı gevelemeden söyleyeyim: en kilit parça Synth Agent olabilir pekâlâ. Çünkü tek tek gelen notlar bazen kafayı karıştırıyor — biri stil diyor, biri performans diyor, bir diğeri bambaşka yöne sapmış oluyor. Synth katmanı bunları bir araya topluyor ve “önce bunu hallet” diye temiz bir paket sunuyor. Bu küçük bir ayrıntı gibi görünse de pratikte çok büyük fark yaratıyor (eh, fena değil) Apple’ın Akıllı Gözlüğü: Neden Asıl Sürpriz O Olabilir? yazımızda bu konuya da değinmiştik.

def review_pipeline(diff):
lint_findings = lint_agent.check(diff)
semantic_findings = review_agent.analyze(diff)
combined = {
"lint": lint_findings,
"review": semantic_findings
}
return synth_agent.prioritize(combined)

Ajanlar neden hafızayı paylaşmamalı?

Burası kritik nokta, atlamamak lazım. Birçok çoklu ajan örneğinde herkes her şeyi biliyormuş gibi davranılır — kâğıt üstünde güzel durur. Pratikte karmaşa yaratır, bunu deneyimledim. Geçen sene Berlin’deki bir hackathon sırasında benzer bir yapı denemiştim; büyük çoğunluk ajanlara ortak bellek verince sonuç adeta ortak mutfağa dönen ofis toplantısı gibiydi: herkes konuşuyor, herkes bir şeyler ekliyor, ama kimse neyi takip edeceğini bilmiyor.

Hani, Daha iyi yöntem kontrat üzerinden iletişim kurmak. Yani ajanlar ham hafızayı taşımıyor; sadece gerekli çıktıyı geçiriyorlar — bulgu türü, güven skoru, ilgili dosya satırı gibi. Bu hem maliyeti düşürüyor hem de saçma tekrarları kesiyor. Sade ama işe yarıyor.

En sağlam kazanım şu oldu: Ajansal sistemde başarıyı artıran şey ajan sayısını büyütmek değil; aradaki el sıkışmayı temiz tutmak.

Peki Pratikte Ne Kazandırıyor?

Araya gireyim: Kendi testimde gördüğüm tablo baya ilginçti, şaşırdım açıkçası. İlk prototipte inceleme süresi yaklaşık dört saatti — insan geri bildirimi bekleniyor, bazı teknik kontroller elle yapılıyor, bilirsiniz işte. Çoklu ajan akışına geçince ilk sinyal otuz saniye içinde geldi. Otuz saniye. Neden önemli bu? Toplam kapanış süresi de ciddi biçimde düştü.

Elde ettiğim ölçüm kabaca şöyleydi: Daha fazla bilgi için Butterfly CSS: 2026’da Dikkat Çeken Hafif Bir Seçenek yazımıza bakabilirsiniz.

  • Süre: yaklaşık 30 saniye içinde ilk değerlendirme darbesi geliyor. (bence en önemlisi)
  • Kapsam: hata yakalama oranı yüzde 90’ların üstüne çıkabiliyor.
  • Yanlış pozitif: özellikle stil kontrollerinde belirgin şekilde azalıyor.
  • Ekip morali: bekleyen PR sayısı azaldığı için gözle görülür bir rahatlama oluyor.

E tabi burada pembe tablo çizmemek lazım. Bazı alanlarda sistem hâlâ ham kalabiliyor — özellikle domain’e özgü iş kuralları varsa Review Agent’ın biraz daha beslenmesi, biraz daha yönlendirilmesi gerekiyor. Mesela finans veya sağlık yazılımında sıradan mantık kontrolü yetmiyor, bu noktada insan gözü hâlâ vazgeçilmez.

Küçük startup ile enterprise arasında fark ne?

Küçük startup tarafında böyle bir sistemin faydası çok daha hızlı hissediliyor, çünkü ekip zaten sınırlı kaynakla koşuyor. Her kazanılan saat doğrudan teslimata yansıyor. Ayrıca birkaç ajanlık kurgu maliyeti düşük tutulabiliyor, fazla altyapı gerektirmiyor.

Araya gireyim: Büyük kurumda ise oyun değişiyor. Tamamen farklı bir boyut açılıyor. Burada asıl mesele hızdan çok standardizasyon oluyor — ben olsam kurumsal projede lint agent’ını sıklaştırırdım, review agent’a kurum içi mimari rehberleri yüklerdim, synth katmanında da risk skorunu zorunlu hale getirirdim. Esneklik değil, tutarlılık önce.

Nerelerde Ters Tepebilir?

Hani, Açık konuşayım, bu yaklaşımın hayal kırıklığı yaşattığı yerler de var. Öncelikle kötü tanımlanmış görev sınırları sistemi bozar — eğer Lint Agent semantik yorum yapmaya başlarsa ya da Review Agent format düzeltmeye dalarsa roller birbirine girer ve tüm yapının mantığı çöker.

Bence ikinci risk daha sinsi: aşırı otomasyon özgüveni. İnsan gözü neredeyse tamamen devreden çıkınca bazen ürkütücü derecede düzgün görünen ama içeride minik bir mayın taşıyan kodlar rahatça kaçabiliyor. En çok da kullanıcı deneyimini etkileyen edge case’lerde son karar yine insanda kalmalı — bu tartışmasız.

Bence en makul kullanım modeli ne?

İtiraf edeyim, Neyse, uzatmayalım. En mantıklı model hibrit olanı: makinenin hızlı taramasını alırsın, insanın bağlam gücünü sona bırakırsın. Böylece ekip ne körleşir ne de boğulur. Sadece işlem sırası iyileşir, karar kalitesi korunur (şaşırtıcı ama gerçek)

💡 Kısa özet: Görev ayrımı net olsun, geçişler standart olsun, son sözü synth versin. Bu üç kural tutarsa sistem tutarlı çalışır.

Kod İncelemesini Daha Akıllıca Hale Getiren Küçük İpuçları

  1. Ajanlara kısa ve net görev verin — çakışan sorumluluklar her şeyi bozar. — ciddi fark yaratıyor
  2. Aynı bilgiyi üç kere dolaştırmayın, kontrat bazlı geçiş kullanın.
  3. Hata mesajlarını kategoriye ayırın — sözdizimi ayrı, mantık ayrı, mimari ayrı.
  4. Synth katmanında önceliklendirme zorunlu olsun, isteğe bağlı değil. — bunu es geçmeyin
  5. Düşük güvenli bulguları ayrı gösterin, yüksek güvenlilerle karıştırmayın. — ciddi fark yaratıyor

Editör masasında bu konuyu hazırlarken kendi kendime şunu söyledim: gerçekten işe yarayan sistem genelde gösterişli olan değil, sessiz olan oluyor. Fazla parlatılmış orkestrasyon yerine sade sözleşmeler, temiz çıktı formatları. Minimum sürpriz — bunlar işi kurtarıyor. Her zaman.

Sıkça Sorulan Sorular

“)

**Bu yüzden**, eğer bana bugün biri “tek ajan yeter mi?” diye sorsa cevabım kısa olurdu: küçük işlerde idare eder,ama ölçek büyüdüğünde tıkanır.

{“error”:”content_truncated”}

Aşkın KILIÇ

20+ yıl deneyimli Azure Solutions Architect. Microsoft sertifikalı bulut mimari ve DevOps danışmanı. Azure, yapay zekâ ve bulut teknolojileri üzerine Türkçe teknik içerikler üretiyor.

AZ-305AZ-104AZ-500AZ-400DP-203AI-102

Bu içerik işinize yaradı mı?

Benzer içerikleri kaçırmamak için beni sosyal medyada takip edin.

Haftalık Bülten

Her pazar özenle seçilmiş teknoloji yazıları doğrudan e-postanıza gelsin.

← Onceki Yazi
Autoscaling Faturayı Şişiriyorsa: Sessiz Tuzaklar
Sonraki Yazi →
God of War İçin Yeni Duyuru Sinyali: Bu Ay Ne Bekleniyor?

Yorum Yaz

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Haftalık Bülten

Azure, DevOps ve Yapay Zeka dünyasındaki en güncel içerikleri her hafta doğrudan e-postanıza alın.

Spam yok. İstediğiniz zaman iptal edebilirsiniz.
📱
Uygulamayı Yükle Ana ekrana ekle, çevrimdışı oku
Kategoriler
Ara
Paylaş
İçindekiler
← Autoscaling Faturayı Şişiriyor...
God of War İçin Yeni Duyuru Si... →
📩

Gitmeden önce!

Her pazar özenle seçilmiş teknoloji yazıları ve AI haberleri doğrudan e-postanıza gelsin. Ücretsiz, spam yok.

🔒 Bilgileriniz güvende. İstediğiniz zaman ayrılabilirsiniz.

📬 Haftalık bülten: Teknoloji + AI haberleri