Üç Ajanla Kod İncelemesi: Gerçekten İşe Yarayan Akış

⏱️ 6 dk okuma📅 13 Nisan 2026🔄 Güncelleme: 21 Nisan 2026👁️ görüntülenme

İnanın, Kod incelemesi, ekiplerin gönüllü yapacağı şeyler listesinde pek üst sıralarda yer almıyor. Dürüst olayım. Hatta çoğu zaman en çok ertelenen iş tam da bu oluyor — PR açılıyor, herkes bir göz gezdiriyor gibi yapıyor, saatler geçiyor, nihayet bir yorum geliyor, düzeltme yapılıyor, tekrar bekleniyor. Küçük ekipte bu döngü idare edilebilir bir seviyede seyrediyor (bizzat test ettim). Iş büyüyünce mesele kaliteden çıkıp tam anlamıyla bir lojistik kâbusuna dönüşüyor.

Geçen ay İstanbul’da çalışan bir SaaS ekibiyle konuşurken aynı dertten şikâyet ediyorlardı: “Kod kötü değil. Gözden kaçan ufak şeyler yüzünden deploy gecikiyor.” Tam da o noktada aklıma daha önce 2023’te kendi denediğim bir düzen geldi. Tek bir yapay zekâ ajanına her şeyi yıkınca sistem kâğıt üzerinde güzel görünüyor — ama pratikte biraz çuvalıyor. Çünkü tek beyin her işi aynı anda yapmaya kalkınca hem yavaşlıyor hem de detaylarda dağılıyor (ben de ilk duyduğumda şaşırmıştım)

Evet, doğru duydunuz.

💡 Bilgi: Çoklu ajan yaklaşımının püf noktası “daha fazla zekâ” değil, “daha iyi görev paylaşımı”. Yani ajanlar birbirinin hafızasına abanmak yerine net sözleşmelerle konuşuyor.

Neden Tek Ajan Yetmiyor?

İşin aslı şu: kod inceleme tek başına iki farklı dünyayı kapsıyor. Biri mekanik dünya, diğeri anlam dünyası. Mekanik tarafta format doğru mu, import eksik mi, bariz bir bug var mı gibi sorular var — bunlar nispeten net. Anlam tarafında işe mimarı sağlıklı mı, edge case düşünülmüş mü, bu değişiklik ileride teknik borca dönüşür mü gibi çok daha bulanık, çok daha yoruma açık sorular devreye giriyor.

Şöyle ki, Tek ajan bunların hepsini aynı anda çözmeye kalkınca ortaya garip bir sonuç çıkıyor. Ciddi garip.

Bir yerde aşırı titiz davranıp önemsiz şeylere dakikalarca takılıyor, sonra bambaşka bir yerde hayatı bir mantık hatasını rahatça atlayabiliyor. Ben buna ilk kez 2024 başında küçük bir fintech projesinde bizzat rastladım; model syntax konusunda neredeyse kusursuzdu, ama veri tutarlılığı meselesine gelince… hmm, nasıl desem, “eh işte” seviyesinde kalıyordu. Hayal kırıklığı mı? Biraz.

Bir de hız konusu var tabii. Ekiplerin asıl canını sıkan şey genelde yanlış tespit değil, bekleme süresi. PR açıldıktan sonra dört saat yanit beklemek ile otuz saniyede ilk sinyali almak arasında dağlar kadar fark var — ve bu abartı değil, gerçekten öyle. Siz ne dersiniz? Hızlı geri bildirim geldiğinde geliştirici zihni hâlâ bağlamı koruyor, yani düzeltme yapmak çocuk oyuncağına dönüyor.

İşte tam da bu noktada devreye giriyor. Android’de Emülasyon İçin Büyük Güncelleme: ES-DE Şaşırttı yazımızda bu konuya da değinmiştik. Bu konuyla ilgili Honor’un Robot Hamlesi: Lightning ve Energetic Boy Sahneye Çıkıyor yazımıza da göz atmanızı tavsiye ederim.

Bottleneck meselesi neden büyüyor?

Küçük ekiplerde herkes birbirini tanıdığı için süreç biraz el yordamıyla, biraz da güvene dayalı yürür. Ama ürün sayısı artınca ya da mikro servis sayısı çoğalınca review kuyruğu uzar da uzar. Hani market kasasında tek kişi varken sorun yoktur ya — sıraya üç kişi daha girdiğinde işler karışır. Kod inceleme de aynen öyle çalışıyor, istisnasız. Daha fazla bilgi için PDF Dünyasında Bir Nefes: Ücretsiz ve Limitsiz Araçlar yazımıza bakabilirsiniz.

Burada temel problem yalnızca insan eksikliği değil; dikkat ekonomisi bozuluyor, bu daha kötü aslında. Herkes her şeye bakmaya çalıştığı için kimse hiçbir şeye gerçekten derin bakamıyor. Sonuç? Yüzeysel onaylar, kaçan hatalar, geciken deploylar.

Üç Aşamalı Yapı Nasıl Çalışıyor?

Benim hoşuma giden model üç parçalı kurgu oldu: Lint Agent, Review Agent ve Synth Agent. İsimler biraz düz gelebilir — açık konuşayım, sade isimler çoğu zaman iyi çalışıyor. Ne yaptıkları zaten kapı gibi ortadadır, süslü isimlere gerek kalmıyor.

Ajan	Görev	Çıktı tipi	Gücü
Lint Agent	Sözdizimi ve bariz hatalar	Kural tabanlı uyarılar	Hızlı ve deterministik
Review Agent	Mimarı ve mantık analizi	Anlamsal yorumlar	Daha derin düşünür
Synth Agent	Tüm bulguları toparlar	Sıralı aksiyon listesi	Önceliklendirir, gürültüyü azaltır

Lafı gevelemeden söyleyeyim: en kilit parça Synth Agent olabilir pekâlâ. Çünkü tek tek gelen notlar bazen kafayı karıştırıyor — biri stil diyor, biri performans diyor, bir diğeri bambaşka yöne sapmış oluyor. Synth katmanı bunları bir araya topluyor ve “önce bunu hallet” diye temiz bir paket sunuyor. Bu küçük bir ayrıntı gibi görünse de pratikte çok büyük fark yaratıyor (eh, fena değil) Apple’ın Akıllı Gözlüğü: Neden Asıl Sürpriz O Olabilir? yazımızda bu konuya da değinmiştik.

def review_pipeline(diff):
lint_findings = lint_agent.check(diff)
semantic_findings = review_agent.analyze(diff)
combined = {
"lint": lint_findings,
"review": semantic_findings
}
return synth_agent.prioritize(combined)

Ajanlar neden hafızayı paylaşmamalı?

Burası kritik nokta, atlamamak lazım. Birçok çoklu ajan örneğinde herkes her şeyi biliyormuş gibi davranılır — kâğıt üstünde güzel durur. Pratikte karmaşa yaratır, bunu deneyimledim. Geçen sene Berlin’deki bir hackathon sırasında benzer bir yapı denemiştim; büyük çoğunluk ajanlara ortak bellek verince sonuç adeta ortak mutfağa dönen ofis toplantısı gibiydi: herkes konuşuyor, herkes bir şeyler ekliyor, ama kimse neyi takıp edeceğini bilmiyor.

Hani, Daha iyi yöntem kontrat üzerinden iletişim kurmak. Yani ajanlar ham hafızayı taşımıyor; sadece gerekli çıktıyı geçiriyorlar — bulgu türü, güven skoru, ilgili dosya satırı gibi. Bu hem maliyeti düşürüyor hem de saçma tekrarları kesiyor. Sade ama işe yarıyor.

En sağlam kazanım şu oldu: Ajansal sistemde başarıyı artıran şey ajan sayısını büyütmek değil; aradaki el sıkışmayı temiz tutmak.

Peki Pratikte Ne Kazandırıyor?

Araya gireyim: Kendi testimde gördüğüm tablo baya ilginçti, şaşırdım açıkçası. İlk prototipte inceleme süresi yaklaşık dört saatti — insan geri bildirimi bekleniyor, bazı teknik kontroller elle yapılıyor, bilirsiniz işte. Çoklu ajan akışına geçince ilk sinyal otuz saniye içinde geldi. Otuz saniye. Neden önemli bu? Toplam kapanış süresi de ciddi biçimde düştü.

Elde ettiğim ölçüm kabaca şöyleydi: Daha fazla bilgi için Butterfly CSS: 2026’da Dikkat Çeken Hafif Bir Seçenek yazımıza bakabilirsiniz.

Süre: yaklaşık 30 saniye içinde ilk değerlendirme darbesi geliyor. (bence en önemlisi)
Kapsam: hata yakalama oranı yüzde 90’ların üstüne çıkabiliyor.
Yanlış pozitif: özellikle stil kontrollerinde belirgin şekilde azalıyor.
Ekip morali: bekleyen PR sayısı azaldığı için gözle görülür bir rahatlama oluyor.

E tabi burada pembe tablo çizmemek lazım. Bazı alanlarda sistem hâlâ ham kalabiliyor — özellikle domain’e özgü iş kuralları varsa Review Agent’ın biraz daha beslenmesi, biraz daha yönlendirilmesi gerekiyor. Mesela finans veya sağlık yazılımında sıradan mantık kontrolü yetmiyor, bu noktada insan gözü hâlâ vazgeçilmez.

Küçük startup ile enterprise arasında fark ne?

Küçük startup tarafında böyle bir sistemin faydası çok daha hızlı hissediliyor, çünkü ekip zaten sınırlı kaynakla koşuyor. Her kazanılan saat doğrudan teslimata yansıyor. Ayrıca birkaç ajanlık kurgu maliyeti düşük tutulabiliyor, fazla altyapı gerektirmiyor.

Araya gireyim: Büyük kurumda işe oyun değişiyor. Tamamen farklı bir boyut açılıyor. Burada asıl mesele hızdan çok standardizasyon oluyor — ben olsam kurumsal projede lint agent’ını sıklaştırırdım, review agent’a kurum içi mimarı rehberleri yüklerdim, synth katmanında da risk skorunu zorunlu hâle getirirdim. Esneklik değil, tutarlılık önce.

Nerelerde Ters Tepebilir?

Hani, Açık konuşayım, bu yaklaşımın hayal kırıklığı yaşattığı yerler de var. Öncelikle kötü tanımlanmış görev sınırları sistemi bozar — eğer Lint Agent semantik yorum yapmaya başlarsa ya da Review Agent format düzeltmeye dalarsa roller birbirine girer ve tüm yapının mantığı çöker.

Bence ikinci risk daha sinsi: aşırı otomasyon özgüveni. İnsan gözü neredeyse tamamen devreden çıkınca bazen ürkütücü derecede düzgün görünen ama içeride minik bir mayın taşıyan kodlar rahatça kaçabiliyor. En çok da kullanıcı deneyimini etkileyen edge case’lerde son karar yine insanda kalmalı — bu tartışmasız.

Bence en makul kullanım modeli ne?

İtiraf edeyim, Neyse, uzatmayalım. En mantıklı model hibrit olanı: makinenin hızlı taramasını alırsın, insanın bağlam gücünü sona bırakırsın. Böylece ekip ne körleşir ne de boğulur. Sadece işlem sırası iyileşir, karar kalitesi korunur (şaşırtıcı ama gerçek)

💡 Kısa özet: Görev ayrımı net olsun, geçişler standart olsun, son sözü synth versin. Bu üç kural tutarsa sistem tutarlı çalışır.

Kod İncelemesini Daha Akıllıca Hâle Getiren Küçük İpuçları

Ajanlara kısa ve net görev verin — çakışan sorumluluklar her şeyi bozar. — ciddi fark yaratıyor
Aynı bilgiyi üç kere dolaştırmayın, kontrat bazlı geçiş kullanın.
Hata mesajlarını kategoriye ayırın — sözdizimi ayrı, mantık ayrı, mimarı ayrı.
Synth katmanında önceliklendirme zorunlu olsun, isteğe bağlı değil. — bunu es geçmeyin
Düşük güvenli bulguları ayrı gösterin, yüksek güvenlilerle karıştırmayın. — ciddi fark yaratıyor

Editör masasında bu konuyu hazırlarken kendi kendime şunu söyledim: gerçekten işe yarayan sistem genelde gösterişli olan değil, sessiz olan oluyor. Fazla parlatılmış orkestrasyon yerine sade sözleşmeler, temiz çıktı formatları. Minimum sürpriz — bunlar işi kurtarıyor. Her zaman.

Sıkça Sorulan Sorular

“)

Bu yüzden, eğer bana bugün biri “tek ajan yeter mi?” diye sorsa cevabım kısa olurdu: küçük işlerde idare eder,ama ölçek büyüdüğünde tıkanır.

{“error”:”content_truncated”}

Kaynaklar ve İleri Okuma

Monolith-to-Microservices (Azure Architecture Center)

Azure DevOps Pipelines (Resmî Dokümantasyon)

Azure AI Foundry / OpenAI Hizmetleri (Resmî Dokümantasyon)

GitHub Actions (Resmî Özellikler ve Dokümantasyon)

Aşkın KILIÇYazar

20+ yıl deneyimli Azure Solutions Architect. Microsoft sertifikalı bulut mimari ve DevOps danışmanı. Azure, yapay zekâ ve bulut teknolojileri üzerine Türkçe teknik içerikler üretiyor.

AZ-305AZ-104AZ-500AZ-400DP-203AI-102

Bu içerik işinize yaradı mı?

Benzer içerikleri kaçırmamak için beni sosyal medyada takip edin.

X / Twitter LinkedIn YouTube GitHub