Agent Hafızası: Vektörden Zaman Çizgisine Geçiş

⏱️ 6 dk okuma📅 11 Nisan 2026🔄 Güncelleme: 21 Nisan 2026👁️ görüntülenme

İlginç olan şu ki, AI ajanlarının hafıza meselesi, açık konuşayım, uzun süredir biraz “işte bir şeyler yaptık sanıyoruz” kategorisinde duruyor. Metni al, vektör veritabanına göm, benzerlik skoruna bak, çıkan parçaları prompt’a tıkıştır… Kağıt üstünde fena değil. Ama pratikte — kullanıcı size ocakta ne konuştuğunu sorunca, özellikle konu eskiyse ya da cevap üç ayrı görüşmeden parça parça toplanması gerekiyorsa, çoğu sistem tam anlamıyla duvara tosluyor. Peki bunu neden söylüyorum? Orası can sıkıcı.

Şöyle ki, Ben de bu tıp sistemleri test ederken aynı hayal kırıklığını defalarca yaşadım. 2024’ün Kasım ayında, İstanbul’da küçük bir SaaS ekibi için kurduğumuz denemede bunu net gördüm: “müşteri kimdi, ne istemişti?” sorusunda sistem bazen doğru notu getiriyordu ama bağlamı tamamen kaçırıyordu. Hani insan hafızası da böyle çalışır ya — işim var, tarih var, olayın ruhu yok. İşte tam öyle.

Peki neden?

Açık konuşayım, Bu yazıda meseleye Shane Farkas’ın Memento yaklaşımından ilhamla bakacağım, ama birebir anlatmayacağım. Kendi gözümden söyleyeyim: buradaki asıl fark, “hafıza”yı belge arama gibi değil de yaşayan bir ilişki ağı gibi ele almakta yatıyor. Ve evet, bu ayrım kulağa küçük geliyor ama işin omurgasını değiştiriyor.

Neden Vektör Hafıza Bir Yere Kadar Yetiyor?

Vektör tabanlı hafıza sistemi çoğu zaman iyi niyetli bir kısa yol gibi çalışıyor. Kurulumu kolay. İlk demo’da etkileyici. Kullanıcının cümlesini embed ediyorsunuz, en yakın komşuları çekiyorsunuz, bu kadar — ama “John”, “John Smith” ve “satış direktörü” aynı kişi mi? Sistem çoğu zaman bunu gerçekten bilmiyor, sadece benzer vektörlere bakıyor.

Bir de zaman meselesi var ki orası daha karışık. Ocak ayındaki bilgi ile dün gelen güncelleme aynı rafta duruyor; hangisi eski, hangisi yeni belli değil. Ben 2023’te Ankara’daki bir ürün ekibinde buna benzer bir düzen kurmuştum ve kullanıcılar özellikle “ne değişti?” sorusunu sormaya başlayınca sistemin eli ayağı dolanmıştı — çünkü vektör arama geçmişe dair iz bırakıyor ama kronoloji tutmuyor, orada kör.

Şimdi gelelim en can sıkıcı kısma. Çelişkiler. Bir kullanıcı geçen hafta “şirketten ayrıldım” dediğinde. Bu hafta hâlâ ekip üyesi gibi görünüyorsa sistem bunu çoğunlukla fark etmiyor. Gerçek hayatta bellek dediğiniz şey sadece hatırlamak değil; değişeni ayıklamak, eskimişi kenara koymak. Gerektiğinde “bu bilgi artık geçerli değil” diyebilmek.

Yani, Bir liste yapalım, çünkü burada avantaj/dezavantaj çok net görünüyor:

Avantaj: Kurulumu kolaydır, ilk aşamada hızlı sonuç verir. (bu kritik)
Avantaj: Serbest metinle çalıştığı için uygulaması rahattır.
Dezavantaj: Varlıkları anlamaz; kişi mi kurum mu çoğu zaman ayırmaz.
Dezavantaj: Zaman boyutunu zayıf taşır; eski bilgiyle yeni bilgiyi karıştırabilir.
Dezavantaj: Çelişki tespiti yapmadığı için yanlış güven hissi verir. — ciddi fark yaratıyor

Memento Tarzı Yaklaşım Ne Yapıyor?

Aslında basit görünüyor ama oldukça akıllıca. Memento, konuşmayı yalnızca metin olarak saklamak yerine önü bir bilgi grafiğine çeviriyor — insanları, kurumları, projeleri ve bunların arasındaki ilişkileri düğüm düğüm örüyor, sonra bu düğümler arasında dolaşıyor. Mesela kullanıcı “John ile toplantıda neyi bilmeliyim?” dediğinde sistem yalnızca John adını aramıyor; onun bağlı olduğu şirketi, son değişiklikleri ve ilgili geçmiş notları birlikte toparlıyor. Fark hissediliyor. Daha fazla bilgi için 90% Bitmiş Gibi Görünen İşlerin Asıl Sırrı: Son %10 yazımıza bakabilirsiniz. Daha fazla bilgi için OriginOS 7: Vivo’da Sıradaki Büyük Yazılım Dalgası yazımıza bakabilirsiniz.

İşin garibi, Bence buradaki kritik nokta entity resolution kısmı. Yani aynı kişiye farklı şekillerde atıf yapılınca bunun tek kişiye bağlanması gerekiyor: tam eşleşme yetmediğinde fuzzy matching geliyor, phonetic eşleşme geliyor, sonra embedding benzerliği devreye giriyor, en son LLM hakemlik yapıyor. Bu katmanlı yapı fena değil; hatta baya işe yarıyor — çünkü gerçek dünya verisi temiz gelmiyor ki zaten, bunu hepimiz biliyoruz. Butterfly CSS: 2026’da Dikkat Çeken Hafif Bir Seçenek yazımızda bu konuya da değinmiştik.

Ve işler burada ilginçleşiyor.

💡 Bilgi: İyi bir ajan hafızası sadece “ne söylendiğini” değil, “ne zaman söylendiğini”, “sonradan değişip değişmediğini” ve “hangi bağlamda geçtiğini” de taşımalı.

Bir hafıza sistemi ancak çelişkiyi gördüğü anda olgunlaşmaya başlıyor; yoksa güzel görünen ama unutkan bir not defterinden pek farkı kalmıyor.

Zaman Boyutu Neden Önemli?

Garip gelecek ama, Memento’nün dikkat çekici taraflarından biri bitemporal kayıt fikriydi. Hem bilginin dünyada geçerli olduğu zamanı hem de sistemin o bilgiyi ne zaman öğrendiğini tutmak… Bu ayrımı ilk kez düzgün görünce kendi not sistemime dönüp utandığımı hatırlıyorum doğrusu. Çünkü çoğu araç sadece tek tarih gösteriyor. Gerisi sis içinde kalıyor — o “ne zaman bildin?” sorusunu kimse sormadan geçiyor.

Küçük startup’lar için bu kulağa lüks gelebilir. Büyüdükçe tam tersine zorunluluk oluyor. Bilhassa de de satış ekipleriyle destek ekipleri aynı müşteri hakkında farklı tarihlerde farklı şeyler söylediğinde iş iyice karışıyor, geçmişi çözmek saatler alıyor. Enterprise seviyede işe denetim izi olmadan hiçbir şey yürümüyor zaten; uyumluluk ekibi kapıya dayanirsa geçmiş kararların nedenini göstermeniz gerekiyor ve o an loglama yapmamış olmak gerçekten acı veriyor.

Kaba Kuvvet Yerine Akıllı Geri Çağırma

Sadece graph traversal yapmak da yetmiyor tabi. Verinin ham hâli her zaman lazım oluyor, o yüzden metnin düz kopyasını FTS5 ve vektör aramayla saklamak akıllıca bir emniyet kemeri gibi duruyor. Çözümün güzel yani şu: çıkarılan yapı bozulsa bile geri dönüş yolu kapanmıyor (evet, doğru duydunuz). Hata anında bir yer tutunacak bir şey kalıyor elinizde. PDF Dünyasında Bir Nefes: Ücretsiz ve Limitsiz Araçlar yazımızda bu konuya da değinmiştik.

# Basitleştirilmiş düşünce modeli
query -> entity resolution -> graph traversal -> ranked facts
-> token budget kontrolü
-> gerekirse verbatim fallback (FTS5 / vector search)

Peki Ya Performans ve Kalite?

Açık konuşayım. Böyle hibrit sistemlerde performans ile doğruluk arasında küçük bir pazarlık var (ki bu çoğu kişinin gözünden kaçıyor). Saf vektör arama genelde daha hızlı ama yüzeysel kalıyor. Grafik tabanlı yaklaşım daha pahalı olabiliyor — ama sonuç daha sağlam geliyor, özellikle soru karmaşıklaşınca. “Ocak’tan beri neler değişti?” gibi bir şey sorulduğunda grafik yaklaşımı çok daha anlamlı oluyor, vektör orada bocalar. Confdroid Selinux: Puppet ile Güvenliği Otomatikleştirmek yazımızda bu konuya da değinmiştik.

Bu haberi editör masasında okuyunca hemen kendi kafamda iki senaryo canlandı. Birinçisi düşük hacimli içerik işi yapan küçük ekiplerdi; onlar için hafif çözüm yeterli, aşırı mühendislik sadece zaman çalar. İkincisi müşteri verisinin sürekli aktığı kurumsal yapıydı — orada maliyet artsa da doğru cevap almak şarttır, yoksa kullanıcı güveni pat diye gider ve o güveni geri kazanmak zor ölür.

Kriter	Sadece Vektör	Zaman Çizgili Bilgi Grafiği
Kurulum Kolaylığı	Daha kolay	Daha karmaşık
Zaman Farkındalığı	Zayıf	Güçlü
Tutarlılık Kontrolü	Sınırlı	Daha iyi
Ana Kullanım Alanı	Kaba semantik arama	Ajan belleği / uzun vadeli muhakeme

Nerelerde İşe Yarıyor, Nerelerde Can Sıkıyor?

En parlak kullanım alanı toplantılar arası süreklilik isteyen işler bence. Mesela satış öncesi görüşmelerde müşteri adı birkaç kez değişebilir, şirket birleşebilir, rol kayabilir — böyle durumlarda tek cümlelik özetler yetmez, hikâyeyi takıp etmek gerekir. Tam burada temporal graph mantığı ciddi fark yaratıyor. Deneyimleyenler anlıyor.

E-ticaret tarafında da iş görüyor. Müşteri iade politikasını geçen ay sormuş mu? Bu ay hangi kampanyaya tepki vermiş? Önceki şikâyet hangi ürüne bağlıydı? Bunlar birbirinden köpük notlar gibi görünür ama birleşince değer üretir. Hatta benim İzmir’de tanıştığım bir ürün yöneticisi Mart 2025’te bunun sayesinde destek çağrılarını epey düşürdüklerini söylemişti — rakamı abartmayayım ama etki netti, kendi ağzından duydum.

Nerede can sıkıyor derseniz… veri temizliği olmayan yerde tabii ki sorun çıkar. Entity resolution yanlış yapılırsa neredeyse tüm zincir eğrilir. Bir kere yanlış kişiyi doğru kişiyle eşlerseniz o hata aşağı doğru büyür, kartopu gibi. Yani sistemi kurmak kadar veri disiplini de şart; aksi hâlde belleğin kendisi değil, halüsinasyonu büyür. O da başka bir kâbus.

Dikkat Edilmesi Gerekenler ve Pratik İpuçları

Lafı gevelemeden söyleyeyim: böyle bir sistemi üretime almadan önce loglama stratejinizi oturtun. Hangi fact nereden geldi, hangi model çıkardı, hangi eşleme kuralıyla birleşti — bunlar ileride altın değerinde ölür. Ben bunu Haziran 2024’te Berlin’de çalışan dağıtık ekiplerin kullandığı iç araçta gördüm; log yoktu, sorun vardı, açıklama yoktu ve herkes birbirine bakıyordu. Zor an.

Birkaç pratik ipucu bırakayım:

Kritik entity’lerde manuel onay akışı ekleyin.
Zaman bilgisini ayrı alanlarda saklayın; tek tarih yetmez.
Bilmiyorum” demeyi öğretin — her şeyi uydurmasın!
Verbatim fallback’i kapatmayın; hata anında hayat kurtarır.
Maliyet kontrolü için token bütçesini sorgu başına sınırlayın.

Sıkça Sorulan Sorular

Vektör tabanlı hafıza neden bazen “yanlış bağlamı” getiriyor?

Vektör arama benzer metin parçalarını yaklaştırır ama “aynı kişi mi, aynı dönem mi, aynı karar mı?” gibi ilişkileri otomatik çözmez. Bu yüzden sonuç doğru gibi görünse bile bağlam kayabilir. Ben de testlerde özellikle eski kayıtlar gelince “evet ben bunu demiştim ama konu bambaşkaydı” tepkisini çok gördüm.

Zaman çizgisi tutmayan bir hafıza yaklaşımı ne gibi sorun çıkarır?

Ocak’taki notla dün gelen güncelleme aynı rafta durunca sistem hangisinin daha güncel olduğunu ayırt edemez. Kullanıcı “ne değişti?” dediğinde de kronoloji eksikliği yüzünden çelişen bilgileri yan yana getirebilir. Vektör arama, zaman sırasını tek başına yönetmediği için bu risk artıyor.

Çelişki tespiti neden önemli ve vektör arama tek başına bunu yapabilir mi?

Gerçek hayatta hafıza sadece hatırlamak değil, “bu bilgi artık geçerli mi?” sorusunu da içerir. Vektör arama işe çoğunlukla benzerliği ölçer; geçerlilik/iptal mantığını kurmakta zayıf kalır. Bu yüzden yanlış güven hissi oluşabilir; sistem “benzer” diye yanlış cevabı tekrar edebilir.

Memento tarzı yaklaşım “hafızayı belge arama” yerine nasıl ele alıyor?

Temel fikir, konuşmayı sadece parçalar hâlinde saklamak yerine önü yaşayan bir ilişki ağı gibi düşünmek. Yani sadece benzer metni bulmak değil, zaman, değişim ve bağlam ilişkilerini daha iyi temsil edecek bir yapı kurmak hedefleniyor. Uygulamada bu, kullanıcı deneyimini özellikle güncelleme ve geçmişle karşılaştırma sorularında belirgin şekilde iyileştiriyor.

Agent hafızasında “kişiler/kurumlar” ayrımı neden kritik?

“John” ile “John Smith” ya da “satış direktörü” ile belirli bir kişi aynı şey sanılabilir. Varlıkları ayırt edemeyen sistemler, doğru görünen ama yanlış eşleşen bilgileri karıştırabilir. Benzerlik skoruna güvenmek yerine varlık kimliği ve bağlam çözümlemesi yapmanız gerekiyor.

Kaynaklar ve İleri Okuma

Azure OpenAI Service Concepts

Azure OpenAI “How-to” Kılavuzları

Azure AI Search ile Vector Search (Genel Bakış)

Microsoft Semantic Kernel (GitHub)

Aşkın KILIÇYazar

20+ yıl deneyimli Azure Solutions Architect. Microsoft sertifikalı bulut mimari ve DevOps danışmanı. Azure, yapay zekâ ve bulut teknolojileri üzerine Türkçe teknik içerikler üretiyor.

AZ-305AZ-104AZ-500AZ-400DP-203AI-102

Bu içerik işinize yaradı mı?

Benzer içerikleri kaçırmamak için beni sosyal medyada takip edin.

X / Twitter LinkedIn YouTube GitHub