İlginç olan şu ki, AI ajanlarının hafıza meselesi, açık konuşayım, uzun süredir biraz “işte bir şeyler yaptık sanıyoruz” kategorisinde duruyor. Metni al, vektör veritabanına göm, benzerlik skoruna bak, çıkan parçaları prompt’a tıkıştır… Kağıt üstünde fena değil. Ama pratikte — kullanıcı size ocakta ne konuştuğunu sorunca, özellikle konu eskiyse ya da cevap üç ayrı görüşmeden parça parça toplanması gerekiyorsa, çoğu sistem tam anlamıyla duvara tosluyor. Peki bunu neden söylüyorum? Orası can sıkıcı.
Şöyle ki, Ben de bu tip sistemleri test ederken aynı hayal kırıklığını defalarca yaşadım. 2024’ün Kasım ayında, İstanbul’da küçük bir SaaS ekibi için kurduğumuz denemede bunu net gördüm: “müşteri kimdi, ne istemişti?” sorusunda sistem bazen doğru notu getiriyordu ama bağlamı tamamen kaçırıyordu. Hani insan hafızası da böyle çalışır ya — isim var, tarih var, olayın ruhu yok. İşte tam öyle.
Peki neden?
Açık konuşayım, Bu yazıda meseleye Shane Farkas’ın Memento yaklaşımından ilhamla bakacağım, ama birebir anlatmayacağım. Kendi gözümden söyleyeyim: buradaki asıl fark, “hafıza”yı belge arama gibi değil de yaşayan bir ilişki ağı gibi ele almakta yatıyor. Ve evet, bu ayrım kulağa küçük geliyor ama işin omurgasını değiştiriyor.
Neden Vektör Hafıza Bir Yere Kadar Yetiyor?
Vektör tabanlı hafıza sistemi çoğu zaman iyi niyetli bir kısa yol gibi çalışıyor. Kurulumu kolay. İlk demo’da etkileyici. Kullanıcının cümlesini embed ediyorsunuz, en yakın komşuları çekiyorsunuz, bu kadar — ama “John”, “John Smith” ve “satış direktörü” aynı kişi mi? Sistem çoğu zaman bunu gerçekten bilmiyor, sadece benzer vektörlere bakıyor.
Bir de zaman meselesi var ki orası daha karışık. Ocak ayındaki bilgi ile dün gelen güncelleme aynı rafta duruyor; hangisi eski, hangisi yeni belli değil. Ben 2023’te Ankara’daki bir ürün ekibinde buna benzer bir düzen kurmuştum ve kullanıcılar özellikle “ne değişti?” sorusunu sormaya başlayınca sistemin eli ayağı dolanmıştı — çünkü vektör arama geçmişe dair iz bırakıyor ama kronoloji tutmuyor, orada kör.
Şimdi gelelim en can sıkıcı kısma. Çelişkiler. Bir kullanıcı geçen hafta “şirketten ayrıldım” dediğinde. Bu hafta hâlâ ekip üyesi gibi görünüyorsa sistem bunu çoğunlukla fark etmiyor. Gerçek hayatta bellek dediğiniz şey sadece hatırlamak değil; değişeni ayıklamak, eskimişi kenara koymak. Gerektiğinde “bu bilgi artık geçerli değil” diyebilmek.
Yani, Bir liste yapalım, çünkü burada avantaj/dezavantaj çok net görünüyor:
- Avantaj: Kurulumu kolaydır, ilk aşamada hızlı sonuç verir. (bu kritik)
- Avantaj: Serbest metinle çalıştığı için uygulaması rahattır.
- Dezavantaj: Varlıkları anlamaz; kişi mi kurum mu çoğu zaman ayırmaz.
- Dezavantaj: Zaman boyutunu zayıf taşır; eski bilgiyle yeni bilgiyi karıştırabilir.
- Dezavantaj: Çelişki tespiti yapmadığı için yanlış güven hissi verir. — ciddi fark yaratıyor
Memento Tarzı Yaklaşım Ne Yapıyor?
Aslında basit görünüyor ama oldukça akıllıca. Memento, konuşmayı yalnızca metin olarak saklamak yerine onu bir bilgi grafiğine çeviriyor — insanları, kurumları, projeleri ve bunların arasındaki ilişkileri düğüm düğüm örüyor, sonra bu düğümler arasında dolaşıyor. Mesela kullanıcı “John ile toplantıda neyi bilmeliyim?” dediğinde sistem yalnızca John adını aramıyor; onun bağlı olduğu şirketi, son değişiklikleri ve ilgili geçmiş notları birlikte toparlıyor. Fark hissediliyor. Daha fazla bilgi için 90% Bitmiş Gibi Görünen İşlerin Asıl Sırrı: Son %10 yazımıza bakabilirsiniz. Daha fazla bilgi için OriginOS 7: Vivo’da Sıradaki Büyük Yazılım Dalgası yazımıza bakabilirsiniz.
İşin garibi, Bence buradaki kritik nokta entity resolution kısmı. Yani aynı kişiye farklı şekillerde atıf yapılınca bunun tek kişiye bağlanması gerekiyor: tam eşleşme yetmediğinde fuzzy matching geliyor, phonetic eşleşme geliyor, sonra embedding benzerliği devreye giriyor, en son LLM hakemlik yapıyor. Bu katmanlı yapı fena değil; hatta baya işe yarıyor — çünkü gerçek dünya verisi temiz gelmiyor ki zaten, bunu hepimiz biliyoruz. Butterfly CSS: 2026’da Dikkat Çeken Hafif Bir Seçenek yazımızda bu konuya da değinmiştik.
Ve işler burada ilginçleşiyor.
Bir hafıza sistemi ancak çelişkiyi gördüğü anda olgunlaşmaya başlıyor; yoksa güzel görünen ama unutkan bir not defterinden pek farkı kalmıyor.
Zaman Boyutu Neden Önemli?
Garip gelecek ama, Memento’nun dikkat çekici taraflarından biri bitemporal kayıt fikriydi. Hem bilginin dünyada geçerli olduğu zamanı hem de sistemin o bilgiyi ne zaman öğrendiğini tutmak… Bu ayrımı ilk kez düzgün görünce kendi not sistemime dönüp utandığımı hatırlıyorum doğrusu. Çünkü çoğu araç sadece tek tarih gösteriyor. Gerisi sis içinde kalıyor — o “ne zaman bildin?” sorusunu kimse sormadan geçiyor.
Küçük startup’lar için bu kulağa lüks gelebilir. Büyüdükçe tam tersine zorunluluk oluyor. Bilhassa de de satış ekipleriyle destek ekipleri aynı müşteri hakkında farklı tarihlerde farklı şeyler söylediğinde iş iyice karışıyor, geçmişi çözmek saatler alıyor. Enterprise seviyede ise denetim izi olmadan hiçbir şey yürümüyor zaten; uyumluluk ekibi kapıya dayanırsa geçmiş kararların nedenini göstermeniz gerekiyor ve o an loglama yapmamış olmak gerçekten acı veriyor.
Kaba Kuvvet Yerine Akıllı Geri Çağırma
Sadece graph traversal yapmak da yetmiyor tabi. Verinin ham hali her zaman lazım oluyor, o yüzden metnin düz kopyasını FTS5 ve vektör aramayla saklamak akıllıca bir emniyet kemeri gibi duruyor. Çözümün güzel yani şu: çıkarılan yapı bozulsa bile geri dönüş yolu kapanmıyor (evet, doğru duydunuz). Hata anında bir yer tutunacak bir şey kalıyor elinizde. PDF Dünyasında Bir Nefes: Ücretsiz ve Limitsiz Araçlar yazımızda bu konuya da değinmiştik.
# Basitleştirilmiş düşünce modeli
query -> entity resolution -> graph traversal -> ranked facts
-> token budget kontrolü
-> gerekirse verbatim fallback (FTS5 / vector search)
Peki Ya Performans ve Kalite?
Açık konuşayım. Böyle hibrit sistemlerde performans ile doğruluk arasında küçük bir pazarlık var (ki bu çoğu kişinin gözünden kaçıyor). Saf vektör arama genelde daha hızlı ama yüzeysel kalıyor. Grafik tabanlı yaklaşım daha pahalı olabiliyor — ama sonuç daha sağlam geliyor, özellikle soru karmaşıklaşınca. “Ocak’tan beri neler değişti?” gibi bir şey sorulduğunda grafik yaklaşımı çok daha anlamlı oluyor, vektör orada bocalar. Confdroid Selinux: Puppet ile Güvenliği Otomatikleştirmek yazımızda bu konuya da değinmiştik.
Bu haberi editör masasında okuyunca hemen kendi kafamda iki senaryo canlandı. Birincisi düşük hacimli içerik işi yapan küçük ekiplerdi; onlar için hafif çözüm yeterli, aşırı mühendislik sadece zaman çalar. İkincisi müşteri verisinin sürekli aktığı kurumsal yapıydı — orada maliyet artsa da doğru cevap almak şarttır, yoksa kullanıcı güveni pat diye gider ve o güveni geri kazanmak zor olur.
| Kriter | Sadece Vektör | Zaman Çizgili Bilgi Grafiği |
|---|---|---|
| Kurulum Kolaylığı | Daha kolay | Daha karmaşık |
| Zaman Farkındalığı | Zayıf | Güçlü |
| Tutarlılık Kontrolü | Sınırlı | Daha iyi |
| Ana Kullanım Alanı | Kaba semantik arama | Ajan belleği / uzun vadeli muhakeme |
Nerelerde İşe Yarıyor, Nerelerde Can Sıkıyor?
En parlak kullanım alanı toplantılar arası süreklilik isteyen işler bence. Mesela satış öncesi görüşmelerde müşteri adı birkaç kez değişebilir, şirket birleşebilir, rol kayabilir — böyle durumlarda tek cümlelik özetler yetmez, hikâyeyi takip etmek gerekir. Tam burada temporal graph mantığı ciddi fark yaratıyor. Deneyimleyenler anlıyor.
E-ticaret tarafında da iş görüyor. Müşteri iade politikasını geçen ay sormuş mu? Bu ay hangi kampanyaya tepki vermiş? Önceki şikâyet hangi ürüne bağlıydı? Bunlar birbirinden kopuk notlar gibi görünür ama birleşince değer üretir. Hatta benim İzmir’de tanıştığım bir ürün yöneticisi Mart 2025’te bunun sayesinde destek çağrılarını epey düşürdüklerini söylemişti — rakamı abartmayayım ama etki netti, kendi ağzından duydum.
Nerede can sıkıyor derseniz… veri temizliği olmayan yerde tabii ki sorun çıkar. Entity resolution yanlış yapılırsa neredeyse tüm zincir eğrilir. Bir kere yanlış kişiyi doğru kişiyle eşlerseniz o hata aşağı doğru büyür, kartopu gibi. Yani sistemi kurmak kadar veri disiplini de şart; aksi halde belleğin kendisi değil, halüsinasyonu büyür. O da başka bir kabus.
Dikkat Edilmesi Gerekenler ve Pratik İpuçları
Lafı gevelemeden söyleyeyim: böyle bir sistemi üretime almadan önce loglama stratejinizi oturtun. Hangi fact nereden geldi, hangi model çıkardı, hangi eşleme kuralıyla birleşti — bunlar ileride altın değerinde olur. Ben bunu Haziran 2024’te Berlin’de çalışan dağıtık ekiplerin kullandığı iç araçta gördüm; log yoktu, sorun vardı, açıklama yoktu ve herkes birbirine bakıyordu. Zor an.
Birkaç pratik ipucu bırakayım:
- Kritik entity’lerde manuel onay akışı ekleyin.
- Zaman bilgisini ayrı alanlarda saklayın; tek tarih yetmez.
- Bilmiyorum” demeyi öğretin — her şeyi uydurmasın!
- Verbatim fallback’i kapatmayın; hata anında hayat kurtarır.
- Maliyet kontrolü için token bütçesini sorgu başına sınırlayın.
Bu içerik işinize yaradı mı?
Benzer içerikleri kaçırmamak için beni sosyal medyada takip edin.



