20 Ağu 2025·8 dk

Veritabanı Türleri: İlişkisel, Sütunlu, Belge, Graf ve Daha Fazlası

Q: “Veritabanı türü” pratikte ne anlama geliyor?

Bir “veritabanı türü” pratikte üç şeyi anlatır: - Veri modeli (tablolar, belgeler, anahtar-değer çiftleri, grafikler, vektörler, zaman damgalı noktalar) - Optimizasyon yapılan sorgu desenleri (join'ler, tarama/aggregasyon, gezinmeler, benzerlik araması) - Ölçekleme ve tutarlılık takasları (tek makine mi yoksa yatay ölçek mi, sıkı mi yoksa nihai tutarlılık mı) Türü seçmek, performans, maliyet ve operasyonel karmaşıklık için varsayılanları belirlemektir.

Q: Aşırı düşünmeden doğru veritabanı türünü nasıl seçerim?

En kolay yol, en sık yaptığınız 5–10 sorgu ve yazma desenini belirlemektir, sonra onları uygun güçlü yönlerle eşleyin: - OLTP işlemleri + yapısal veriler → ilişkisel (SQL) - Paneller ve büyük aggregasyonlar → sütunlu/veri ambarı - Sık değişen JSON-benzeri uygulama verisi → belge - Derin ilişki sorguları → grafik - Semantik arama / RAG alma → vektör - ID ile get/set, çok düşük gecikme → anahtar-değer Hem OLTP hem analiz gerekiyorsa, baştan iki sistem (operasyonel DB + analiz DB) planlayın.

Q: ACID işlemler nedir ve en çok ne zaman önemseriz?

ACID , çok adımlı değişikliklerin güvenilir olmasını sağlar: - Atomicity : tüm adımlar ya başarır ya da hiçbiri gerçekleşmez - Consistency : kurallar/kısıtlar değişiklikten sonra korunur - Isolation : eşzamanlı işlemler birbirini bozmaz - Durability : onaylanan veriler çökmelerden sonra kalır Özellikle maliyetli hataların olduğu işlemler (ödeme, rezervasyon, envanter) için kritiktir.

Q: Neden sütunlu veritabanları analitik için satır-tabanlı depolardan daha hızlı?

Sütunlu veritabanları, sorguların genelde: - Çok sayıda satırı taraması - Sadece birkaç sütunu okuması - , , , gibi aggregateler hesaplaması durumlarında en iyi performansı verir. OLTP tarzı sık küçük güncellemeler veya tek bir ID ile kayıt alma/güncelleme işlemleri için satır tabanlı depolar daha uygundur.

Q: Belge veritabanı hangi durumlarda SQL'den daha mantıklı olur?

Belge veritabanı şu durumlarda mantıklıdır: - Uygulama veriniz JSON-benzeri nesnelere doğal olarak uyuyorsa (profil, katalog, içerik) - Bir öğenin alan yapısı sık değişiyor veya öğeye göre farklılık gösteriyorsa - İç içe yapıları birçok tabloya ayırmak istemiyorsanız Ancak karmaşık join'ler, okuma performansı için veri çoğaltma ve çoklu belge işlemlerinin maliyeti gibi dezavantajlar olabilir.

Q: Anahtar-değer depoları (cache dışında) en çok nerelerde kullanılır?

Anahtar-değer depolarını şu durumlarda kullanın: - Tek bir anahtar ile get/set desenleri (düşük gecikmeli erişim) - Birincil veritabanınızın önünde cache olarak - Oturumlar , rate limiting , özellik bayrakları , alışveriş sepeti gibi hızlı okunup yazılan geçici veriler Unutmayın: serbest sorgulama genelde zayıftır ve ikincil indeks desteği ürünlere göre değişir — çoğunlukla kendi arama anahtarlarınızı tasarlarsınız.

Q: Sütunlu veritabanları ile geniş sütunlu veritabanları arasındaki fark nedir?

İsim benzerliğine rağmen farkları vardır: - Sütunlu veritabanları : analitik için (sütun bazlı okuma + yüksek sıkıştırma) - Geniş sütunlu (wide-column) veritabanları : operasyonel ölçek için (yüksek yazma verimi, yatay ölçek, tahmin edilebilir anahtar tabanlı okumalar) Wide-column sistemlerinde veri modelleme genelde sorgu odaklıdır; esnek SQL tarzı join'ler beklemeyin.

Q: Vektör veritabanları hangi problemi çözer, ana veritabanımın yerine geçer mi?

Vektör veritabanları benzerlik araması (embeddings) için tasarlanmıştır. Sık kullanım örnekleri: - Semantik arama (farklı kelimelerle yazılan ancak anlam olarak ilgili sonuçlar) - RAG : LLM öncesi en alakalı pasajları alma - İçerik tabanlı öneriler Genellikle ana veritabanınızın yerine geçmez: kaynak kayıtlarınızı ilişkisel veya belge veritabanında tutar, embedding'leri ve vektör indekslerini vektör DB'de saklar ve tam kayıt/izinler için sonuçları ana kaynağa bağlarsınız.

İlişkisel, sütunlu, belge, graf, vektör, anahtar-değer ve daha fazlası veritabanı türlerini kullanım durumları, dezavantajları ve doğru seçimi yapmak için ipuçlarıyla karşılaştırın.

“Veritabanı Türleri” Gerçekte Ne Anlatır

"Veritabanı türü" sadece bir etiket değildir—bir sistemin veriyi nasıl sakladığının, nasıl sorgulandığının ve ne için optimize edildiğinin kısa bir özetidir. Bu tercih doğrudan hız (ne hızlı/ne yavaş), maliyet (donanım veya bulut harcamaları) ve yetenekleri (işlemler, analitik, arama, çoğaltma vb.) etkiler.

Türün önemli olmasının nedeni

Farklı veritabanı türleri farklı takaslar yapar:

Bir ilişkisel veritabanı, verileriniz yapılandırılmışsa ve güvenilir işlemlere ihtiyacınız varsa mükemmeldir.
Bir sütunlu veritabanı, çok sayıda satırı tarayıp analitik sorulara cevap verirken parlak sonuç verir.
Bir belge veritabanı, uygulamanızın veri yapısı sık değişiyorsa daha hızlı ilerleyebilir.
Bir graf veritabanı, ilişki ağı yoğun veriler için tasarlanmıştır.
Bir vektör veritabanı, birebir eşleşme yerine “benzerlik” üzerine odaklanır.

Bu tasarım seçimleri şunları etkiler:

Sorgu desenleri: Pek çok küçük arama mı, karmaşık join'ler mi yoksa geniş analitik taramalar mı?
Ölçek modeli: Tek büyük makineyle mi ölçekleneceksiniz yoksa birçok makineye mi dağıtacaksınız?
Veri modeli: Tablolar, belgeler, anahtar-değer çiftleri, grafikler, vektörler ya da zaman damgalı noktalar.

Bu rehberde neler öğreneceksiniz

Bu makale, ana veritabanı türlerini ele alır ve her biri için:

En iyi olduğu alanlar (ve zayıf olduğu noktalar)
Gerçek ürünlerdeki tipik kullanım durumları
Performans, maliyet ve karmaşıklığı etkileyen temel takaslar

“Çok model” sistemlere kısa not

Birçok modern ürün sınırları bulanıklaştırır. Bazı ilişkisel veritabanları JSON desteği ekleyerek belge veritabanı ile örtüşebilir. Bazı arama ve analitik platformlar, vektör veritabanı gibi vektör indeksleme sunabilir. Diğerleri akış ve depolamayı zaman serisi özellikleriyle birleştirir.

Dolayısıyla “tür” kesin bir kutu değildir—yine de varsayılan güçlü yönleri ve hangi iş yüklerinin iyi çalıştığını anlamak için kullanışlıdır.

Bu rehberi kullanarak seçenekleri daraltma

Ana iş yükünüzle başlayın:

Yapısal veri ve işlemler gerekiyorsa ilişkisel veritabanı ile başlayın.
Ağır raporlama ve paneller yapıyorsanız sütunlu veritabanı veya ambarı değerlendirin.
Uygulama verinizin biçimi sık değişiyorsa belge veritabanı düşünün.
Çok hızlı anahtar ile aramalar gerekiyorsa anahtar-değer deposu güçlü bir adaydır.

Sonra "Doğru Veritabanı Türünü Nasıl Seçersiniz" bölümünü kullanarak ölçek, tutarlılık ihtiyaçları ve en sık çalıştıracağınız sorgulara göre daraltın.

İlişkisel Veritabanları (SQL): Yapılandırılmış Veri için Varsayılan

İlişkisel veritabanları birçok kişinin "veritabanı" dediğinde aklına gelen şeydir. Veri satırlar (kayıtlar) ve sütunlar (alanlar) içeren tablolar halinde düzenlenir. Bir şema, her tablonun neye benzediğini—hangi sütunların olduğunu, türlerini ve tabloların birbirleriyle nasıl ilişkili olduğunu—tanımlar.

SQL neden bu kadar yaygın

İlişkisel sistemler genellikle SQL (Structured Query Language) ile sorgulanır. SQL okunması ve ifade gücü nedeniyle popülerdir:

Verileri filtreleyip sıralayabilirsiniz (WHERE, ORDER BY).
Tablolar arasında veri birleştirebilirsiniz (JOIN).
Sonuçları özetleyebilirsiniz (GROUP BY).

Çoğu raporlama aracı, analitik platform ve iş uygulaması SQL konuşur; bu da geniş uyumluluk gerektiğinde onu güvenli bir varsayılan yapar.

ACID işlemlerini basitçe anlatmak

İlişkisel veritabanları ACID işlemleri ile bilinir, bu da verinin doğruluğunu korumaya yardımcı olur:

Atomicity: Çok adımlı bir değişiklik "hepsi ya da hiçbiri" şeklindedir.
Consistency: Yabancı anahtar gibi kurallar değişiklikten sonra da geçerli kalır.
Isolation: Eşzamanlı güncellemeler birbirini bozmaz.
Durability: Kaydedilen veri çökmelerden sonra da kalır.

Bu, müşteri üzerinde çift ücretlendirme veya stok güncellemesini kaybetme gibi hataların maliyetli olduğu durumlarda önemlidir.

En uygun iş yükleri

İlişkisel veritabanı genellikle yapılandırılmış, iyi tanımlanmış veriler için uygundur:

İş uygulamaları (CRM/ERP benzeri sistemler)
Finans, ödemeler, faturalama
Envanter, siparişler, rezervasyonlar

Dikkat edilmesi gereken yaygın tuzaklar

Aynı yapı güvenilirliği sağlarken sürtünme de ekleyebilir:

Sert şemalar: Veri yapısındaki sık değişiklikler migration gerektirebilir.
Join ağırlıklı ölçekleme: Büyük tablolarda çok sayıda join yüksek ölçeklerde yavaşlayabilir veya maliyetli olabilir, özellikle veri birçok makineye dağıtıldıysa.

Veri modeliniz sürekli değişiyorsa veya daha basit erişim desenleriyle ekstrem yatay ölçek gerekiyorsa başka veritabanı türleri daha uygun olabilir.

Sütunlu Veritabanları: Analitik için Tasarlandı

Sütunlu veritabanları veriyi "satır" yerine "sütun" bazında depolar. Bu tek değişiklik, analitik iş yükleri için hız ve maliyet üzerinde büyük etki yapar.

Satır deposu vs sütun deposu

Geleneksel bir satır deposunda (ilişkisel veritabanlarında yaygın) bir kaydın tüm değerleri birlikte durur. Bu, genellikle bir müşteri/siparişi tek tek alma/güncelleme durumlarında iyidir.

Sütun deposunda ise aynı alanın tüm değerleri birlikte durur—tüm price, tüm country, tüm timestamp. Bu, bir rapor için sadece birkaç sütunu okumayı verimli kılar; tüm satırları diskten çekmek gerekmez.

Sütunlunun raporlama için hızlı olmasının nedeni

Analitik ve BI sorguları genellikle:

Çok sayıda kaydı tarar
Az sayıda sütun seçer
SUM, AVG, COUNT gibi aggregateler hesaplar ve boyutlara göre gruplaştırır

Sütunlu depolama bu desenleri hızlandırır çünkü daha az veri okunur ve benzer değerler birlikte kümelendiğinden sıkıştırma çok iyi çalışır. Birçok sütunlu motor ayrıca vektörize yürütme ve akıllı indeksleme/bölümlendirme ile büyük taramaları hızlandırır.

Tipik sorgu desenleri

Sütunlu sistemler panolar ve raporlama için idealdir: “haftalık gelir”, “bölgeye göre ilk 20 ürün”, “kanala göre dönüşüm oranı” veya “son 30 günde servise göre hatalar” gibi sorgular.

Dezavantajlar: OLTP güncellemeleri ve nokta okumalar

İş yükünüz çoğunlukla "ID ile bir kayıt al" veya "tek bir satırı saniyede onlarca kez güncelle" ise sütunlu sistemler daha yavaş veya daha maliyetli hissedilebilir. Yazma genellikle toplu (append-heavy) alım için optimize edilir; sık, küçük güncellemeler daha zordur.

En iyi uyduğu yerler

Sütunlu veritabanları iyi bir eşleşmedir:

BI ve yönetici panoları
Olay ve clickstream analitiği
Loglar veya işlemler üzerinde büyük ölçekli raporlama

Hedefiniz çok veri üzerinde hızlı aggregasyonlarsa, sütunlu ilk değerlendireceğiniz veritabanı türüdür.

Belge Veritabanları: Uygulama Verisi için Esnek Şemalar

Belge veritabanları veriyi "belge" olarak saklar—çoğunlukla JSON'a benzeyen, kendi içinde tamamlı kayıtlar. Bilgiyi birçok tabloya bölmek yerine, genellikle ilgili alanları aynı nesnede (iç içe diziler ve alt nesneler dahil) tutarsınız. Bu onları uygulama verisi için doğal bir seçim yapar.

Belge modeli (JSON-benzeri kayıtlar)

Bir belge bir kullanıcıyı, ürünü veya makaleyi temsil edebilir—her biri farklı alanlara sahip olabilir. Bir ürün size ve color içerebilirken başka bir ürün dimensions ve materials içerebilir; tüm kayıtlara zorunlu tek bir şema dayatılmaz.

Bu esneklik, gereksinimler sık değiştiğinde veya öğelerin farklı alan setlerine sahip olduğu durumlarda özellikle faydalıdır.

Kısaca indeksleme

Her belgeyi taramamak için belge veritabanları indeksler kullanır—veritabanının bir sorgu için eşleşen belgeleri hızlıca bulmasına yardımcı olan veri yapıları. Yaygın alanları (ör. email, sku, status) indeksleyebilirsiniz ve birçok sistem iç içe alanları da (address.city gibi) indeksleyebilir. İndeksler okumaları hızlandırır ancak belgeler değiştiğinde indeksi güncellemek yazma maliyetini artırır.

Güçlü yönler ve takaslar

Belge veritabanları, değişen şemalar, iç içe veri ve API-dostu yükler ile iyi çalışır. Dezavantajlar genelde şunlardır:

Birçok varlığı kapsayan karmaşık join'ler (ilişkisel veritabanındaki kadar doğal olmayabilir)
Yüksek ölçekte çoklu belge işlemleri (birçok üründe desteklenir ama performans maliyeti olabilir)
Katmanlı normalizasyon ihtiyacı (takımlar okuma performansı için veriyi kopyalamaya eğilimli olabilir; bu da güncelleme mantığı gerektirir)

Yaygın kullanım durumları

İçerik yönetimi, ürün katalogları, kullanıcı profilleri ve backend API'ler gibi verinin “her ekran/sayfa için bir nesne” şeklinde eşlendiği yerlerde güçlü bir seçimdir.

Anahtar-Değer Depoları: Basit ve Çok Hızlı Aramalar

Anahtar-değer depoları en basit modeldir: bir değer (string'den JSON blob'a kadar her şey) saklanır ve benzersiz bir anahtar ile alınır. Temel işlem "bu anahtarın değeri nedir" olduğundan bu sistemler son derece hızlı olabilir.

Anahtar-değer modeli (neden hızlıdır)

Okuma/yazma tek bir birincil anahtar etrafında döndüğünden, anahtar-değer depoları düşük gecikme ve yüksek verim için optimize edilebilir. Birçoğu sıcak veriyi hafızada tutmak, karmaşık sorgu planlamasını azaltmak ve yatay ölçek sağlamak üzere tasarlanmıştır.

Bu sadelik veri modellemesini de şekillendirir: veritabanından "geçen hafta Berlin'de kayıt olan tüm kullanıcıları bul" demek yerine, genellikle doğrudan hedef kaydı işaret eden anahtarlar (user:1234:profile) tasarlarsınız.

Cache ve oturumlar için popülerliği

Anahtar-değer depoları genellikle daha yavaş ana veritabanının önünde cache olarak kullanılır. Uygulamanız aynı veriye tekrar tekrar ihtiyaç duyuyorsa—ürün detayları, kullanıcı izinleri, fiyat kuralları—sonucu anahtarla cache'leyip yeniden hesaplama veya tekrar sorgulamadan kaçınırsınız.

Ayrıca oturum depolama için de doğal bir seçimdir (ör. session:<id> -> session data) çünkü oturumlar sık okunup güncellenir ve otomatik süre aşımı (TTL) ile temizlenebilir.

TTL, eleme ve bellek vs disk

Çoğu anahtar-değer deposu TTL (time to live) destekler; bu, oturumlar, tek kullanımlık tokenler ve rate limit sayaçları için idealdir.

Bellek sınırlıysa, sistemler genellikle en az kullanılanı silme (LRU) gibi eleme politikaları kullanır. Bazıları bellek öncelikli, bazıları ise dayanıklılık için diske veri yazabilir. Bellek ile disk arasındaki seçim genellikle hız (bellek) mı yoksa saklama/geri kazanım (disk/persist) mı optimize ettiğinize bağlıdır.

Bilinmesi gereken takaslar

Anahtar-değer depoları anahtarı zaten biliyorsanız çok hızlıdır. Açık uçlu sorgulamalar için daha az uygundur.

Birçok ürünün ikincil indeks desteği sınırlıdır; bazıları bunu sağlar, bazıları kısmi seçenekler sunar, bazıları ise kendi arama anahtarlarınızı korumanızı teşvik eder.

Yaygın kullanım durumları

Anahtar-değer depoları için iyi eşleşmeler:

Rate limiting: kullanıcı/IP başına TTL pencere içinde sayaçlar
Feature flag'ler: kullanıcı veya kohorta göre hızlı kararlar
Alışveriş sepetleri: kullanıcı/oturum anahtarı ile hızlı güncellemeler

Erişim deseniniz "ID ile al/güncelle" ise ve gecikme önemliyse, anahtar-değer deposu genellikle en basit ve güvenilir hız çözümüdür.

Geniş Sütunlu Veritabanları: Ölçeklenebilir Operasyonel Depolama

SQL ile kolay başlangıç yapın

İhtiyaçlarınızı netleştirirken ilişkisel şemanızı ve CRUD akışlarını Koder.ai ile hızlıca prototipleyin.

Ücretsiz Deneyin

Geniş sütunlu veritabanları (wide-column stores) veriyi sütun aileleri halinde düzenler. Her satır için aynı sütunların zorunlu olduğu tek bir sabit tablo yerine, ilişkili sütunları gruplayabilir ve her satırda aile içinde farklı sütun setleri saklayabilirsiniz.

Geniş sütunlu ile sütunlu analitik arasındaki fark

İsim benzerliğine rağmen, sütunlu analitik veritabanı ile geniş sütunlu farklı amaçlara hizmet eder.

Sütunlu veritabanı analitik için her sütunu ayrı depolayıp büyük veri setlerini verimli taramaya odaklanır.
Geniş sütunlu veritabanı operasyonel iş yükleri için tasarlanmıştır: çok sayıda yazma, yatay ölçek ve anahtar bazlı öngörülebilir okuma.

Parladıkları yerler

Geniş sütunlu sistemler genellikle:

Yüksek yazma verimi (saniyede çok sayıda olay alımı)
Yatay ölçeklenebilirlik (daha fazla trafik ve veri için düğüm ekleme)
Doğru anahtar ile tahmin edilebilir, düşük gecikmeli okumalar

Tipik erişim deseni

En yaygın desen şudur:

Partition key bilir (verinin nerede durduğunu belirler) ve
Genellikle o partition içinde bir aralık okunur (ör. "cihaz X için 10:00–10:05 arasındaki tüm olaylar").

Bu, zaman sıralı veri ve append-heavy iş yükleri için güçlü bir uyum sağlar.

Anlanması gereken takaslar

Wide-column veritabanlarında veri modelleme sorgu odaklıdır: tabloları çalıştıracağınız kesin sorgular etrafında tasarlarsınız. Bu, farklı erişim desenlerini desteklemek için veriyi farklı şekillerde çoğaltma anlamına gelebilir.

Ayrıca genelde sınırlı join desteği ve ilişkisel veritabanındaki kadar esnek ad-hoc sorgu seçenekleri vardır. Uygulamanız karmaşık ilişkiler ve esnek sorgulamalar gerektiriyorsa, kendinizi kısıtlanmış hissedebilirsiniz.

Yaygın kullanım durumları

Geniş sütunlu veritabanları sıklıkla IoT olayları, mesajlaşma ve aktivite akışları ve hızlı yazma ile tahmin edilebilir anahtar tabanlı okumaların ön planda olduğu büyük ölçekli operasyonel veriler için kullanılır.

Graf Veritabanları: İlişkileri Birinci Sınıf Veri Olarak Ele Almak

Graf veritabanları birçok gerçek sistemin davrandığı şekilde veriyi saklar: şeylerin birbirine bağlı olduğu biçimde. İlişkileri tablolar ve ilişki tablolarına zorlamak yerine bağlar modelin parçasıdır.

Grafik modeli: düğümler, kenarlar ve özellikler

Bir graf genellikle şunlardan oluşur:

Düğümler: varlıklar (insanlar, hesaplar, cihazlar, ürünler)
Kenarlar: aralarındaki ilişkiler ("takip ediyor", "ödedi", "ait", "gönderildi")
Özellikler: düğümlerde ve kenarlarda anahtar-değer nitelikler (zaman damgaları, miktarlar, etiketler)

Bu, ağları, hiyerarşileri ve çoktan-çoğa ilişkileri şemayı zorlamadan temsil etmeyi doğal kılar.

Gezinmeler neden join'lerden daha iyi olabilir

İlişki ağı yoğun sorgular, ilişkisel veritabanında genellikle çok sayıda join gerektirir. Her ek join veri büyüdükçe karmaşıklık ve maliyet ekleyebilir.

Graf veritabanları gezinmeler için tasarlanmıştır—bir düğümden bağlı düğümlere, sonra onların bağlantılarına yürümek vb. Sorularınız sık sık "2–6 adım içinde bağlı olanları bul" gibiyse, gezinmeler ağ büyüse bile hızlı ve okunaklı kalabilir.

Grafın özellikle iyi yanıtladığı sorular

Graf veritabanları şunlarda parlamak için uygundur:

Yollar ve ayrılma dereceleri (en kısa yol, erişim)
Öneriler ("X'i satın alanlar Y'yi de aldı", "arkadaşların arkadaşları")
Dolandırıcılık halkaları ve anomali desenleri (paylaşılan cihazlar, adresler, ödeme yöntemleri)

Planlamanız gereken takaslar

Graflar ekipler için bir paradigma değişimi olabilir: veri modelleme farklıdır ve sorgu dilleri (genellikle Cypher, Gremlin veya SPARQL) yeni olabilir. Modelin sürdürülebilir kalması için ilişki tipleri ve yönü konusunda net konvansiyonlar istenir.

Ne zaman ilişkisel model yeterlidir

İlişkileriniz basitse, sorgular çoğunlukla filtre/aggregasyon ise ve birkaç join "bağlantılı" parçaları karşılıyorsa, ilişkisel veritabanı çoğunlukla daha basit bir seçim olabilir—özellikle işlemler ve raporlama zaten çalışıyorsa.

Vektör Veritabanları: AI Uygulamaları için Benzerlik Araması

Korkmadan yinele

Güvenli bir sıfırlama gerektiğinde şema ve özellik değişikliklerini anlık görüntüler ve geri alma ile yönetin.

Anlık Görüntüleri Kullan

Vektör veritabanları belirli bir soru türü için tasarlanmıştır: "Bu öğeye en çok benzeyen öğeler hangileri?". Kesin eşleşme (ID veya anahtar kelime) yerine, AI modellerinin ürettiği embedding'leri—metin, görüntü, ses, ürünlerin sayısal temsillerini—karşılaştırırlar. Anlam olarak benzer öğelerin embedding'leri çok boyutlu uzayda birbirine yakın olur.

Vektörler semantik aramayı nasıl açar

Normal bir arama, farklı ifadelerle yazılmış sonuçları kaçırabilir ("laptop sleeve" vs "notebook case"). Embedding'lerle benzerlik anlam üzerinden ölçülür, bu yüzden tam kelime eşleşmesi olmasa bile ilgili sonuçları getirebilir.

Temel işlemler: benzerlik + filtreler

Ana işlem en yakın komşu (nearest neighbor) aramasıdır: bir sorgu vektörü verildiğinde en yakın vektörleri alın.

Gerçek uygulamalarda genellikle benzerliği şu filtrelerle birleştirirsiniz:

Sadece belirli bir müşteriye ait belgeleri göster
Bir ürün kategorisi veya dil ile sınırlandır
Arşivlenmiş veya düşük kaliteli öğeleri hariç tut

Bu “filtre + benzerlik” deseni vektör aramayı gerçek veri kümeleri için pratik kılar.

Nerede kullanılır

Yaygın kullanım alanları:

RAG (Retrieval-Augmented Generation): LLM cevaplamadan önce en alakalı pasajları getirme
Semantik arama: bilgi tabanları, destek ticket'ları veya dahili dokümanlar
Öneriler: içerik benzerliğine dayalı "kullanıcılar ayrıca şunu da görüntüledi/satın aldı"

Bilinmesi gereken takaslar

Vektör arama özel indekslere dayanır. Bu indeksleri kurmak ve güncellemek zaman alabilir ve önemli bellek kullanımı olabilir. Genellikle daha yüksek recall (gerçekteki en iyi eşleşmeleri daha çok bulma) ile daha düşük gecikme (daha hızlı cevap) arasında tercihler yaparsınız.

İlişkisel veya belge depolarıyla eşleştirme

Vektör veritabanları nadiren ana veritabanınızın yerini alır. Yaygın kurulum: "kayıt kaynağını" (siparişler, kullanıcılar, dokümanlar) ilişkisel veya belge veritabanında tutun; embedding'leri ve arama indekslerini vektör veritabanında saklayın—sonra tam kayıtlar ve izinler için sonuçları ana kaynağa bağlayın.

Zaman Serisi Veritabanları: Zaman İçindeki Metrikler için Optimize

Zaman serisi veritabanları (TSDB'ler), sürekli gelen ve her zaman bir zaman damgasına bağlı veriler için tasarlanmıştır. CPU kullanımı her 10 saniye, API gecikmesi her istek için, sensör okumaları her dakika veya hisse senedi fiyatları saniyede birden fazla değişebilir—bunlar örnek zaman serisi verisidir.

Zaman serisi verisi nasıl görünür

Çoğu zaman serisi kayıt şunları birleştirir:

Zaman damgası: ölçümün ne zaman alındığı
Metrik/değer: izlenen sayı (gecikme, sıcaklık, fiyat)
Etiketler: filtre ve gruplayma için meta veri (host=web-01, region=us-east, service=checkout)

Bu yapı "servise göre hata oranını göster" veya "bölgeler arası gecikmeyi karşılaştır" gibi soruları kolaylaştırır.

TSDB'lerin dayandığı performans özellikleri

Veri hacmi hızla büyüyebildiği için TSDB'ler genellikle şunlara odaklanır:

Sıkıştırma: uzun sayı dizilerini verimli saklama
Retansiyon politikaları: eski veriyi otomatik olarak silme (örn. ham veriyi 7 gün, özetleri 90 gün tutma)
Downsampling: ayrıntıyı özetlere yuvarlama (saniye başına → dakika başına → saat başına)

Bu özellikler depolama ve sorgu maliyetlerini tahmin edilebilir tutar.

Yaygın sorgu desenleri

TSDB'ler zaman bazlı hesaplamalarda iyidir:

Hareketli ortalamalar (ör. 5-dakika hareketli ortalama)
Persentiller (p95/p99 gecikme)
Değişim hızı (istek/saniye)
Eşik veya anomali uyarıları

Nerede uygun, nerede değil

Tipik kullanım: monitoring, observability, IoT/sensör ve finansal tick verisi.

Dezavantaj: TSDB'ler derin, ad-hoc ilişkiler ve çoklu varlıklar arasındaki karmaşık join'ler için ideal değildir. Bu tür sorgular için ilişkisel veya graf veritabanı genellikle daha uygundur.

Ambarlar ve Lakehouse'lar: Kurumsal Ölçekte Analitik

Bir veri ambarı tek bir veritabanı türünden çok bir iş yükü + mimaridir: birçok ekibin büyük tarihsel veriyi sorguladığı (ciro trendleri, churn, envanter riski) merkezi, analitik ve paylaşılan bir ortam. Yönetilen ürün olarak alınabilir, ama ambarı ambar yapan kullanım şeklidir.

Batch vs streaming alımı (basit versiyon)

Çoğu ambar veriyi iki yolla alır:

Batch alım: veri saatlik/günlük iner (örn. uygulama veritabanından gece dışa aktarma). Daha ucuz ve basit ama gerçek zamanlı değil.
Streaming alım: olaylar sürekli akar (tıklamalar, ödemeler, IoT). Daha güncel sayılar görürsünüz ama boru hatları ve izleme daha önem kazanır.

Neden hızlılar: sütunlu depolama, bölümlendirme, materialized view'lar

Ambarlar analitik için birkaç pratik hile kullanır:

Sütunlu depolama sadece rapor için gereken sütunları okur.
Partitioning büyük tabloları zaman veya bölgeye göre bölerek daha az veri taranmasını sağlar.
Materialized views önceden hesaplanmış sonuçları (örn. "ülkeye göre günlük satış") saklayarak panoları hızlandırır.

Ölçeklenince yönetişim zorunludur

Bölümlerin aynı sayılara güvenmesi halinde, erişim kontrolü, denetim izleri ve lineage (bir metriğin nereden geldiği ve nasıl dönüştüğü) gerekir. Bu genellikle sorgu hızından en az aynı derecede önemlidir.

Lakehouse ne zaman mantıklıdır

Lakehouse, ambar tarzı analitik ile veri gölü esnekliğini birleştirir—hem işlenmiş tablolar hem de ham dosyalar (loglar, görseller, yarı-yapılandırılmış olaylar) için tek bir yer istediğinizde uygundur. Veri hacmi yüksek, formatlar çeşitli ve yine de SQL-dostu raporlama istiyorsanız lakehouse iyi bir tercih olabilir.

Temel Takaslar: Tutarlılık, Ölçek ve Sorgu Desenleri

Kodunuzu taşınabilir tutun

Yığını ve veri katmanınızı tam kontrol altında tutmak için kaynak kodunu istediğiniz zaman dışa aktarın.

Kodu Dışa Aktar

Veritabanı türleri arasında seçim "en iyi"den çok "uygun" ile ilgilidir: verinizle ne yapmanız gerektiği, ne kadar hızlı gerektiği ve sistem parçalandığında ne olacağı önemlidir.

OLTP vs OLAP (iş yüküne göre eşle)

Kısa bir kural:

OLTP (çevrimiçi işlemler): çok sayıda küçük okuma/yazma (checkout, girişler, sipariş güncellemeleri). Öncelikler: düşük gecikme, doğru güncellemeler, çok sayıda eşzamanlı kullanıcı.
OLAP (analitik): daha az ama daha ağır sorgular, çok sayıda satırı tarama (panolar, eğilimler). Öncelikler: hızlı aggregasyon, sütunlu depolama, hesaplama ile depolamayı ayırma.

İlişkisel veritabanları genelde OLTP için iyidir; sütunlu sistemler, ambarlar ve lakehouse'lar OLAP için yaygındır.

CAP basitçe

Ağ bölünmesi olduğunda genelde üçünden hepsini aynı anda elde edemezsiniz:

Consistency: herkes hemen aynı veriyi görür.
Availability: sistem cevap vermeye devam eder.
Partition tolerance: ağ bölünmelerine rağmen çalışmaya devam eder.

Birçok dağıtık veritabanı sorunlarda erişilebilir kalmayı seçer ve sonra uzlaşır (eventual consistency). Diğerleri sıkı doğruluğu önceliklendirir ve sağlıklı olana kadar bazı istekleri reddeder.

Ölçekleme: dikey, yatay ve sharding

Dikey ölçekleme: daha büyük makine—basit ama sınırlı.
Yatay ölçekleme: daha fazla makine—daha fazla kapasite, daha fazla koordinasyon.
Sharding: veriyi düğümler arasında bölme (genelde müşteri ID'sine göre). Ölçeği artırır ama shard'lar arası sorgular ve işlemler zorlaşır.

İşlemler ve eşzamanlılık temelleri

Birçok kullanıcı aynı veriyi güncelliyorsa net kurallara ihtiyacınız var. İşlemler adımları "her şeyi ya da hiçbir şeyi" şeklinde paketler. Kilitler ve izolasyon seviyeleri çatışmaları engeller ama verimi düşürebilir; daha gevşek izolasyon hız kazandırır ama anomalilere izin verebilir.

Operasyonel endişeler (bunları atlamayın)

Erken dönemde yedekleme, çoğaltma ve felaket kurtarma planlayın. Geri yüklemeleri test etmenin, lag'ı izlemenin ve yükseltmeleri yapmanın kolay olup olmadığını değerlendirin—bu ikinci gün operasyonları genellikle sorgu hızından en az aynı derecede önemlidir.

Doğru Veritabanı Türünü Nasıl Seçersiniz

Anahtar, trend değil, verinizle ne yapmanız gerektiğidir. Pratik bir başlangıç, sorgularınız ve iş yüklerinizden geriye doğru çalışmaktır.

1) Sorgularınızdan başlayın (verinizden değil)

Uygulamanızın veya ekibinizin yapması gereken ilk 5–10 şeyi yazın:

En sık neyi okursunuz (tek kayıt sorguları, filtreler, join'ler, aggregasyonlar, benzerlik araması)?
En sık ne yazarsınız (tek-satır eklemeler, olay akışları, güncellemeler, toplu yüklemeler)?
Sonuçlar ne kadar taze olmalı (milisaniye, saniye, dakika)?

Bu, herhangi bir özellik kontrol listesinden daha hızlı seçenekleri daraltır.

2) Verinin şekline uygun eşleştirme

Hızlı "şekil" kontrolü:

Yapısal, tutarlı alanlar → ilişkisel veritabanı
Sık değişen yarı-yapılandırılmış JSON → belge veritabanı
Derin çoktan-çoğa ilişkiler → graf veritabanı
Embedding'ler ve en yakın komşu araması → vektör veritabanı
Zaman damgalı olaylar ve rollup'lar → zaman serisi veritabanı
Büyük ölçekli, öngörülebilir erişim desenleri → geniş sütunlu veritabanı
Çok basit get/set → anahtar-değer deposu
Ağır analitik taramaları ve aggregasyonlar → sütunlu veritabanı (veya ambar)

3) Gecikme, verim ve maliyet sürücülerini erken netleştirin

Performans hedefleri mimariyi belirler. Kabaca sayıları belirleyin (p95 gecikme, saniye başına okuma/yazma, veri saklama). Maliyet genelde şunlardan oluşur:

Depolama (ham veri + replikalar)
Hesaplama (sorgular, ETL/ELT, arka plan işleri)
Çoğaltma (çok-bölge, yüksek erişilebilirlik)
İndeksleme (daha hızlı sorgular, daha fazla yazma yükü)

4) Basit bir karar tablosu

Birincil kullanım	Genelde en iyi seçim	Neden
İşlemler, faturalar, kullanıcı hesapları	İlişkisel (SQL)	Güçlü kısıtlar, join'ler, tutarlılık
Alanı değişen uygulama verisi	Belge	Esnek şema, doğal JSON
Gerçek zamanlı cache/oturum durumu	Anahtar-değer	Anahtar ile hızlı okuma
Zaman serisi ve tıklama akışları	Zaman serisi	Yüksek ingest + zaman bazlı sorgular
BI panoları, büyük aggregasyonlar	Sütunlu	Hızlı tarama + sıkıştırma
Sosyal / bilgi ilişkileri	Graf	Etkili ilişki gezinmesi
Semantik arama, RAG retrieval	Vektör	Embedding'ler üzerinde benzerlik araması
Devasa operasyonel veri	Geniş sütunlu	Yatay ölçek, tahmin edilebilir sorgular

Birçok ekip iki veritabanı kullanır: operasyon için (ör. ilişkisel) ve analiz için (ör. sütunlu/ambar). "Doğru" seçim, en önemli sorgularınızı en basit, en hızlı ve en ucuz şekilde çalıştıran seçenektir.

Hızlı ürün geliştirme notu

Prototip veya yeni özellikleri hızlıca yayınlarken, veritabanı kararı genelde geliştirme iş akışınıza bağlı olur. Koder.ai gibi platformlar (sohbetten web, arka uç ve mobil uygulamalar üreten vibe-coding platformu) bunu somutlaştırabilir: örneğin, Koder.ai'nin varsayılan arka uç yığını Go + PostgreSQL kullanır—bu, işlem doğruluğu ve geniş SQL araç desteği gerektiğinde güçlü bir başlangıçtır.

Ürününüz büyüdükçe özel veritabanları (semantik arama için vektör DB veya analiz için sütunlu ambar) ekleyebilirsiniz; Postgres'i kayıt kaynağı olarak tutmak yaygın bir yaklaşımdır. Önemli olan bugün desteklemeniz gereken iş yükleri ile başlamak ve sorgu desenleri gerektirdiğinde "ikinci bir depo ekleme" seçeneğini açık tutmaktır.

SSS

“Veritabanı türü” pratikte ne anlama geliyor?

Bir “veritabanı türü” pratikte üç şeyi anlatır:

Veri modeli (tablolar, belgeler, anahtar-değer çiftleri, grafikler, vektörler, zaman damgalı noktalar)
Optimizasyon yapılan sorgu desenleri (join'ler, tarama/aggregasyon, gezinmeler, benzerlik araması)
Ölçekleme ve tutarlılık takasları (tek makine mi yoksa yatay ölçek mi, sıkı mi yoksa nihai tutarlılık mı)

Türü seçmek, performans, maliyet ve operasyonel karmaşıklık için varsayılanları belirlemektir.

Aşırı düşünmeden doğru veritabanı türünü nasıl seçerim?

En kolay yol, en sık yaptığınız 5–10 sorgu ve yazma desenini belirlemektir, sonra onları uygun güçlü yönlerle eşleyin:

Ne zaman ilişkisel (SQL) veritabanı kullanmalıyım?

İlişkisel veritabanları güçlü bir varsayıldır; özellikle ihtiyacınız varsa:

Yapısal, iyi tanımlanmış şemalar
ACID işlemler (para, envanter, siparişler için doğruluk)
Join'ler ve kısıtlar (foreign key gibi tutarlılık kuralları)

Ancak şema sürekli değişiyorsa veya join ağırlıklı sorguların parçalanmış shard'larda çalışması gerekiyorsa zorluk yaşayabilirsiniz.

ACID işlemler nedir ve en çok ne zaman önemseriz?

ACID, çok adımlı değişikliklerin güvenilir olmasını sağlar:

Atomicity: tüm adımlar ya başarır ya da hiçbiri gerçekleşmez
Consistency: kurallar/kısıtlar değişiklikten sonra korunur
Isolation: eşzamanlı işlemler birbirini bozmaz
Durability: onaylanan veriler çökmelerden sonra kalır

Özellikle maliyetli hataların olduğu işlemler (ödeme, rezervasyon, envanter) için kritiktir.

Neden sütunlu veritabanları analitik için satır-tabanlı depolardan daha hızlı?

Sütunlu veritabanları, sorguların genelde:

Çok sayıda satırı taraması
Sadece birkaç sütunu okuması
SUM, COUNT, AVG, GROUP BY gibi aggregateler hesaplaması

Belge veritabanı hangi durumlarda SQL'den daha mantıklı olur?

Belge veritabanı şu durumlarda mantıklıdır:

Uygulama veriniz JSON-benzeri nesnelere doğal olarak uyuyorsa (profil, katalog, içerik)
Bir öğenin alan yapısı sık değişiyor veya öğeye göre farklılık gösteriyorsa
İç içe yapıları birçok tabloya ayırmak istemiyorsanız

Ancak karmaşık join'ler, okuma performansı için veri çoğaltma ve çoklu belge işlemlerinin maliyeti gibi dezavantajlar olabilir.

Anahtar-değer depoları (cache dışında) en çok nerelerde kullanılır?

Anahtar-değer depolarını şu durumlarda kullanın:

Tek bir anahtar ile get/set desenleri (düşük gecikmeli erişim)
Birincil veritabanınızın önünde cache olarak
Oturumlar, rate limiting, özellik bayrakları, gibi hızlı okunup yazılan geçici veriler

Sütunlu veritabanları ile geniş sütunlu veritabanları arasındaki fark nedir?

İsim benzerliğine rağmen farkları vardır:

Sütunlu veritabanları: analitik için (sütun bazlı okuma + yüksek sıkıştırma)
Geniş sütunlu (wide-column) veritabanları: operasyonel ölçek için (yüksek yazma verimi, yatay ölçek, tahmin edilebilir anahtar tabanlı okumalar)

Wide-column sistemlerinde veri modelleme genelde sorgu odaklıdır; esnek SQL tarzı join'ler beklemeyin.

Ne zaman graf veritabanı kullanmalıyım, ilişkisel tablolar yerine?

Graf veritabanını tercih edin quando temel sorularınız ilişkilere dayanıyorsa:

Ayrılıklar ve bağlantı dereceleri (en kısa yol, erişilebilirlik)
Bağlantılara dayalı öneriler
Dolandırıcılık halkaları ve paylaşılan nitelikler

Graflar gezinmeler (traversals) için optimize edilmiştir; ilişkileri birçok join ile modellemek yerine doğrudan bağlantıları kullanırsınız. Dezavantajı ise yeni modelleme alışkanlıkları ve Cypher/Gremlin/SPARQL gibi sorgu dillerinin öğrenilmesidir.

Vektör veritabanları hangi problemi çözer, ana veritabanımın yerine geçer mi?

Vektör veritabanları benzerlik araması (embeddings) için tasarlanmıştır. Sık kullanım örnekleri:

Semantik arama (farklı kelimelerle yazılan ancak anlam olarak ilgili sonuçlar)
RAG: LLM öncesi en alakalı pasajları alma
İçerik tabanlı öneriler

Genellikle ana veritabanınızın yerine geçmez: kaynak kayıtlarınızı ilişkisel veya belge veritabanında tutar, embedding'leri ve vektör indekslerini vektör DB'de saklar ve tam kayıt/izinler için sonuçları ana kaynağa bağlarsınız.

20 Ağu 2025·8 dk

Veritabanı Türleri: İlişkisel, Sütunlu, Belge, Graf ve Daha Fazlası

“Veritabanı Türleri” Gerçekte Ne Anlatır

Türün önemli olmasının nedeni

Farklı veritabanı türleri farklı takaslar yapar:

Bir ilişkisel veritabanı, verileriniz yapılandırılmışsa ve güvenilir işlemlere ihtiyacınız varsa mükemmeldir.
Bir sütunlu veritabanı, çok sayıda satırı tarayıp analitik sorulara cevap verirken parlak sonuç verir.
Bir belge veritabanı, uygulamanızın veri yapısı sık değişiyorsa daha hızlı ilerleyebilir.
Bir graf veritabanı, ilişki ağı yoğun veriler için tasarlanmıştır.
Bir vektör veritabanı, birebir eşleşme yerine “benzerlik” üzerine odaklanır.

Bu tasarım seçimleri şunları etkiler:

Sorgu desenleri: Pek çok küçük arama mı, karmaşık join'ler mi yoksa geniş analitik taramalar mı?
Ölçek modeli: Tek büyük makineyle mi ölçekleneceksiniz yoksa birçok makineye mi dağıtacaksınız?
Veri modeli: Tablolar, belgeler, anahtar-değer çiftleri, grafikler, vektörler ya da zaman damgalı noktalar.

Bu rehberde neler öğreneceksiniz

Bu makale, ana veritabanı türlerini ele alır ve her biri için:

En iyi olduğu alanlar (ve zayıf olduğu noktalar)
Gerçek ürünlerdeki tipik kullanım durumları
Performans, maliyet ve karmaşıklığı etkileyen temel takaslar

“Çok model” sistemlere kısa not

Dolayısıyla “tür” kesin bir kutu değildir—yine de varsayılan güçlü yönleri ve hangi iş yüklerinin iyi çalıştığını anlamak için kullanışlıdır.

Bu rehberi kullanarak seçenekleri daraltma

Ana iş yükünüzle başlayın:

Yapısal veri ve işlemler gerekiyorsa ilişkisel veritabanı ile başlayın.
Ağır raporlama ve paneller yapıyorsanız sütunlu veritabanı veya ambarı değerlendirin.
Uygulama verinizin biçimi sık değişiyorsa belge veritabanı düşünün.
Çok hızlı anahtar ile aramalar gerekiyorsa anahtar-değer deposu güçlü bir adaydır.

Sonra "Doğru Veritabanı Türünü Nasıl Seçersiniz" bölümünü kullanarak ölçek, tutarlılık ihtiyaçları ve en sık çalıştıracağınız sorgulara göre daraltın.

İlişkisel Veritabanları (SQL): Yapılandırılmış Veri için Varsayılan

SQL neden bu kadar yaygın

İlişkisel sistemler genellikle SQL (Structured Query Language) ile sorgulanır. SQL okunması ve ifade gücü nedeniyle popülerdir:

Verileri filtreleyip sıralayabilirsiniz (WHERE, ORDER BY).
Tablolar arasında veri birleştirebilirsiniz (JOIN).
Sonuçları özetleyebilirsiniz (GROUP BY).

Çoğu raporlama aracı, analitik platform ve iş uygulaması SQL konuşur; bu da geniş uyumluluk gerektiğinde onu güvenli bir varsayılan yapar.

ACID işlemlerini basitçe anlatmak

İlişkisel veritabanları ACID işlemleri ile bilinir, bu da verinin doğruluğunu korumaya yardımcı olur:

Atomicity: Çok adımlı bir değişiklik "hepsi ya da hiçbiri" şeklindedir.
Consistency: Yabancı anahtar gibi kurallar değişiklikten sonra da geçerli kalır.
Isolation: Eşzamanlı güncellemeler birbirini bozmaz.
Durability: Kaydedilen veri çökmelerden sonra da kalır.

Bu, müşteri üzerinde çift ücretlendirme veya stok güncellemesini kaybetme gibi hataların maliyetli olduğu durumlarda önemlidir.

En uygun iş yükleri

İlişkisel veritabanı genellikle yapılandırılmış, iyi tanımlanmış veriler için uygundur:

İş uygulamaları (CRM/ERP benzeri sistemler)
Finans, ödemeler, faturalama
Envanter, siparişler, rezervasyonlar

Dikkat edilmesi gereken yaygın tuzaklar

Aynı yapı güvenilirliği sağlarken sürtünme de ekleyebilir:

Sert şemalar: Veri yapısındaki sık değişiklikler migration gerektirebilir.
Join ağırlıklı ölçekleme: Büyük tablolarda çok sayıda join yüksek ölçeklerde yavaşlayabilir veya maliyetli olabilir, özellikle veri birçok makineye dağıtıldıysa.

Veri modeliniz sürekli değişiyorsa veya daha basit erişim desenleriyle ekstrem yatay ölçek gerekiyorsa başka veritabanı türleri daha uygun olabilir.

Sütunlu Veritabanları: Analitik için Tasarlandı

Sütunlu veritabanları veriyi "satır" yerine "sütun" bazında depolar. Bu tek değişiklik, analitik iş yükleri için hız ve maliyet üzerinde büyük etki yapar.

Satır deposu vs sütun deposu

Sütunlunun raporlama için hızlı olmasının nedeni

Analitik ve BI sorguları genellikle:

Çok sayıda kaydı tarar
Az sayıda sütun seçer
SUM, AVG, COUNT gibi aggregateler hesaplar ve boyutlara göre gruplaştırır

Tipik sorgu desenleri

Dezavantajlar: OLTP güncellemeleri ve nokta okumalar

En iyi uyduğu yerler

Sütunlu veritabanları iyi bir eşleşmedir:

BI ve yönetici panoları
Olay ve clickstream analitiği
Loglar veya işlemler üzerinde büyük ölçekli raporlama

Hedefiniz çok veri üzerinde hızlı aggregasyonlarsa, sütunlu ilk değerlendireceğiniz veritabanı türüdür.

Belge Veritabanları: Uygulama Verisi için Esnek Şemalar

Belge modeli (JSON-benzeri kayıtlar)

Bu esneklik, gereksinimler sık değiştiğinde veya öğelerin farklı alan setlerine sahip olduğu durumlarda özellikle faydalıdır.

Kısaca indeksleme

Güçlü yönler ve takaslar

Belge veritabanları, değişen şemalar, iç içe veri ve API-dostu yükler ile iyi çalışır. Dezavantajlar genelde şunlardır:

Birçok varlığı kapsayan karmaşık join'ler (ilişkisel veritabanındaki kadar doğal olmayabilir)
Yüksek ölçekte çoklu belge işlemleri (birçok üründe desteklenir ama performans maliyeti olabilir)
Katmanlı normalizasyon ihtiyacı (takımlar okuma performansı için veriyi kopyalamaya eğilimli olabilir; bu da güncelleme mantığı gerektirir)

Yaygın kullanım durumları

İçerik yönetimi, ürün katalogları, kullanıcı profilleri ve backend API'ler gibi verinin “her ekran/sayfa için bir nesne” şeklinde eşlendiği yerlerde güçlü bir seçimdir.

Anahtar-Değer Depoları: Basit ve Çok Hızlı Aramalar

Anahtar-değer modeli (neden hızlıdır)

Cache ve oturumlar için popülerliği

Ayrıca oturum depolama için de doğal bir seçimdir (ör. session:<id> -> session data) çünkü oturumlar sık okunup güncellenir ve otomatik süre aşımı (TTL) ile temizlenebilir.

TTL, eleme ve bellek vs disk

Çoğu anahtar-değer deposu TTL (time to live) destekler; bu, oturumlar, tek kullanımlık tokenler ve rate limit sayaçları için idealdir.

Bilinmesi gereken takaslar

Anahtar-değer depoları anahtarı zaten biliyorsanız çok hızlıdır. Açık uçlu sorgulamalar için daha az uygundur.

Birçok ürünün ikincil indeks desteği sınırlıdır; bazıları bunu sağlar, bazıları kısmi seçenekler sunar, bazıları ise kendi arama anahtarlarınızı korumanızı teşvik eder.

Yaygın kullanım durumları

Anahtar-değer depoları için iyi eşleşmeler:

Rate limiting: kullanıcı/IP başına TTL pencere içinde sayaçlar
Feature flag'ler: kullanıcı veya kohorta göre hızlı kararlar
Alışveriş sepetleri: kullanıcı/oturum anahtarı ile hızlı güncellemeler

Erişim deseniniz "ID ile al/güncelle" ise ve gecikme önemliyse, anahtar-değer deposu genellikle en basit ve güvenilir hız çözümüdür.

Geniş Sütunlu Veritabanları: Ölçeklenebilir Operasyonel Depolama

SQL ile kolay başlangıç yapın

İhtiyaçlarınızı netleştirirken ilişkisel şemanızı ve CRUD akışlarını Koder.ai ile hızlıca prototipleyin.

Ücretsiz Deneyin

Geniş sütunlu ile sütunlu analitik arasındaki fark

İsim benzerliğine rağmen, sütunlu analitik veritabanı ile geniş sütunlu farklı amaçlara hizmet eder.

Sütunlu veritabanı analitik için her sütunu ayrı depolayıp büyük veri setlerini verimli taramaya odaklanır.
Geniş sütunlu veritabanı operasyonel iş yükleri için tasarlanmıştır: çok sayıda yazma, yatay ölçek ve anahtar bazlı öngörülebilir okuma.

Parladıkları yerler

Geniş sütunlu sistemler genellikle:

Yüksek yazma verimi (saniyede çok sayıda olay alımı)
Yatay ölçeklenebilirlik (daha fazla trafik ve veri için düğüm ekleme)
Doğru anahtar ile tahmin edilebilir, düşük gecikmeli okumalar

Tipik erişim deseni

En yaygın desen şudur:

Partition key bilir (verinin nerede durduğunu belirler) ve
Genellikle o partition içinde bir aralık okunur (ör. "cihaz X için 10:00–10:05 arasındaki tüm olaylar").

Bu, zaman sıralı veri ve append-heavy iş yükleri için güçlü bir uyum sağlar.

Anlanması gereken takaslar

Yaygın kullanım durumları

Graf Veritabanları: İlişkileri Birinci Sınıf Veri Olarak Ele Almak

Grafik modeli: düğümler, kenarlar ve özellikler

Bir graf genellikle şunlardan oluşur:

Düğümler: varlıklar (insanlar, hesaplar, cihazlar, ürünler)
Kenarlar: aralarındaki ilişkiler ("takip ediyor", "ödedi", "ait", "gönderildi")
Özellikler: düğümlerde ve kenarlarda anahtar-değer nitelikler (zaman damgaları, miktarlar, etiketler)

Bu, ağları, hiyerarşileri ve çoktan-çoğa ilişkileri şemayı zorlamadan temsil etmeyi doğal kılar.

Gezinmeler neden join'lerden daha iyi olabilir

İlişki ağı yoğun sorgular, ilişkisel veritabanında genellikle çok sayıda join gerektirir. Her ek join veri büyüdükçe karmaşıklık ve maliyet ekleyebilir.

Grafın özellikle iyi yanıtladığı sorular

Graf veritabanları şunlarda parlamak için uygundur:

Yollar ve ayrılma dereceleri (en kısa yol, erişim)
Öneriler ("X'i satın alanlar Y'yi de aldı", "arkadaşların arkadaşları")
Dolandırıcılık halkaları ve anomali desenleri (paylaşılan cihazlar, adresler, ödeme yöntemleri)

Planlamanız gereken takaslar

Ne zaman ilişkisel model yeterlidir

Vektör Veritabanları: AI Uygulamaları için Benzerlik Araması

Korkmadan yinele

Güvenli bir sıfırlama gerektiğinde şema ve özellik değişikliklerini anlık görüntüler ve geri alma ile yönetin.

Anlık Görüntüleri Kullan

Vektörler semantik aramayı nasıl açar

Temel işlemler: benzerlik + filtreler

Ana işlem en yakın komşu (nearest neighbor) aramasıdır: bir sorgu vektörü verildiğinde en yakın vektörleri alın.

Gerçek uygulamalarda genellikle benzerliği şu filtrelerle birleştirirsiniz:

Sadece belirli bir müşteriye ait belgeleri göster
Bir ürün kategorisi veya dil ile sınırlandır
Arşivlenmiş veya düşük kaliteli öğeleri hariç tut

Bu “filtre + benzerlik” deseni vektör aramayı gerçek veri kümeleri için pratik kılar.

Nerede kullanılır

Yaygın kullanım alanları:

RAG (Retrieval-Augmented Generation): LLM cevaplamadan önce en alakalı pasajları getirme
Semantik arama: bilgi tabanları, destek ticket'ları veya dahili dokümanlar
Öneriler: içerik benzerliğine dayalı "kullanıcılar ayrıca şunu da görüntüledi/satın aldı"

Bilinmesi gereken takaslar

İlişkisel veya belge depolarıyla eşleştirme

Zaman Serisi Veritabanları: Zaman İçindeki Metrikler için Optimize

Zaman serisi verisi nasıl görünür

Çoğu zaman serisi kayıt şunları birleştirir:

Zaman damgası: ölçümün ne zaman alındığı
Metrik/değer: izlenen sayı (gecikme, sıcaklık, fiyat)
Etiketler: filtre ve gruplayma için meta veri (host=web-01, region=us-east, service=checkout)

Bu yapı "servise göre hata oranını göster" veya "bölgeler arası gecikmeyi karşılaştır" gibi soruları kolaylaştırır.

TSDB'lerin dayandığı performans özellikleri

Veri hacmi hızla büyüyebildiği için TSDB'ler genellikle şunlara odaklanır:

Sıkıştırma: uzun sayı dizilerini verimli saklama
Retansiyon politikaları: eski veriyi otomatik olarak silme (örn. ham veriyi 7 gün, özetleri 90 gün tutma)
Downsampling: ayrıntıyı özetlere yuvarlama (saniye başına → dakika başına → saat başına)

Bu özellikler depolama ve sorgu maliyetlerini tahmin edilebilir tutar.

Yaygın sorgu desenleri

TSDB'ler zaman bazlı hesaplamalarda iyidir:

Hareketli ortalamalar (ör. 5-dakika hareketli ortalama)
Persentiller (p95/p99 gecikme)
Değişim hızı (istek/saniye)
Eşik veya anomali uyarıları

Nerede uygun, nerede değil

Tipik kullanım: monitoring, observability, IoT/sensör ve finansal tick verisi.

Ambarlar ve Lakehouse'lar: Kurumsal Ölçekte Analitik

Batch vs streaming alımı (basit versiyon)

Çoğu ambar veriyi iki yolla alır:

Batch alım: veri saatlik/günlük iner (örn. uygulama veritabanından gece dışa aktarma). Daha ucuz ve basit ama gerçek zamanlı değil.
Streaming alım: olaylar sürekli akar (tıklamalar, ödemeler, IoT). Daha güncel sayılar görürsünüz ama boru hatları ve izleme daha önem kazanır.

Neden hızlılar: sütunlu depolama, bölümlendirme, materialized view'lar

Ambarlar analitik için birkaç pratik hile kullanır:

Sütunlu depolama sadece rapor için gereken sütunları okur.
Partitioning büyük tabloları zaman veya bölgeye göre bölerek daha az veri taranmasını sağlar.
Materialized views önceden hesaplanmış sonuçları (örn. "ülkeye göre günlük satış") saklayarak panoları hızlandırır.

Ölçeklenince yönetişim zorunludur

Lakehouse ne zaman mantıklıdır

Temel Takaslar: Tutarlılık, Ölçek ve Sorgu Desenleri

Kodunuzu taşınabilir tutun

Yığını ve veri katmanınızı tam kontrol altında tutmak için kaynak kodunu istediğiniz zaman dışa aktarın.

Kodu Dışa Aktar

Veritabanı türleri arasında seçim "en iyi"den çok "uygun" ile ilgilidir: verinizle ne yapmanız gerektiği, ne kadar hızlı gerektiği ve sistem parçalandığında ne olacağı önemlidir.

OLTP vs OLAP (iş yüküne göre eşle)

Kısa bir kural:

OLTP (çevrimiçi işlemler): çok sayıda küçük okuma/yazma (checkout, girişler, sipariş güncellemeleri). Öncelikler: düşük gecikme, doğru güncellemeler, çok sayıda eşzamanlı kullanıcı.
OLAP (analitik): daha az ama daha ağır sorgular, çok sayıda satırı tarama (panolar, eğilimler). Öncelikler: hızlı aggregasyon, sütunlu depolama, hesaplama ile depolamayı ayırma.

İlişkisel veritabanları genelde OLTP için iyidir; sütunlu sistemler, ambarlar ve lakehouse'lar OLAP için yaygındır.

CAP basitçe

Ağ bölünmesi olduğunda genelde üçünden hepsini aynı anda elde edemezsiniz:

Consistency: herkes hemen aynı veriyi görür.
Availability: sistem cevap vermeye devam eder.
Partition tolerance: ağ bölünmelerine rağmen çalışmaya devam eder.

Ölçekleme: dikey, yatay ve sharding

Dikey ölçekleme: daha büyük makine—basit ama sınırlı.
Yatay ölçekleme: daha fazla makine—daha fazla kapasite, daha fazla koordinasyon.
Sharding: veriyi düğümler arasında bölme (genelde müşteri ID'sine göre). Ölçeği artırır ama shard'lar arası sorgular ve işlemler zorlaşır.

İşlemler ve eşzamanlılık temelleri

Operasyonel endişeler (bunları atlamayın)

Doğru Veritabanı Türünü Nasıl Seçersiniz

Anahtar, trend değil, verinizle ne yapmanız gerektiğidir. Pratik bir başlangıç, sorgularınız ve iş yüklerinizden geriye doğru çalışmaktır.

1) Sorgularınızdan başlayın (verinizden değil)

Uygulamanızın veya ekibinizin yapması gereken ilk 5–10 şeyi yazın:

En sık neyi okursunuz (tek kayıt sorguları, filtreler, join'ler, aggregasyonlar, benzerlik araması)?
En sık ne yazarsınız (tek-satır eklemeler, olay akışları, güncellemeler, toplu yüklemeler)?
Sonuçlar ne kadar taze olmalı (milisaniye, saniye, dakika)?

Bu, herhangi bir özellik kontrol listesinden daha hızlı seçenekleri daraltır.

2) Verinin şekline uygun eşleştirme

Hızlı "şekil" kontrolü:

Yapısal, tutarlı alanlar → ilişkisel veritabanı
Sık değişen yarı-yapılandırılmış JSON → belge veritabanı
Derin çoktan-çoğa ilişkiler → graf veritabanı
Embedding'ler ve en yakın komşu araması → vektör veritabanı
Zaman damgalı olaylar ve rollup'lar → zaman serisi veritabanı
Büyük ölçekli, öngörülebilir erişim desenleri → geniş sütunlu veritabanı
Çok basit get/set → anahtar-değer deposu
Ağır analitik taramaları ve aggregasyonlar → sütunlu veritabanı (veya ambar)

3) Gecikme, verim ve maliyet sürücülerini erken netleştirin

Performans hedefleri mimariyi belirler. Kabaca sayıları belirleyin (p95 gecikme, saniye başına okuma/yazma, veri saklama). Maliyet genelde şunlardan oluşur:

Depolama (ham veri + replikalar)
Hesaplama (sorgular, ETL/ELT, arka plan işleri)
Çoğaltma (çok-bölge, yüksek erişilebilirlik)
İndeksleme (daha hızlı sorgular, daha fazla yazma yükü)

4) Basit bir karar tablosu

Birincil kullanım	Genelde en iyi seçim	Neden
İşlemler, faturalar, kullanıcı hesapları	İlişkisel (SQL)	Güçlü kısıtlar, join'ler, tutarlılık
Alanı değişen uygulama verisi	Belge	Esnek şema, doğal JSON
Gerçek zamanlı cache/oturum durumu	Anahtar-değer	Anahtar ile hızlı okuma
Zaman serisi ve tıklama akışları	Zaman serisi	Yüksek ingest + zaman bazlı sorgular
BI panoları, büyük aggregasyonlar	Sütunlu	Hızlı tarama + sıkıştırma
Sosyal / bilgi ilişkileri	Graf	Etkili ilişki gezinmesi
Semantik arama, RAG retrieval	Vektör	Embedding'ler üzerinde benzerlik araması
Devasa operasyonel veri	Geniş sütunlu	Yatay ölçek, tahmin edilebilir sorgular

Hızlı ürün geliştirme notu

SSS

“Veritabanı türü” pratikte ne anlama geliyor?

Bir “veritabanı türü” pratikte üç şeyi anlatır:

Veri modeli (tablolar, belgeler, anahtar-değer çiftleri, grafikler, vektörler, zaman damgalı noktalar)
Optimizasyon yapılan sorgu desenleri (join'ler, tarama/aggregasyon, gezinmeler, benzerlik araması)
Ölçekleme ve tutarlılık takasları (tek makine mi yoksa yatay ölçek mi, sıkı mi yoksa nihai tutarlılık mı)

Türü seçmek, performans, maliyet ve operasyonel karmaşıklık için varsayılanları belirlemektir.

Aşırı düşünmeden doğru veritabanı türünü nasıl seçerim?

En kolay yol, en sık yaptığınız 5–10 sorgu ve yazma desenini belirlemektir, sonra onları uygun güçlü yönlerle eşleyin:

Ne zaman ilişkisel (SQL) veritabanı kullanmalıyım?

İlişkisel veritabanları güçlü bir varsayıldır; özellikle ihtiyacınız varsa:

Yapısal, iyi tanımlanmış şemalar
ACID işlemler (para, envanter, siparişler için doğruluk)
Join'ler ve kısıtlar (foreign key gibi tutarlılık kuralları)

Ancak şema sürekli değişiyorsa veya join ağırlıklı sorguların parçalanmış shard'larda çalışması gerekiyorsa zorluk yaşayabilirsiniz.

ACID işlemler nedir ve en çok ne zaman önemseriz?

ACID, çok adımlı değişikliklerin güvenilir olmasını sağlar:

Atomicity: tüm adımlar ya başarır ya da hiçbiri gerçekleşmez
Consistency: kurallar/kısıtlar değişiklikten sonra korunur
Isolation: eşzamanlı işlemler birbirini bozmaz
Durability: onaylanan veriler çökmelerden sonra kalır

Özellikle maliyetli hataların olduğu işlemler (ödeme, rezervasyon, envanter) için kritiktir.

Neden sütunlu veritabanları analitik için satır-tabanlı depolardan daha hızlı?

Sütunlu veritabanları, sorguların genelde:

Çok sayıda satırı taraması
Sadece birkaç sütunu okuması
SUM, COUNT, AVG, GROUP BY gibi aggregateler hesaplaması

Belge veritabanı hangi durumlarda SQL'den daha mantıklı olur?

Belge veritabanı şu durumlarda mantıklıdır:

Uygulama veriniz JSON-benzeri nesnelere doğal olarak uyuyorsa (profil, katalog, içerik)
Bir öğenin alan yapısı sık değişiyor veya öğeye göre farklılık gösteriyorsa
İç içe yapıları birçok tabloya ayırmak istemiyorsanız

Ancak karmaşık join'ler, okuma performansı için veri çoğaltma ve çoklu belge işlemlerinin maliyeti gibi dezavantajlar olabilir.

Anahtar-değer depoları (cache dışında) en çok nerelerde kullanılır?

Anahtar-değer depolarını şu durumlarda kullanın:

Tek bir anahtar ile get/set desenleri (düşük gecikmeli erişim)
Birincil veritabanınızın önünde cache olarak
Oturumlar, rate limiting, özellik bayrakları, gibi hızlı okunup yazılan geçici veriler

Sütunlu veritabanları ile geniş sütunlu veritabanları arasındaki fark nedir?

İsim benzerliğine rağmen farkları vardır:

Sütunlu veritabanları: analitik için (sütun bazlı okuma + yüksek sıkıştırma)
Geniş sütunlu (wide-column) veritabanları: operasyonel ölçek için (yüksek yazma verimi, yatay ölçek, tahmin edilebilir anahtar tabanlı okumalar)

Wide-column sistemlerinde veri modelleme genelde sorgu odaklıdır; esnek SQL tarzı join'ler beklemeyin.

Ne zaman graf veritabanı kullanmalıyım, ilişkisel tablolar yerine?

Graf veritabanını tercih edin quando temel sorularınız ilişkilere dayanıyorsa:

Ayrılıklar ve bağlantı dereceleri (en kısa yol, erişilebilirlik)
Bağlantılara dayalı öneriler
Dolandırıcılık halkaları ve paylaşılan nitelikler

Vektör veritabanları hangi problemi çözer, ana veritabanımın yerine geçer mi?

Vektör veritabanları benzerlik araması (embeddings) için tasarlanmıştır. Sık kullanım örnekleri:

Semantik arama (farklı kelimelerle yazılan ancak anlam olarak ilgili sonuçlar)
RAG: LLM öncesi en alakalı pasajları alma
İçerik tabanlı öneriler