20 aug 2025·8 min

Soorten databases: relationeel, kolomgebaseerd, document, graaf en meer

Q: Hoe kies ik het juiste databasetype zonder te veel te twijfelen?

Begin met je top 5–10 queries en schrijfpatronen , en koppel die aan de juiste sterke punten: - OLTP-transacties + gestructureerde data → relationeel (SQL) - Dashboards en grote aggregaties → kolomgebaseerd / datawarehouse - Evoluerende JSON-achtige app-data → document - Diepe relatiequeries → graaf - Semantische zoek / RAG retrieval → vector - Get/set op ID met zeer lage latency → key-value Als je zowel OLTP als analytics doet, plan dan vroegtijdig voor twee systemen (operationele DB + analytics DB).

Q: Wat zijn ACID-transacties en wanneer zijn ze het belangrijkst?

ACID is een betrouwbaarheidsgarantie voor meerstapswijzigingen: - Atomicity : alle stappen slagen of geen enkele - Consistency : regels/constraints blijven geldig - Isolation : gelijktijdige operaties corrumperen elkaar niet - Durability : gecommitte data overleeft crashes Het is vooral belangrijk voor workflows waarbij fouten duur zijn (betalingen, boekingen, voorraadupdates).

Q: Wanneer is een documentdatabase logischer dan SQL?

Een documentdatabase is een goede keuze als: - Je app-data past bij JSON-achtige objecten (profielen, catalogi, content) - De vorm vaak verandert of per item varieert - Je geneste structuren wilt opslaan zonder alles te splitsen over veel tabellen Let op trade-offs rond complexe joins, het dupliceren van data voor leesprestaties, en de kosten van multi-document transacties.

Q: Welk probleem lossen vectordatabases op, en vervangen ze mijn hoofd-DB?

Een vector-database is ontworpen voor similarity search over embeddings (numerieke representaties van betekenis). Gebruikelijke toepassingen zijn: - Semantische zoekopdrachten (vind relevante documenten ook bij andere woordkeuze) - RAG retrieval voorafgaand aan antwoorden van een LLM - Aanbevelingen gebaseerd op inhoudsvergelijkbaarheid In de praktijk wordt het meestal gecombineerd met een relationele of documentstore: houd de bron-van-waarheid daar, bewaar embeddings + vectorindex in de vector DB en combineer de resultaten voor volledige records en permissies.

Vergelijk de belangrijkste databasetypen — relationeel, kolomgebaseerd, document, graaf, vector, key-value en meer — met gebruiksscenario's, afwegingen en tips om de juiste keuze te maken.

Wat “databasetypen” echt betekent

Een “databasetype” is niet alleen een label — het is een kortere manier om te beschrijven hoe een systeem data opslaat, hoe je het opvraagt en waarvoor het geoptimaliseerd is. Die keuze beïnvloedt direct snelheid (wat snel vs. traag is), kosten (hardware of cloud-uitgaven) en mogelijkheden (transacties, analytics, zoeken, replicatie en meer).

Waarom het “type” ertoe doet

Verschillende databasetypen maken verschillende afwegingen:

Een relationele database is ideaal wanneer je data gestructureerd is en je betrouwbare transacties nodig hebt.
Een kolomgebaseerde database blinkt uit als je veel rijen moet scannen om analytische vragen te beantwoorden.
Een documentdatabase kan sneller zijn wanneer de vorm van je app-data vaak verandert.
Een graafdatabase is gebouwd voor data met veel relaties.
Een vectordatabase richt zich op “similariteit” in plaats van exacte overeenkomsten.

Die ontwerpkeuzes beïnvloeden:

Querypatronen: veel kleine lookups, complexe joins of grote analytische scans?
Schaalmodel: schaal je één grote machine op, of scale-out je over veel machines?
Datamodel: tabellen, documenten, sleutel–waarde-paren, grafen, vectoren of tijdgestempelde punten.

Wat je in deze gids leert

Dit artikel behandelt de belangrijkste soorten databases en legt voor elk uit:

Waar het het beste in is (en waar het moeite mee heeft)
Typische gebruiksscenario’s in echte producten
Belangrijke afwegingen die prestaties, kosten en complexiteit beïnvloeden

Een korte opmerking over “multi-model” systemen

Veel moderne producten vervagen de grenzen. Sommige relationele databases voegen JSON-ondersteuning toe die overlapt met een documentdatabase. Sommige zoek- en analyticsplatforms bieden vectorindexering zoals een vectordatabase. Andere combineren streaming en opslag met tijdreeksfeatures.

Dus “type” is geen strikt hokje — het helpt echter om de standaardsterktes en de workloads te begrijpen waarvoor een database meestal het beste is.

Hoe je deze gids gebruikt om opties te shortlisten

Begin met je belangrijkste workload:

Als je gestructureerde data en transacties nodig hebt, begin met een relationele database.
Als je zware rapportage en dashboards doet, kijk naar een kolomgebaseerde database of datawarehouse.
Als de vorm van je app-data vaak verandert, overweeg een documentdatabase.
Als je extreem snelle lookups op sleutel nodig hebt, is een key-value store een sterke kandidaat.

Gebruik daarna de sectie “Hoe kies je het juiste databasetype” om verder te verfijnen op basis van schaal, consistentiebehoeften en de queries die je het vaakst draait.

Relationele databases (SQL): de standaard voor gestructureerde data

Relationele databases zijn wat veel mensen voor ogen hebben bij “database”. Data is georganiseerd in tabellen bestaande uit rijen (records) en kolommen (velden). Een schema definieert hoe elke tabel eruitziet — welke kolommen er zijn, welke types ze hebben en hoe tabellen met elkaar verbonden zijn.

Waarom SQL overal is

Relationele systemen worden meestal bevraagd met SQL (Structured Query Language). SQL is populair omdat het leesbaar en expressief is:

Je kunt data filteren en sorteren (WHERE, ORDER BY).
Data combineren over tabellen (JOIN).
Resultaten samenvatten (GROUP BY).

De meeste reportingtools, analyticsplatforms en zakelijke applicaties spreken SQL, wat het een veilige standaard maakt als je brede compatibiliteit wilt.

ACID-transacties, in gewone taal

Relationele databases staan bekend om ACID-transacties, die helpen data correct te houden:

Atomicity: een meerstapswijziging is “alles of niets”.
Consistency: regels (zoals foreign keys) blijven geldig na wijzigingen.
Isolation: gelijktijdige updates corrumperen elkaar niet.
Durability: eenmaal opgeslagen data overleeft crashes.

Dit is belangrijk wanneer fouten kostbaar zijn — denk aan dubbel afrekenen van een klant of het verliezen van een voorraadupdate.

Werkloads waarbij het goed past

Een relationele database is meestal de juiste keuze voor gestructureerde, goed gedefinieerde data en workflows zoals:

Businessapplicaties (CRM/ERP-achtige systemen)
Financiën, betalingen, facturatie
Voorraad, bestellingen, reserveringen

Veelvoorkomende valkuilen

Dezelfde structuur die relationele databases betrouwbaar maakt, kan wrijving toevoegen:

Starre schema’s: frequente veranderingen in datavorm vereisen migraties.
Join-zware scaling: veel joins over grote tabellen kan traag of duur worden op grote schaal, zeker als data over veel machines verdeeld is.

Als je datamodel constant verandert — of je hebt extreme horizontale schaal nodig met eenvoudigere toegangspatronen — kunnen andere databasetypen geschikter zijn.

Kolomgebaseerde databases: gebouwd voor analytics

Kolomgebaseerde databases slaan data “per kolom” op in plaats van “per rij”. Die ene wijziging heeft veel impact op snelheid en kosten voor analytics-workloads.

Row-store vs. column-store

In een traditionele row-store (gebruikelijk in relationele databases) zitten alle waarden voor één record bij elkaar. Dat is ideaal wanneer je vaak één klant/order tegelijk ophaalt of bijwerkt.

In een column-store (een kolomgebaseerde database) zitten alle waarden voor hetzelfde veld bij elkaar — elke price, elk country, elke timestamp. Dat maakt het efficiënt om alleen de paar kolommen te lezen die nodig zijn voor een rapport, zonder volledige rijen van schijf te halen.

Waarom kolomgebaseerd snel is voor rapportage

Analytics- en BI-queries:

Scannen vaak veel records
Selecteren een kleine set kolommen
Berekenen aggregaten zoals SUM, AVG, COUNT en groeperen op dimensies

Kolomopslag versnelt deze patronen omdat er minder data gelezen wordt en compressie extreem goed werkt (gelijke waardes clusteren en comprimeren goed). Veel kolomengines gebruiken ook vectorized execution en slimme indexering/partitionering om grote scans te versnellen.

Typische querypatronen

Kolomgebaseerde systemen zijn ideaal voor dashboards en rapportage: “omzet per week”, “top 20 producten per regio”, “conversieratio per kanaal” of “fouten per service in de laatste 30 dagen”. Deze queries raken veel rijen maar relatief weinig kolommen.

Afwegingen: OLTP-achtige updates en point lookups

Als je workload vooral is “haal één record op op ID” of “update een enkele rij tientallen keren per seconde”, kan kolomgebaseerd trager of duurder aanvoelen. Schrijftaken zijn vaak geoptimaliseerd voor batches (append-heavy ingest) in plaats van frequente, kleine updates.

Waar het uitblinkt

Kolomgebaseerde databases zijn een sterke keuze voor:

BI en executive dashboards
Event- en clickstream-analytics
Grootschalige rapportage over logs of transacties

Als prioriteit ligt bij snelle aggregaties over veel data, is kolomgebaseerd meestal het eerste type om te evalueren.

Documentdatabases: flexibele schema’s voor app-data

Documentdatabases slaan data op als “documenten” — op zichzelf staande records die veel lijken op JSON. In plaats van informatie over veel tabellen te verspreiden, houd je gerelateerde velden vaak bij elkaar in één object (inclusief geneste arrays en subobjecten). Dat maakt ze een natuurlijke match voor applicatiedata.

Het documentmodel (JSON-achtige records)

Een document kan een gebruiker, een product of een artikel representeren — compleet met attributen die per document kunnen verschillen. Eén product kan size en color hebben, een ander dimensions en materials, zonder een uniform schema voor alle records te forceren.

Deze flexibiliteit is vooral nuttig wanneer je requirements vaak veranderen of wanneer verschillende items verschillende velden hebben.

Indexering, op hoofdlijnen

Om te voorkomen dat je elk document moet scannen, gebruiken documentdatabases indexen — datastructuren die helpen snel overeenkomende documenten te vinden voor een query. Je kunt veelgebruikte lookup-velden indexeren (zoals email, sku of status), en veel systemen kunnen ook geneste velden indexeren (bijv. address.city). Indexen versnellen leesacties maar voegen overhead toe aan schrijfacties, omdat de index bijgewerkt moet worden wanneer documenten veranderen.

Sterktes — en de afwegingen

Documentdatabases blinken uit bij evoluerende schema’s, geneste data en API-vriendelijke payloads. De afwegingen komen meestal naar voren als je:

Complexe joins over veel entiteiten nodig hebt (minder natuurlijk dan in een relationele DB)
Multi-document transacties op hoge schaal nodig hebt (in veel producten ondersteund, maar kan performance kosten)
Strikte normalisatie nodig hebt (teams dupliceren soms data om reads simpel te houden, wat zorgvuldige update-logica vereist)

Veelgebruikte scenarios

Ze zijn een sterke keuze voor contentmanagement, productcatalogi, gebruikersprofielen en backend-API’s — overal waar je data goed past bij “één object per pagina/screen/request”.

Key-value stores: simpel en erg snelle lookups

Key-value stores zijn het eenvoudigste databasemodel: je slaat een value op (alles van een string tot een JSON-blob) en haalt die op met een unieke key. De kernoperatie is simpelweg “geef me de waarde voor deze sleutel”, waardoor deze systemen extreem snel kunnen zijn.

Het key-value model (en waarom het snel is)

Omdat reads en writes gericht zijn op één primaire sleutel, kunnen key-value stores geoptimaliseerd worden voor lage latency en hoge throughput. Veel systemen zijn ontworpen om hete data in geheugen te houden, complex query-plannen te vermijden en horizontaal te schalen.

Deze eenvoud bepaalt ook hoe je data modelleert: in plaats van de database te vragen “vind alle gebruikers in Berlijn die zich vorige week hebben aangemeld”, ontwerp je meestal keys die al naar het exacte record verwijzen (bijv. user:1234:profile).

Waarom het populair is voor caching en sessies

Key-value stores worden veel gebruikt als cache voor een langzamere primaire database (zoals een relationele database). Als je app herhaaldelijk dezelfde data nodig heeft — productdetails, gebruikerspermissies, prijsregels — voorkomt caching het opnieuw berekenen of opvragen.

Ze zijn ook een natuurlijke keuze voor sessieopslag (bijv. session:<id> -> session data) omdat sessies vaak gelezen en bijgewerkt worden en automatisch kunnen verlopen.

TTL, eviction en geheugen vs. schijf

De meeste key-value stores ondersteunen een TTL (time to live) zodat data kan verlopen zonder handmatige cleanup — ideaal voor sessies, eenmalige tokens en rate-limit tellers.

Als geheugen beperkt is, gebruiken systemen vaak evictionpolicies (zoals least-recently-used) om oude items te verwijderen. Sommige producten zijn geheugen-eerst, andere kunnen data naar schijf persistenteren voor duurzaamheid. De keuze tussen geheugen en schijf hangt meestal af van of je optimaliseert voor snelheid (geheugen) of retentie/hersteltijd (schijf/persistentie).

Afwegingen om vooraf te kennen

Key-value stores blinken uit wanneer je de sleutel al kent. Ze zijn minder geschikt voor open-einde vragen.

Veel hebben beperkte querypatronen vergeleken met SQL-databases. Ondersteuning voor secundaire indexen (zoeken op velden binnen de value) varieert: sommige bieden het, sommige gedeeltelijke opties, anderen moedigen aan zelf lookup-keys te onderhouden.

Veelgebruikte scenarios

Key-value stores zijn uitstekend voor:

Rate limiting: tellers per gebruiker/IP met een TTL-window
Feature flags: snelle reads om gedrag per gebruiker of cohort te beslissen
Winkelwagentjes: snelle updates van een cart-object keyed op gebruiker/session

Als je toegangspatroon “haal/bewerk op ID” is en latency belangrijk is, is een key-value store vaak de eenvoudigste manier om betrouwbare snelheid te halen.

Wide-column databases: scale-out operationele opslag

Itereer zonder angst

Voer schema- en featurewijzigingen door met snapshots en rollback voor een veilige reset.

Gebruik snapshots

Wide-column databases (soms wide-column stores genoemd) organiseren data in column families. In plaats van één vaste tabel te hebben met dezelfde kolommen voor elke rij, groepeer je gerelateerde kolommen en kun je verschillende sets kolommen per rij binnen een family opslaan.

Wide-column vs. kolomgebaseerde analytics

Ondanks de vergelijkbare naam zijn wide-column databases niet hetzelfde als een kolomgebaseerde database voor analytics.

Een kolomgebaseerde database slaat elke kolom afzonderlijk op om enorme datasets efficiënt te scannen (geschikt voor rapportage en aggregaties). Een wide-column database is gebouwd voor operationele workloads op zeer grote schaal, waar je veel records snel moet schrijven en lezen over veel machines.

Waar ze in uitblinken

Wide-column systemen zijn ontworpen voor:

Hoge schrijfdoorvoer (veel events per seconde verwerken)
Horizontale schaal (nodes toevoegen om meer verkeer en data aan te kunnen)
Voorspelbare, lage-latentie reads wanneer je met de juiste key vraagt

Het typische toegangspatroon

Het meest voorkomende patroon is:

Je kent de partition key (die bepaalt waar data woont), en
Je leest vaak een range binnen die partition (bijv. “alle events voor device X tussen 10:00–10:05”).

Dat maakt ze geschikt voor tijdgeordende data en append-heavy workloads.

Afwegingen om te begrijpen

Bij wide-column databases is datamodellering query-gedreven: je ontwerpt tabellen meestal rond de exacte queries die je moet uitvoeren. Dat kan betekenen dat je data dupliceert in verschillende vormen om verschillende toegangspatronen te ondersteunen.

Ze bieden ook doorgaans beperkte joins en minder ad-hoc queryopties dan een relationele database. Als je applicatie afhankelijk is van complexe relaties en flexibele querying, kun je je beperkt voelen.

Veelgebruikte scenarios

Wide-column databases worden vaak gebruikt voor IoT-events, messaging en activity streams en andere grootschalige operationele data waarbij snelle schrijfacties en voorspelbare key-gebaseerde reads belangrijker zijn dan rijke relationele queries.

Graafdatabases: relaties als eersteklas data

Graafdatabases slaan data op zoals veel echte systemen werken: als dingen verbonden met andere dingen. In plaats van relaties in tabellen en join-tabellen te forceren, zijn de verbindingen onderdeel van het model.

Het graafmodel: nodes, edges en properties

Een graaf heeft meestal:

Nodes: de entiteiten (mensen, accounts, apparaten, producten)
Edges: de relaties daartussen ("follows", "paid", "belongs to", "shipped to")
Properties: key-value attributen op nodes en edges (timestamps, bedragen, labels)

Dat maakt het natuurlijk om netwerken, hiërarchieën en many-to-many relaties te representeren zonder je schema te forceren.

Waarom traversals joins kunnen verslaan

Relatie-zware queries vereisen vaak veel joins in een relationele database. Elke extra join kan complexiteit en kosten toevoegen naarmate je data groeit.

Graafdatabases zijn ontworpen voor traversals — lopen van de ene node naar verbonden nodes, en dan naar hun verbindingen, enzovoort. Wanneer je vragen vaak zijn van het type “vind verbonden dingen binnen 2–6 stappen”, blijven traversals snel en leesbaar, zelfs als het netwerk groeit.

Vragen die grafen vooral goed beantwoorden

Graafdatabases blinken uit voor:

Paden en graden van scheiding (kortste pad, bereikbaarheid)
Aanbevelingen (“gebruikers die X kochten, kochten ook Y”, “vrienden van vrienden”)
Fraude-ringen en anomaliepatronen (gedeelde apparaten, adressen, betaalmethoden)

Afwegingen om voor te bereiden

Grafen kunnen een verandering zijn voor teams: datamodellering is anders en querytalen (vaak Cypher, Gremlin of SPARQL) kunnen nieuw zijn. Je wilt ook duidelijke conventies voor relatie-types en richting om het model onderhoudbaar te houden.

Wanneer een relationeel model voldoende is

Als je relaties simpel zijn, je queries voornamelijk filtering/aggregaties zijn en een handvol joins de verbonden delen dekt, kan een relationele database eenvoudiger blijven — zeker als transacties en rapportage al goed werken.

Vectordatabases: similarity search voor AI-toepassingen

Bouw en ontvang beloningen

Deel wat je gebouwd hebt met Koder.ai en ontvang credits via het earn credits-programma.

Verdien credits

Vectordatabases zijn ontworpen voor een specifiek soort vraag: “Welke items lijken het meest op dit item?” In plaats van exacte overeenkomsten (zoals een ID of keyword), vergelijken ze embeddings — numerieke representaties van content (tekst, afbeeldingen, audio, producten) geproduceerd door AI-modellen. Items met vergelijkbare betekenis hebben embeddings die dicht bij elkaar liggen in een multidimensionale ruimte.

Waarom vectoren semantische zoekopdrachten mogelijk maken

Een normale zoekopdracht kan resultaten missen als de woordkeuze anders is (“laptop sleeve” vs. “notebook case”). Met embeddings is similariteit gebaseerd op betekenis, zodat het systeem relevante resultaten kan tonen, zelfs als de exacte woorden niet overeenkomen.

Kernoperaties: similariteit + filters

De hoofdoperatie is nearest neighbor search: gegeven een queryvector, haal de dichtstbijzijnde vectors op.

In echte apps combineer je similariteit meestal met filters, zoals:

Alleen documenten van een specifieke klant tonen
Beperken tot een productcategorie of taal
Gearchiveerde of lage-kwaliteit items uitsluiten

Dit “filter + similarity” patroon maakt vectorsearch praktisch voor echte datasets.

Waar vectordatabases passen

Veelvoorkomende toepassingen zijn:

RAG (Retrieval-Augmented Generation): haal de meest relevante passages op voordat een LLM antwoordt
Semantische zoekopdrachten: zoek in knowledge bases, supporttickets of interne docs
Aanbevelingen: “gebruikers bekeken/kochten ook” op basis van inhoudssimilariteit

Afwegingen om te weten

Vectorsearch vertrouwt op gespecialiseerde indexen. Het bouwen en updaten van die indexen kost tijd en kan veel geheugen gebruiken. Je kiest vaak tussen hogere recall (meer van de echte beste matches vinden) en lagere latency (snellere respons).

Combineren met relationele of documentstores

Vectordatabases vervangen zelden je hoofd-DB. Een veel voorkomende opzet is: bewaar de “source of truth” (orders, users, documenten) in een relationele database of documentdatabase, en bewaar embeddings + zoekindexen in een vectordatabase — verbind de resultaten daarna terug met de primaire opslag voor volledige records en permissies.

Tijdreeksdatabases: geoptimaliseerd voor metrics in de tijd

Tijdreeksdatabases (TSDBs) zijn ontworpen voor data die continu binnenkomt en altijd aan een tijdstempel gekoppeld is. Denk aan CPU-gebruik elke 10 seconden, API-latency per request, sensorwaarden elke minuut of aandelenkoersen meerdere keren per seconde.

Hoe tijdreeksdata eruitziet

De meeste tijdreeksrecords combineren:

Timestamp: wanneer de meting plaatsvond
Metric/value: het getal dat je volgt (latency, temperatuur, prijs)
Tags/labels: metadata voor filteren en groeperen (host=web-01, region=us-east, service=checkout)

Dit maakt het makkelijk om vragen te stellen als “toon foutpercentage per service” of “vergelijk latency over regio’s”.

Prestatiefeatures waar TSDBs op leunen

Omdat datavolume snel kan groeien, richten TSDBs zich vaak op:

Compressie: lange reeksen numerieke waarden efficiënt opslaan
Retention policies: automatisch oude data verwijderen (bijv. raw 7 dagen, aggregaten 90 dagen)
Downsampling: details samenvatten (per-seconde → per-minuut → per-uur)

Deze features houden opslag- en querykosten voorspelbaar zonder constante handmatige cleanup.

Veelgebruikte querypatronen

TSDBs blinken uit bij tijdgebaseerde berekeningen, zoals:

Rollende gemiddelden (bv. 5-minuten moving average)
Percentielen (p95/p99 latency)
Snelheidsverandering (requests/second)
Alerting bij drempels of afwijkingen

Waar ze passen (en waar niet)

Typische toepassingen: monitoring, observability, IoT/sensors en financial tick data.

De afweging: TSDBs zijn niet de beste keuze voor complexe, ad-hoc relaties over veel entiteiten (bijv. diepe joins zoals “users → teams → permissions → projects”). Daar is een relationele of grafendatabase meestal geschikter.

Warehouses en lakehouses: analytics op organisatieniveau

Een datawarehouse is minder een enkel “databasetype” en meer een workload + architectuur: veel teams die grote historische data bevragen om zakelijke vragen te beantwoorden (omzettrends, churn, voorraadrisico). Je kunt het als managed product afnemen, maar wat het tot een warehouse maakt is hoe het gebruikt wordt — gecentraliseerd, analytisch en gedeeld.

Batch vs. streaming ingestie (de simpele versie)

Meestal accepteren warehouses data op twee manieren:

Batch-ingestie: data landt elk uur/dag (bv. nachtelijke exports van je app-database). Goedkoop en simpel, maar niet real-time.
Streaming-ingestie: events komen continu binnen (clicks, betalingen, IoT). Je ziet frissere cijfers, maar pijplijnen en monitoring zijn belangrijker.

Waarom ze snel zijn: kolomopslag, partitionering, materialized views

Warehouses zijn doorgaans geoptimaliseerd voor analytics met een paar praktische technieken:

Kolomopslag leest alleen de kolommen die nodig zijn voor een rapport (goed voor sum, average, group by).
Partitionering splitst grote tabellen op tijd of regio zodat queries minder data scannen.
Materialized views slaan voorgecomputeerde resultaten op (zoals “dagelijkse omzet per land”) om dashboards te versnellen.

Governance is niet optioneel op schaal

Als meerdere afdelingen op dezelfde cijfers vertrouwen, heb je toegangscontrole (wie wat mag zien), audit trails (wie data bekeek/wijzigde) en lineage (waar een metric vandaan komt en hoe die getransformeerd is) nodig. Dit is vaak net zo belangrijk als query-snelheid.

Wanneer een lakehouse zinvol is

Een lakehouse combineert warehouse-stijl analytics met de flexibiliteit van een data lake — handig als je één plek wilt voor zowel gecureerde tabellen als ruwe bestanden (logs, afbeeldingen, semi-gestructureerde events) zonder alles te dupliceren. Het is geschikt als datavolume hoog is, formaten variëren en je nog steeds SQL-vriendelijke reporting nodig hebt.

Belangrijke afwegingen: consistentie, schaal en querypatronen

Maak het productieklaar

Lancering met een custom domein wanneer je prototype klaar is voor echte gebruikers.

Stel domein in

Kiezen tussen databasetypen gaat minder over “wat is het beste” en meer over fit: wat je moet opvragen, hoe snel, en wat er gebeurt als delen van het systeem falen.

OLTP vs. OLAP (match de workload)

Een korte vuistregel:

OLTP (online transactions): veel kleine reads/writes (checkout, inloggen, orderupdates). Prioriteiten: lage latency, correcte updates, veel gelijktijdige gebruikers.
OLAP (analytics): minder maar zwaardere queries die veel rijen scannen (dashboards, trends). Prioriteiten: snelle aggregatie, kolomopslag, scheiding van compute en storage.

Relationele databases blinken vaak uit voor OLTP; kolomgebaseerde systemen, warehouses en lakehouses worden vaak gebruikt voor OLAP.

CAP in gewone taal

Als een netwerkstoring je systeem in stukken splitst, kun je meestal niet alle drie tegelijk hebben:

Consistency: iedereen ziet direct dezelfde data.
Availability: het systeem blijft reageren.
Partition tolerance: het blijft werken ondanks netwerkproblemen.

Veel gedistribueerde databases kiezen ervoor beschikbaar te blijven tijdens issues en later te reconciliëren (eventual consistency). Anderen geven prioriteit aan strikte correctheid, zelfs als dat betekent dat ze sommige verzoeken weigeren totdat alles gezond is.

Schalen: verticaal, horizontaal en sharding

Verticaal schalen: een grotere machine — simpel, maar heeft limieten.
Horizontaal schalen: meer machines — meer capaciteit, meer coördinatie.
Sharding: data over nodes verdelen (vaak op klant-ID). Verhoogt schaal, maar cross-shard queries en transacties worden lastiger.

Transacties en concurrency basics

Als veel gebruikers dezelfde data bijwerken, heb je heldere regels nodig. Transacties bundelen stappen in “alles-of-niets”. Locking en isolation levels voorkomen conflicten, maar kunnen throughput verminderen; lossere isolatie verbetert snelheid maar kan anomalies toelaten.

Operationele zorgen (sla deze niet over)

Plan vroeg voor backups, replicatie en disaster recovery. Kijk ook hoe makkelijk het is restores te testen, lag te monitoren en upgrades uit te voeren — deze dag-twee details zijn vaak net zo belangrijk als query-snelheid.

Hoe kies je het juiste databasetype

Kiezen tussen de belangrijkste soorten databases gaat minder over wat trending is en meer over wat je met je data wilt doen. Een praktische start is terugwerken vanaf je queries en workloads.

1) Begin bij je queries (niet bij je data)

Schrijf de top 5–10 dingen op die je app of team moet doen:

Wat lees je het meest (single record lookups, filters, joins, aggregaties, similarity search)?
Wat schrijf je het meest (single-row inserts, event streams, updates, bulk loads)?
Hoe vers moeten resultaten zijn (milliseconds, seconden, minuten)?

Dit verkleint de opties sneller dan een uitgebreide feature-checklist.

2) Koppel de database aan je datavorm

Gebruik deze snelle “vorm”-checklist:

Gestructureerde, consistente velden → een relationele database
Semi-gestructureerde JSON die vaak verandert → een documentdatabase
Veel-tot-veel relaties die je diep doorloopt → een graafdatabase
Embeddings en nearest-neighbor search → een vectordatabase
Events/metrics met tijdstempels en rollups → een tijdreeksdatabase
Enorme scale-out tabellen met voorspelbare toegangspatronen → een wide-column database
Zeer simpele get/set per sleutel → een key-value store
Zware analytics-scans en aggregaties → een kolomgebaseerde database (of warehouse)

3) Maak latency-, throughput- en kostendrivers vroeg duidelijk

Performance-doelen definiëren architectuur. Stel ruwe cijfers (p95 latency, reads/writes per seconde, dataretentie). Kosten volgen meestal uit:

Storage (raw data + replicas)
Compute (queries, ETL/ELT, background jobs)
Replicatie (multi-region, HA)
Indexering (snellere queries, meer schrijf-overhead)

4) Een eenvoudige beslisingstabel

Primaire use case	Vaak beste keuze	Waarom
Transacties, facturen, gebruikersaccounts	Relationeel (SQL)	Sterke constraints, joins, consistentie
App-data met evoluerende velden	Document	Flexibel schema, natuurlijk JSON
Realtime caching/sessie-state	Key-value store	Snelle lookups per key
Clickstreams/metrics over de tijd	Tijdreeks	Hoge ingest + tijdgebaseerde queries
BI-dashboards, grote aggregaties	Kolomgebaseerd	Snelle scans + compressie
Sociale/kennisrelaties	Graaf	Efficiënte relationele traversals
Semantische zoek, RAG retrieval	Vector	Similarity search over embeddings
Massale operationele data op schaal	Wide-column	Horizontale schaal, voorspelbare queries

Veel teams gebruiken twee databases: één voor operatie (bv. relationeel) en één voor analytics (bv. kolomgebaseerd/warehouse). De “juiste” keuze maakt je belangrijkste queries het eenvoudigst, snelst en goedkoopst betrouwbaar uit te voeren.

Een praktische noot als je snel producten bouwt

Als je prototypet of snel features uitrolt, hangt de databasekeuze vaak samen met je ontwikkelworkflow. Platforms zoals Koder.ai (een vibe-coding platform dat web-, backend- en mobiele apps genereert vanuit chat) kunnen dit concreter maken: bijvoorbeeld, Koder.ai’s default backend stack gebruikt Go + PostgreSQL, wat een sterke startpunt is wanneer je transactionele correctheid en brede SQL-tooling nodig hebt.

Naarmate je product groeit, kun je gespecialiseerde databases toevoegen (zoals een vectordatabase voor semantische zoek of een kolomgebaseerd warehouse voor analytics) terwijl je PostgreSQL als bron van waarheid behoudt. Het belangrijkste is te beginnen met de workloads die je vandaag moet ondersteunen — en de deur open te houden om “een tweede opslag” toe te voegen wanneer de querypatronen daarom vragen.

Veelgestelde vragen

Wat betekent “databasetype” in de praktijk?

Een “databasetype” is een kortere manier om drie dingen aan te duiden:

Datamodel (tabellen, documenten, sleutel–waarde-paren, grafen, vectoren, tijdgestempelde punten)
Querypatronen waarvoor het geoptimaliseerd is (joins, scans/aggregaties, traversals, similarity search)
Schaal- en consistentieafwegingen (scale-up vs. scale-out, strikt vs. eventual consistency)

Het kiezen van het type is eigenlijk het kiezen van standaardwaarden voor prestaties, kosten en operationele complexiteit.

Hoe kies ik het juiste databasetype zonder te veel te twijfelen?

Begin met je top 5–10 queries en schrijfpatronen, en koppel die aan de juiste sterke punten:

Wanneer moet ik een relationele (SQL) database gebruiken?

Relationele databases zijn een sterke standaardkeuze wanneer je nodig hebt:

Gestructureerde, goed gedefinieerde schema’s
ACID-transacties (correctheid voor geld, voorraad, bestellingen)
Joins en constraints (foreign keys, consistente relaties)

Ze kunnen lastig worden als je constante schemawijzigingen hebt of extreem horizontaal moet schalen met veel join-zware queries over shards.

Wat zijn ACID-transacties en wanneer zijn ze het belangrijkst?

ACID is een betrouwbaarheidsgarantie voor meerstapswijzigingen:

Atomicity: alle stappen slagen of geen enkele
Consistency: regels/constraints blijven geldig
Isolation: gelijktijdige operaties corrumperen elkaar niet
Durability: gecommitte data overleeft crashes

Het is vooral belangrijk voor workflows waarbij fouten duur zijn (betalingen, boekingen, voorraadupdates).

Waarom zijn kolomdatabases sneller voor analytics dan row-stores?

Kolomgebaseerde databases zijn het meest geschikt wanneer queries:

Veel rijen scannen
Slechts een paar kolommen lezen
Aggregaten berekenen (SUM, COUNT, AVG, )

Wanneer is een documentdatabase logischer dan SQL?

Een documentdatabase is een goede keuze als:

Je app-data past bij JSON-achtige objecten (profielen, catalogi, content)
De vorm vaak verandert of per item varieert
Je geneste structuren wilt opslaan zonder alles te splitsen over veel tabellen

Let op trade-offs rond complexe joins, het dupliceren van data voor leesprestaties, en de kosten van multi-document transacties.

Waar zijn key-value stores het beste voor (naast caching)?

Gebruik een key-value store wanneer je toegangspatroon meestal is:

Get/set per enkele sleutel (lage-latentie lookups)
Caching van resultaten uit een primaire database
Sessies, rate limiting, feature flags of winkelwagentjes

Houd rekening met beperkingen: ad-hoc query’s zijn vaak zwak en ondersteuning voor secundaire indexen varieert—meestal ontwerp je zelf keys en aanvullende lookup-keys.

Wat is het verschil tussen kolomgebaseerde databases en wide-column databases?

Ondanks de gelijk klinkende naam richten ze zich op verschillende workloads:

Kolomgebaseerde databases: analytics (snelle scans + compressie over kolommen)
Wide-column databases: grootschalige operationele opslag (hoge schrijfdoorvoer, voorspelbare key-gebaseerde reads)

Wide-column systemen vereisen vaak query-gedreven modellering (tabellen ontwerpen rond exacte toegangspatronen) en zijn niet bedoeld als flexibele SQL-vervanger met joins.

Wanneer moet ik een graafdatabase kiezen boven relationele tabellen?

Gebruik een graafdatabase wanneer je kernvragen over relaties gaan, zoals:

Paden en scheidingen in graden (degrees of separation)
Aanbevelingen op basis van connecties
Frauderingsringen en gedeelde attributen tussen entiteiten

Graafdatabases blinken uit in traversals (het doorlopen van relaties) waar een relationele aanpak veel joins nodig heeft. De trade-off is dat je nieuwe modelleerconventies en querytalen (vaak Cypher/Gremlin/SPARQL) moet leren.

Welk probleem lossen vectordatabases op, en vervangen ze mijn hoofd-DB?

Een vector-database is ontworpen voor similarity search over embeddings (numerieke representaties van betekenis). Gebruikelijke toepassingen zijn:

Semantische zoekopdrachten (vind relevante documenten ook bij andere woordkeuze)
RAG retrieval voorafgaand aan antwoorden van een LLM
Aanbevelingen gebaseerd op inhoudsvergelijkbaarheid

In de praktijk wordt het meestal gecombineerd met een relationele of documentstore: houd de bron-van-waarheid daar, bewaar embeddings + vectorindex in de vector DB en combineer de resultaten voor volledige records en permissies.

20 aug 2025·8 min

Soorten databases: relationeel, kolomgebaseerd, document, graaf en meer

Vergelijk de belangrijkste databasetypen — relationeel, kolomgebaseerd, document, graaf, vector, key-value en meer — met gebruiksscenario's, afwegingen en tips om de juiste keuze te maken.

Wat “databasetypen” echt betekent

Waarom het “type” ertoe doet

Verschillende databasetypen maken verschillende afwegingen:

Een relationele database is ideaal wanneer je data gestructureerd is en je betrouwbare transacties nodig hebt.
Een kolomgebaseerde database blinkt uit als je veel rijen moet scannen om analytische vragen te beantwoorden.
Een documentdatabase kan sneller zijn wanneer de vorm van je app-data vaak verandert.
Een graafdatabase is gebouwd voor data met veel relaties.
Een vectordatabase richt zich op “similariteit” in plaats van exacte overeenkomsten.

Die ontwerpkeuzes beïnvloeden:

Querypatronen: veel kleine lookups, complexe joins of grote analytische scans?
Schaalmodel: schaal je één grote machine op, of scale-out je over veel machines?
Datamodel: tabellen, documenten, sleutel–waarde-paren, grafen, vectoren of tijdgestempelde punten.

Wat je in deze gids leert

Dit artikel behandelt de belangrijkste soorten databases en legt voor elk uit:

Waar het het beste in is (en waar het moeite mee heeft)
Typische gebruiksscenario’s in echte producten
Belangrijke afwegingen die prestaties, kosten en complexiteit beïnvloeden

Een korte opmerking over “multi-model” systemen

Dus “type” is geen strikt hokje — het helpt echter om de standaardsterktes en de workloads te begrijpen waarvoor een database meestal het beste is.

Hoe je deze gids gebruikt om opties te shortlisten

Begin met je belangrijkste workload:

Als je gestructureerde data en transacties nodig hebt, begin met een relationele database.
Als je zware rapportage en dashboards doet, kijk naar een kolomgebaseerde database of datawarehouse.
Als de vorm van je app-data vaak verandert, overweeg een documentdatabase.
Als je extreem snelle lookups op sleutel nodig hebt, is een key-value store een sterke kandidaat.

Gebruik daarna de sectie “Hoe kies je het juiste databasetype” om verder te verfijnen op basis van schaal, consistentiebehoeften en de queries die je het vaakst draait.

Relationele databases (SQL): de standaard voor gestructureerde data

Waarom SQL overal is

Relationele systemen worden meestal bevraagd met SQL (Structured Query Language). SQL is populair omdat het leesbaar en expressief is:

Je kunt data filteren en sorteren (WHERE, ORDER BY).
Data combineren over tabellen (JOIN).
Resultaten samenvatten (GROUP BY).

De meeste reportingtools, analyticsplatforms en zakelijke applicaties spreken SQL, wat het een veilige standaard maakt als je brede compatibiliteit wilt.

ACID-transacties, in gewone taal

Relationele databases staan bekend om ACID-transacties, die helpen data correct te houden:

Atomicity: een meerstapswijziging is “alles of niets”.
Consistency: regels (zoals foreign keys) blijven geldig na wijzigingen.
Isolation: gelijktijdige updates corrumperen elkaar niet.
Durability: eenmaal opgeslagen data overleeft crashes.

Dit is belangrijk wanneer fouten kostbaar zijn — denk aan dubbel afrekenen van een klant of het verliezen van een voorraadupdate.

Werkloads waarbij het goed past

Een relationele database is meestal de juiste keuze voor gestructureerde, goed gedefinieerde data en workflows zoals:

Businessapplicaties (CRM/ERP-achtige systemen)
Financiën, betalingen, facturatie
Voorraad, bestellingen, reserveringen

Veelvoorkomende valkuilen

Dezelfde structuur die relationele databases betrouwbaar maakt, kan wrijving toevoegen:

Starre schema’s: frequente veranderingen in datavorm vereisen migraties.
Join-zware scaling: veel joins over grote tabellen kan traag of duur worden op grote schaal, zeker als data over veel machines verdeeld is.

Als je datamodel constant verandert — of je hebt extreme horizontale schaal nodig met eenvoudigere toegangspatronen — kunnen andere databasetypen geschikter zijn.

Kolomgebaseerde databases: gebouwd voor analytics

Kolomgebaseerde databases slaan data “per kolom” op in plaats van “per rij”. Die ene wijziging heeft veel impact op snelheid en kosten voor analytics-workloads.

Row-store vs. column-store

In een traditionele row-store (gebruikelijk in relationele databases) zitten alle waarden voor één record bij elkaar. Dat is ideaal wanneer je vaak één klant/order tegelijk ophaalt of bijwerkt.

Waarom kolomgebaseerd snel is voor rapportage

Analytics- en BI-queries:

Scannen vaak veel records
Selecteren een kleine set kolommen
Berekenen aggregaten zoals SUM, AVG, COUNT en groeperen op dimensies

Typische querypatronen

Afwegingen: OLTP-achtige updates en point lookups

Waar het uitblinkt

Kolomgebaseerde databases zijn een sterke keuze voor:

BI en executive dashboards
Event- en clickstream-analytics
Grootschalige rapportage over logs of transacties

Als prioriteit ligt bij snelle aggregaties over veel data, is kolomgebaseerd meestal het eerste type om te evalueren.

Documentdatabases: flexibele schema’s voor app-data

Het documentmodel (JSON-achtige records)

Deze flexibiliteit is vooral nuttig wanneer je requirements vaak veranderen of wanneer verschillende items verschillende velden hebben.

Indexering, op hoofdlijnen

Sterktes — en de afwegingen

Documentdatabases blinken uit bij evoluerende schema’s, geneste data en API-vriendelijke payloads. De afwegingen komen meestal naar voren als je:

Complexe joins over veel entiteiten nodig hebt (minder natuurlijk dan in een relationele DB)
Multi-document transacties op hoge schaal nodig hebt (in veel producten ondersteund, maar kan performance kosten)
Strikte normalisatie nodig hebt (teams dupliceren soms data om reads simpel te houden, wat zorgvuldige update-logica vereist)

Veelgebruikte scenarios

Ze zijn een sterke keuze voor contentmanagement, productcatalogi, gebruikersprofielen en backend-API’s — overal waar je data goed past bij “één object per pagina/screen/request”.

Key-value stores: simpel en erg snelle lookups

Het key-value model (en waarom het snel is)

Waarom het populair is voor caching en sessies

Ze zijn ook een natuurlijke keuze voor sessieopslag (bijv. session:<id> -> session data) omdat sessies vaak gelezen en bijgewerkt worden en automatisch kunnen verlopen.

TTL, eviction en geheugen vs. schijf

De meeste key-value stores ondersteunen een TTL (time to live) zodat data kan verlopen zonder handmatige cleanup — ideaal voor sessies, eenmalige tokens en rate-limit tellers.

Afwegingen om vooraf te kennen

Key-value stores blinken uit wanneer je de sleutel al kent. Ze zijn minder geschikt voor open-einde vragen.

Veelgebruikte scenarios

Key-value stores zijn uitstekend voor:

Rate limiting: tellers per gebruiker/IP met een TTL-window
Feature flags: snelle reads om gedrag per gebruiker of cohort te beslissen
Winkelwagentjes: snelle updates van een cart-object keyed op gebruiker/session

Als je toegangspatroon “haal/bewerk op ID” is en latency belangrijk is, is een key-value store vaak de eenvoudigste manier om betrouwbare snelheid te halen.

Wide-column databases: scale-out operationele opslag

Itereer zonder angst

Voer schema- en featurewijzigingen door met snapshots en rollback voor een veilige reset.

Gebruik snapshots

Wide-column vs. kolomgebaseerde analytics

Ondanks de vergelijkbare naam zijn wide-column databases niet hetzelfde als een kolomgebaseerde database voor analytics.

Waar ze in uitblinken

Wide-column systemen zijn ontworpen voor:

Hoge schrijfdoorvoer (veel events per seconde verwerken)
Horizontale schaal (nodes toevoegen om meer verkeer en data aan te kunnen)
Voorspelbare, lage-latentie reads wanneer je met de juiste key vraagt

Het typische toegangspatroon

Het meest voorkomende patroon is:

Je kent de partition key (die bepaalt waar data woont), en
Je leest vaak een range binnen die partition (bijv. “alle events voor device X tussen 10:00–10:05”).

Dat maakt ze geschikt voor tijdgeordende data en append-heavy workloads.

Afwegingen om te begrijpen

Veelgebruikte scenarios

Graafdatabases: relaties als eersteklas data

Het graafmodel: nodes, edges en properties

Een graaf heeft meestal:

Nodes: de entiteiten (mensen, accounts, apparaten, producten)
Edges: de relaties daartussen ("follows", "paid", "belongs to", "shipped to")
Properties: key-value attributen op nodes en edges (timestamps, bedragen, labels)

Dat maakt het natuurlijk om netwerken, hiërarchieën en many-to-many relaties te representeren zonder je schema te forceren.

Waarom traversals joins kunnen verslaan

Relatie-zware queries vereisen vaak veel joins in een relationele database. Elke extra join kan complexiteit en kosten toevoegen naarmate je data groeit.

Vragen die grafen vooral goed beantwoorden

Graafdatabases blinken uit voor:

Paden en graden van scheiding (kortste pad, bereikbaarheid)
Aanbevelingen (“gebruikers die X kochten, kochten ook Y”, “vrienden van vrienden”)
Fraude-ringen en anomaliepatronen (gedeelde apparaten, adressen, betaalmethoden)

Afwegingen om voor te bereiden

Wanneer een relationeel model voldoende is

Vectordatabases: similarity search voor AI-toepassingen

Bouw en ontvang beloningen

Deel wat je gebouwd hebt met Koder.ai en ontvang credits via het earn credits-programma.

Verdien credits

Waarom vectoren semantische zoekopdrachten mogelijk maken

Kernoperaties: similariteit + filters

De hoofdoperatie is nearest neighbor search: gegeven een queryvector, haal de dichtstbijzijnde vectors op.

In echte apps combineer je similariteit meestal met filters, zoals:

Alleen documenten van een specifieke klant tonen
Beperken tot een productcategorie of taal
Gearchiveerde of lage-kwaliteit items uitsluiten

Dit “filter + similarity” patroon maakt vectorsearch praktisch voor echte datasets.

Waar vectordatabases passen

Veelvoorkomende toepassingen zijn:

RAG (Retrieval-Augmented Generation): haal de meest relevante passages op voordat een LLM antwoordt
Semantische zoekopdrachten: zoek in knowledge bases, supporttickets of interne docs
Aanbevelingen: “gebruikers bekeken/kochten ook” op basis van inhoudssimilariteit

Afwegingen om te weten

Combineren met relationele of documentstores

Tijdreeksdatabases: geoptimaliseerd voor metrics in de tijd

Hoe tijdreeksdata eruitziet

De meeste tijdreeksrecords combineren:

Timestamp: wanneer de meting plaatsvond
Metric/value: het getal dat je volgt (latency, temperatuur, prijs)
Tags/labels: metadata voor filteren en groeperen (host=web-01, region=us-east, service=checkout)

Dit maakt het makkelijk om vragen te stellen als “toon foutpercentage per service” of “vergelijk latency over regio’s”.

Prestatiefeatures waar TSDBs op leunen

Omdat datavolume snel kan groeien, richten TSDBs zich vaak op:

Compressie: lange reeksen numerieke waarden efficiënt opslaan
Retention policies: automatisch oude data verwijderen (bijv. raw 7 dagen, aggregaten 90 dagen)
Downsampling: details samenvatten (per-seconde → per-minuut → per-uur)

Deze features houden opslag- en querykosten voorspelbaar zonder constante handmatige cleanup.

Veelgebruikte querypatronen

TSDBs blinken uit bij tijdgebaseerde berekeningen, zoals:

Rollende gemiddelden (bv. 5-minuten moving average)
Percentielen (p95/p99 latency)
Snelheidsverandering (requests/second)
Alerting bij drempels of afwijkingen

Waar ze passen (en waar niet)

Typische toepassingen: monitoring, observability, IoT/sensors en financial tick data.

Warehouses en lakehouses: analytics op organisatieniveau

Batch vs. streaming ingestie (de simpele versie)

Meestal accepteren warehouses data op twee manieren:

Batch-ingestie: data landt elk uur/dag (bv. nachtelijke exports van je app-database). Goedkoop en simpel, maar niet real-time.
Streaming-ingestie: events komen continu binnen (clicks, betalingen, IoT). Je ziet frissere cijfers, maar pijplijnen en monitoring zijn belangrijker.

Waarom ze snel zijn: kolomopslag, partitionering, materialized views

Warehouses zijn doorgaans geoptimaliseerd voor analytics met een paar praktische technieken:

Kolomopslag leest alleen de kolommen die nodig zijn voor een rapport (goed voor sum, average, group by).
Partitionering splitst grote tabellen op tijd of regio zodat queries minder data scannen.
Materialized views slaan voorgecomputeerde resultaten op (zoals “dagelijkse omzet per land”) om dashboards te versnellen.

Governance is niet optioneel op schaal

Wanneer een lakehouse zinvol is

Belangrijke afwegingen: consistentie, schaal en querypatronen

Maak het productieklaar

Lancering met een custom domein wanneer je prototype klaar is voor echte gebruikers.

Stel domein in

Kiezen tussen databasetypen gaat minder over “wat is het beste” en meer over fit: wat je moet opvragen, hoe snel, en wat er gebeurt als delen van het systeem falen.

OLTP vs. OLAP (match de workload)

Een korte vuistregel:

OLTP (online transactions): veel kleine reads/writes (checkout, inloggen, orderupdates). Prioriteiten: lage latency, correcte updates, veel gelijktijdige gebruikers.
OLAP (analytics): minder maar zwaardere queries die veel rijen scannen (dashboards, trends). Prioriteiten: snelle aggregatie, kolomopslag, scheiding van compute en storage.

Relationele databases blinken vaak uit voor OLTP; kolomgebaseerde systemen, warehouses en lakehouses worden vaak gebruikt voor OLAP.

CAP in gewone taal

Als een netwerkstoring je systeem in stukken splitst, kun je meestal niet alle drie tegelijk hebben:

Consistency: iedereen ziet direct dezelfde data.
Availability: het systeem blijft reageren.
Partition tolerance: het blijft werken ondanks netwerkproblemen.

Schalen: verticaal, horizontaal en sharding

Verticaal schalen: een grotere machine — simpel, maar heeft limieten.
Horizontaal schalen: meer machines — meer capaciteit, meer coördinatie.
Sharding: data over nodes verdelen (vaak op klant-ID). Verhoogt schaal, maar cross-shard queries en transacties worden lastiger.

Transacties en concurrency basics

Operationele zorgen (sla deze niet over)

Hoe kies je het juiste databasetype

Kiezen tussen de belangrijkste soorten databases gaat minder over wat trending is en meer over wat je met je data wilt doen. Een praktische start is terugwerken vanaf je queries en workloads.

1) Begin bij je queries (niet bij je data)

Schrijf de top 5–10 dingen op die je app of team moet doen:

Wat lees je het meest (single record lookups, filters, joins, aggregaties, similarity search)?
Wat schrijf je het meest (single-row inserts, event streams, updates, bulk loads)?
Hoe vers moeten resultaten zijn (milliseconds, seconden, minuten)?

Dit verkleint de opties sneller dan een uitgebreide feature-checklist.

2) Koppel de database aan je datavorm

Gebruik deze snelle “vorm”-checklist:

Gestructureerde, consistente velden → een relationele database
Semi-gestructureerde JSON die vaak verandert → een documentdatabase
Veel-tot-veel relaties die je diep doorloopt → een graafdatabase
Embeddings en nearest-neighbor search → een vectordatabase
Events/metrics met tijdstempels en rollups → een tijdreeksdatabase
Enorme scale-out tabellen met voorspelbare toegangspatronen → een wide-column database
Zeer simpele get/set per sleutel → een key-value store
Zware analytics-scans en aggregaties → een kolomgebaseerde database (of warehouse)

3) Maak latency-, throughput- en kostendrivers vroeg duidelijk

Performance-doelen definiëren architectuur. Stel ruwe cijfers (p95 latency, reads/writes per seconde, dataretentie). Kosten volgen meestal uit:

Storage (raw data + replicas)
Compute (queries, ETL/ELT, background jobs)
Replicatie (multi-region, HA)
Indexering (snellere queries, meer schrijf-overhead)

4) Een eenvoudige beslisingstabel

Primaire use case	Vaak beste keuze	Waarom
Transacties, facturen, gebruikersaccounts	Relationeel (SQL)	Sterke constraints, joins, consistentie
App-data met evoluerende velden	Document	Flexibel schema, natuurlijk JSON
Realtime caching/sessie-state	Key-value store	Snelle lookups per key
Clickstreams/metrics over de tijd	Tijdreeks	Hoge ingest + tijdgebaseerde queries
BI-dashboards, grote aggregaties	Kolomgebaseerd	Snelle scans + compressie
Sociale/kennisrelaties	Graaf	Efficiënte relationele traversals
Semantische zoek, RAG retrieval	Vector	Similarity search over embeddings
Massale operationele data op schaal	Wide-column	Horizontale schaal, voorspelbare queries

Een praktische noot als je snel producten bouwt

Veelgestelde vragen

Wat betekent “databasetype” in de praktijk?

Een “databasetype” is een kortere manier om drie dingen aan te duiden:

Datamodel (tabellen, documenten, sleutel–waarde-paren, grafen, vectoren, tijdgestempelde punten)
Querypatronen waarvoor het geoptimaliseerd is (joins, scans/aggregaties, traversals, similarity search)
Schaal- en consistentieafwegingen (scale-up vs. scale-out, strikt vs. eventual consistency)

Het kiezen van het type is eigenlijk het kiezen van standaardwaarden voor prestaties, kosten en operationele complexiteit.

Hoe kies ik het juiste databasetype zonder te veel te twijfelen?

Begin met je top 5–10 queries en schrijfpatronen, en koppel die aan de juiste sterke punten:

Wanneer moet ik een relationele (SQL) database gebruiken?

Relationele databases zijn een sterke standaardkeuze wanneer je nodig hebt:

Gestructureerde, goed gedefinieerde schema’s
ACID-transacties (correctheid voor geld, voorraad, bestellingen)
Joins en constraints (foreign keys, consistente relaties)

Ze kunnen lastig worden als je constante schemawijzigingen hebt of extreem horizontaal moet schalen met veel join-zware queries over shards.

Wat zijn ACID-transacties en wanneer zijn ze het belangrijkst?

ACID is een betrouwbaarheidsgarantie voor meerstapswijzigingen:

Atomicity: alle stappen slagen of geen enkele
Consistency: regels/constraints blijven geldig
Isolation: gelijktijdige operaties corrumperen elkaar niet
Durability: gecommitte data overleeft crashes

Het is vooral belangrijk voor workflows waarbij fouten duur zijn (betalingen, boekingen, voorraadupdates).

Waarom zijn kolomdatabases sneller voor analytics dan row-stores?

Kolomgebaseerde databases zijn het meest geschikt wanneer queries:

Veel rijen scannen
Slechts een paar kolommen lezen
Aggregaten berekenen (SUM, COUNT, AVG, )

Wanneer is een documentdatabase logischer dan SQL?

Een documentdatabase is een goede keuze als:

Je app-data past bij JSON-achtige objecten (profielen, catalogi, content)
De vorm vaak verandert of per item varieert
Je geneste structuren wilt opslaan zonder alles te splitsen over veel tabellen

Let op trade-offs rond complexe joins, het dupliceren van data voor leesprestaties, en de kosten van multi-document transacties.

Waar zijn key-value stores het beste voor (naast caching)?

Gebruik een key-value store wanneer je toegangspatroon meestal is:

Get/set per enkele sleutel (lage-latentie lookups)
Caching van resultaten uit een primaire database
Sessies, rate limiting, feature flags of winkelwagentjes

Houd rekening met beperkingen: ad-hoc query’s zijn vaak zwak en ondersteuning voor secundaire indexen varieert—meestal ontwerp je zelf keys en aanvullende lookup-keys.

Wat is het verschil tussen kolomgebaseerde databases en wide-column databases?

Ondanks de gelijk klinkende naam richten ze zich op verschillende workloads:

Kolomgebaseerde databases: analytics (snelle scans + compressie over kolommen)
Wide-column databases: grootschalige operationele opslag (hoge schrijfdoorvoer, voorspelbare key-gebaseerde reads)

Wide-column systemen vereisen vaak query-gedreven modellering (tabellen ontwerpen rond exacte toegangspatronen) en zijn niet bedoeld als flexibele SQL-vervanger met joins.

Wanneer moet ik een graafdatabase kiezen boven relationele tabellen?

Gebruik een graafdatabase wanneer je kernvragen over relaties gaan, zoals:

Paden en scheidingen in graden (degrees of separation)
Aanbevelingen op basis van connecties
Frauderingsringen en gedeelde attributen tussen entiteiten

Welk probleem lossen vectordatabases op, en vervangen ze mijn hoofd-DB?

Een vector-database is ontworpen voor similarity search over embeddings (numerieke representaties van betekenis). Gebruikelijke toepassingen zijn:

Semantische zoekopdrachten (vind relevante documenten ook bij andere woordkeuze)
RAG retrieval voorafgaand aan antwoorden van een LLM
Aanbevelingen gebaseerd op inhoudsvergelijkbaarheid

GROUP BY