Claude Code testgeneratie-prompt voor grensgevaltests

Q: Wat moet ik opschrijven voordat ik een AI vraag tests te genereren?

Begin met een klein contract dat je in één adem kunt lezen: - Inputs: typen, toegestane bereiken, wat telt als leeg/ontbrekend - Outputs: vorm van succes en fout - Bijwerkingen: wat er geschreven/gewijzigd kan worden (DB, bestanden, netwerk) - “Mag nooit gebeuren”: crash, stille dataverlies, dubbele afschrijving, gedeeltelijke writes Genereer vervolgens tests vanuit dat contract, niet alleen vanuit voorbeelden.

Q: Welke grensgevallen zijn meestal de moeite waard om te testen?

Test eerst deze: - Min/max waarden (0, 1, max, max+1) - Leeg vs aanwezig ("", [], null/nil) - Off-by-one (n-1, n, n+1) - Formatteerranden (alleen-witruimte strings, voorloopnullen) - Tijdranden (net voor/na vervallen) Kies één of twee per input-dimensie zodat elke test een uniek risico dekt.

Q: Hoe schrijf ik een goede “failure mode” test in plaats van een oppervlakkige?

Een goede failure-mode test bewijst twee dingen: 1) De functie geeft een duidelijke, verwachte fout terug (type/bericht/status). 2) Ze faalt veilig : - geen gedeeltelijke staatwijzigingen - geen interne details gelekt - geen onbedoelde retries of bijwerkingen Als er een database-write bij betrokken is, controleer altijd wat er in de opslag gebeurde na de fout.

Q: Wat moet ik het model laten outputten voordat ik testcode genereer?

Duw eerst op PHASE 1: alleen plan . Eis dat het model oplevert: - maximaal 6–10 voorgestelde tests - voor elk: intentie, setup, input, verwacht resultaat, waarom het high-signal is - een kleine boundary-matrix - een failure-mode lijst - 3–5 invarianties en hoe die te asserten Pas na goedkeuring van het plan genereer je code. Dit voorkomt “20 look-alike tests”.

Q: Hoe zie ik snel of een AI-gegeneerde test weinig waarde heeft?

Gebruik een simpele deletetest: - Als je de test verwijdert en geen enkele grens , geen faalmodus en geen invariant verliest, verdiende hij zijn plek niet. Check ook op duplicaten: - Als twee tests voor dezelfde bug falen, houd de met de sterkere assertie. - Als asserties alleen “niet null” of “status 200” zijn, verscherp ze of verwijder de test.

Inloggen Aan de slag

Claude Code testgeneratie-prompt voor grensgevaltests | Koder.ai

Waarom happy-path testgeneratie tijd verspilt

Auto-gegenereerde testsuites zien er vaak indrukwekkend uit: tientallen tests, veel setup-code, en elke functienaam komt ergens terug. Maar veel van die tests zijn slechts “het werkt als alles normaal is”-controles. Ze slagen makkelijk, vangen zelden bugs en kosten nog steeds tijd om te lezen en te onderhouden.

Met een typische Claude Code testgeneratie-prompt heeft het model de neiging de voorbeeld-inputs te spiegelen die het ziet. Je krijgt variaties die er anders uitzien maar hetzelfde gedrag dekken. Het resultaat is een grote suite met dunne dekking waar het belangrijk is.

High-signal tests zijn anders. Het zijn de kleine set die de storing van vorige maand had opgevangen. Ze falen wanneer het gedrag op een risicovolle manier verandert, en ze blijven stabiel bij onschuldige refactors. Eén high-signal test kan twintig "returned the expected value"-checks waard zijn.

Low-value happy-path generatie heeft meestal een paar duidelijke signalen:

Veel tests verschillen alleen in inputlabels, niet in wat er kapot kan gaan.
Asserties zijn ondiep ("niet null", "status is 200") in plaats van betekenis te controleren.
De setup is zwaarder dan het gedrag dat getest wordt, dus mensen stoppen met het bijwerken van tests.
Coverage lijkt hoog, maar edge-cases blijven onaangeraakt.

Stel je een functie voor die een kortingscode toepast. Happy-path tests bevestigen dat “SAVE10” de prijs verlaagt. Echte bugs verstoppen zich elders: 0 of negatieve prijzen, verlopen codes, afrondingsranden of maximale kortingcaps. Dat zijn de gevallen die leiden tot verkeerde totalen, boze klanten en nachtelijke rollbacks.

Het doel is te verschuiven van “meer tests” naar “betere tests” door te mikken op drie doelen: grenzen, faalmodi en invarianties.

De drie doelen: grenzen, faalmodi, invarianties

Als je high-signal unit tests wilt, stop dan met vragen om “meer tests” en begin te vragen om drie specifieke soorten. Dit is de kern van een Claude Code testgeneratie-prompt die nuttige dekking oplevert in plaats van een stapel “werkt op normale input”-controles.

1) Grenzen (waar bugs zich verbergen)

Grenzen zijn de randen van wat de code accepteert of produceert. Veel echte defecten zijn off-by-one, lege-staat of timeout-problemen die nooit in een happy path verschijnen.

Denk in termen van minima en maxima (0, 1, max lengte), leeg versus aanwezig ("", [], nil), off-by-one (n-1, n, n+1) en tijdslimieten (dicht bij de cutoff).

Voorbeeld: als een API “tot 100 items” accepteert, test dan 100 en 101, niet alleen 3.

2) Faalmodi (bewijs dat het veilig faalt)

Faalmodi zijn de manieren waarop het systeem kan breken: slechte inputs, ontbrekende afhankelijkheden, gedeeltelijke resultaten of upstream errors. Goede faalmodus-tests controleren gedrag onder stress, niet alleen output onder ideale omstandigheden.

Voorbeeld: als een database-call faalt, retourneert de functie dan een duidelijke fout en vermijdt het het schrijven van gedeeltelijke data?

3) Invarianties (regels die altijd moeten gelden)

Invarianties zijn waarheden die voor en na een oproep waar moeten blijven. Ze veranderen vage correctheid in scherpe asserties.

Voorbeelden:

“Saldo wordt nooit negatief” na elke opnamepoging.
“IDs zijn uniek” zelfs als je items snel aanmaakt.
“Bij fout geen staatwijziging” (geen nieuwe rijen, geen flags omgeslagen).

Wanneer je je richt op deze drie doelen, krijg je minder tests, maar draagt elke test meer signaal.

Voorbereiding: haal een klein contract eruit voordat je tests schrijft

Als je te vroeg om tests vraagt, krijg je meestal een hoop beleefde “werkt zoals verwacht”-checks. Een eenvoudige oplossing is eerst een klein contract te schrijven en vervolgens tests van dat contract te genereren. Het is de snelste manier om een Claude Code testgeneratie-prompt om te zetten in iets dat echte bugs vindt.

Een bruikbaar contract is kort genoeg om in één adem te lezen. Mik op 5 tot 10 regels die drie vragen beantwoorden: wat gaat erin, wat komt eruit en wat verandert er nog meer.

Een 5–10 regels contracttemplate

Schrijf het contract in gewone taal, niet in code, en neem alleen op wat je kunt testen.

Inputs: types, toegestane bereiken en wat telt als “leeg” of “ontbrekend”.
Output: return value of errorvorm, en wat “succes” garandeert.
Bijwerkingen: veranderingen in state, database-rijen, netwerkcalls, bestanden, logs.
Veronderstellingen: dingen die callers vaak fout doen (timezone, encoding, auth, ordering).
“Mag nooit gebeuren”: crash, stil dataverlies, dubbele afschrijving, gedeeltelijke writes.

Als je dat hebt, scan het op plekken waar de realiteit je aannames kan breken. Die worden grensgevallen (min/max, nul, overflow, lege strings, duplicaten) en faalmodi (timeouts, permission denied, unique constraint violations, corrupte input).

Hier is een concreet voorbeeld voor een feature zoals reserveInventory(itemId, qty):

Het contract kan zeggen dat qty een positief geheel getal moet zijn, de functie atomair moet zijn en nooit een negatieve voorraad mag creëren. Dat suggereert direct high-signal tests: qty = 0, qty = 1, qty groter dan beschikbaar, gelijktijdige calls en een geforceerde databasefout halverwege.

Als je een vibe-coding tool gebruikt zoals Koder.ai, geldt dezelfde workflow: schrijf eerst het contract in chat, genereer daarna tests die direct grenzen, faalmodi en de “mag nooit gebeuren”-lijst aanvallen.

Promptpatroon: de high-signal testblueprint

Gebruik deze Claude Code testgeneratie-prompt wanneer je minder tests wilt, maar elke test meer waarde moet hebben. De sleutel is eerst een testplan forceren en pas na goedkeuring testcode genereren.

You are helping me write HIGH-SIGNAL unit tests.

Context
- Language/framework: <fill in>
- Function/module under test: <name + short description>
- Inputs: <types, ranges, constraints>
- Outputs: <types + meaning>
- Side effects/external calls: <db, network, clock, randomness>

Contract (keep it small)
1) Preconditions: <what must be true>
2) Postconditions: <what must be true after>
3) Error behavior: <how failures are surfaced>

Task
PHASE 1 (plan only, no code):
A) Propose 6-10 tests max. Do not include “happy path” unless it protects an invariant.
B) For each test, state: intent, setup, input, expected result, and WHY it is high-signal.
C) Invariants: list 3-5 invariants and how each will be asserted.
D) Boundary matrix: propose a small matrix of boundary values (min/max/empty/null/off-by-one/too-long/invalid enum).
E) Failure modes: list negative tests that prove safe behavior (no crash, no partial write, clear error).
Stop after PHASE 1 and ask for approval.

PHASE 2 (after approval):
Generate the actual test code with clear names and minimal mocks.

Een praktische truc is te eisen dat de boundary-matrix als compacte tabel komt, zodat gaten duidelijk zijn:

Dimension	Valid edge	Just outside	“Weird” value	Expected behavior
length	0	-1	10,000	error vs clamp vs accept

Als Claude 20 tests voorstelt, duw dan terug. Vraag het te combineren en alleen die tests te houden die echt een bug zouden vangen (off-by-one, verkeerd fouttype, stil dataverlies, gebroken invariant).

Stapsgewijs: voer de prompt uit en zet output om in tests

Krijg beloning voor delen

Deel wat je leert over high-signal tests en verdien credits voor je Koder.ai-account.

Verdien credits

Begin met een klein, concreet contract voor het gedrag dat je wilt. Plak de functiehandtekening, een korte beschrijving van inputs en outputs en eventuele bestaande tests (zelfs als het alleen happy-paths zijn). Dit houdt het model verankerd in wat de code daadwerkelijk doet, niet in wat het raadt.

Vraag vervolgens om een risico-tabel voordat je om enige testcode vraagt. Eis drie kolommen: grensgevallen (randen van geldige input), faalmodi (slechte input, ontbrekende data, timeouts) en invarianties (regels die altijd waar moeten zijn). Voeg één zin per rij toe: “waarom dit kan breken.” Een eenvoudige tabel onthult sneller gaten dan een stapel testbestanden.

Kies daarna de kleinste set tests waarbij elke test een uniek bug-vangend doel heeft. Als twee tests om dezelfde reden falen, houd de sterkere.

Een praktische selectieregel:

Houd tests die verschillende grenzen raken (min, max, leeg, off-by-one).
Houd tests die veilig gedrag bij falen bewijzen (duidelijke fout, geen gedeeltelijke write, geen crash).
Houd tests die een invariant asserten (ordering, totalen, idempotentie, geen duplicaten).
Knip tests die alleen herhalen “werkt met normale input.”

Eis tenslotte een korte uitleg per test: welke bug zou hij vangen als hij faalt. Als de uitleg vaag is ("valideert gedrag"), is de test waarschijnlijk low-signal.

Hoe invarianties in asserties te coderen

Een invariant is een regel die altijd waar moet blijven ongeacht welke geldige input je doorgeeft. Met invariant-based testing schrijf je eerst de regel in gewone taal en zet je die om in een assertie die luid kan falen.

Kies 1 of 2 invarianties die je echt beschermen tegen echte bugs. Goede invarianties gaan vaak over veiligheid (geen dataverlies), consistentie (zelfde input,zelfde output) of limieten (nooit caps overschrijden).

Zet een invariant om in een controle die je kunt bewijzen

Schrijf de invariant als een korte zin, bepaal dan welk bewijs je test kan observeren: return values, opgeslagen data, uitgezonden events of calls naar dependencies. Sterke asserties controleren zowel uitkomst als bijwerkingen, want veel bugs verstoppen zich in “het returned OK, maar schreef het verkeerde”.

Bijvoorbeeld, stel je hebt een functie die een coupon op een order toepast:

Invariant: het eindtotaal is nooit negatief.
Invariant: dezelfde coupon twee keer toepassen geeft niet twee keer korting.

Encodeer die nu als concrete asserties:

expect(result.total).toBeGreaterThanOrEqual(0)
expect(db.getOrder(orderId).discountCents).toBe(originalDiscountCents)

Vermijd vage asserts zoals “returns expected result”. Assert de specifieke regel (niet-negatief) en de specifieke bijwerking (korting eenmaal opgeslagen).

Voeg een contra-voorbeeldnotitie toe zodat de test scherp blijft

Voor elke invariant voeg je een korte notitie in de test toe over welke data het zou schenden. Dit voorkomt dat de test later verandert in een happy-path check.

Een simpel patroon dat standhoudt in de tijd:

Zet de invariant in de testnaam.
Assert de invariant op de output.
Assert de belangrijkste bijwerking (of het ontbreken daarvan).
Voeg één commentaar toe dat een schendend geval beschrijft (bijvoorbeeld, een enorme couponwaarde of dubbele toepassing).

Faalmodi: schrijf tests die veilig gedrag bewijzen

High-signal tests zijn vaak degene die bevestigen dat je code veilig faalt. Als een model alleen happy-path tests schrijft, leer je vrijwel niets over hoe de feature zich gedraagt wanneer inputs en dependencies rommelig worden.

Begin met bepalen wat “veilig” betekent voor deze feature. Returned het een getypeerde fout? Valt het terug op een default? Probeert het één keer opnieuw en stopt dan? Schrijf dat gewenste gedrag in één zin en laat de tests het bewijzen.

Als je Claude Code om failure-mode tests vraagt, houd het doel strikt: dek de manieren waarop het systeem kan breken en assert exact de respons die je wilt. Een nuttige lijn is: “Geef de voorkeur aan minder tests met sterkere asserties boven vele platte tests.”

Faalcategorieën die vaak de beste tests opleveren:

Slechte inputs: onjuiste formaten, ontbrekende verplichte velden, waarden buiten bereik
Dependency failures: timeouts, 500s, lege responses, corrupte payloads
Ordering issues: out-of-order events, duplicaten, gedeeltelijke writes
Concurrency: race-updates, idempotency checks
Recovery behavior: wanneer je een fout returned versus fallback of retry

Voorbeeld: je hebt een endpoint dat een gebruiker aanmaakt en een emailservice aanroept om een welkomstmail te sturen. Een low-value test checkt “returns 201.” Een high-signal failure test checkt dat als de emailservice time-out, je óf (a) de gebruiker toch aanmaakt en 201 returned met een "email_pending" flag, óf (b) een duidelijke 503 returned en geen gebruiker aanmaakt. Kies één gedrag en assert zowel de response als de bijwerkingen.

Test ook wat je niet lekt. Als validatie faalt, zorg dat er niets naar de database geschreven wordt. Als een dependency een corrupte payload terugstuurt, zorg dat je geen ongehandelde exception gooit of raw stacktraces returned.

Veelvoorkomende valkuilen die low-value tests creëren

Experimenteer zonder hoofdbranch te breken

Itereer op testsuites veilig met snapshots en snelle rollback wanneer er ruis ontstaat.

Draai snapshot

Low-value testsets ontstaan vaak wanneer het model beloond wordt voor volume. Als je Claude Code testgeneratie-prompt vraagt om “20 unit tests”, krijg je vaak kleine variaties die er uitgebreid uitzien maar niets nieuws vangen.

Veelvoorkomende valkuilen:

Look-alike tests: dezelfde “geldige input” test herhaald met andere strings of nummers.
Tests die de code spiegelen: private stappen of helper-calls asserten in plaats van observeerbaar gedrag.
Alles mocken: database, klok, netwerk en config tegelijk vervangen.
Zwakke asserties: alleen controleren op “geen fout”, “niet null” of “status 200”.
Vervuilde gedeelde staat: achtergelaten seeded data, gewijzigde globals of gecachte waarden.

Voorbeeld: stel een “create user” functie. Tien happy-path tests variëren de emailstring en missen nog steeds het belangrijke: duplicate emails weigeren, lege wachtwoorden afhandelen en garanderen dat geretourneerde user IDs uniek en stabiel zijn.

Beperkingen die helpen bij review:

Eis dat elke test het risico benoemt dat het dekt (grens, faalmodus of invariantie).
Vermijd implementatie-only checks tenzij ze observeerbaar gedrag veranderen.
Houd mocks minimaal en sta een klein aantal tests toe die het echte integratiepunt raken wanneer dat haalbaar is.
Eist sterke asserties: exacte outputs, staatwijzigingen en fouttypes/-berichten.
Voeg cleanupregels toe zodat tests niet afhankelijk zijn van volgorde.

Voorbeeld: één feature omzetten naar een kleine, sterke testset

Stel één feature: een kortingscode toepassen bij afrekenen.

Contract (klein en testbaar): gegeven een cart subtotal in cents en een optionele coupon, retourneer een final total in cents. Regels: percentagecoupons worden naar beneden afgerond naar de dichtstbijzijnde cent, vaste coupons trekken een vast bedrag af en totalen mogen nooit onder 0 komen. Een coupon kan ongeldig, verlopen of reeds gebruikt zijn.

Vraag niet “tests voor applyCoupon()”. Vraag om grensgevaltests, faalmodi en invarianties gekoppeld aan dit contract.

Grenzen om randgedrag af te dwingen

Kies inputs die wiskunde of validatie breken: een lege couponstring, subtotal = 0, subtotal net boven/onder een minimum spend, een vaste korting groter dan het subtotal en een percentage zoals 33% dat afronding veroorzaakt.

Faalmodi om veilig gedrag te bewijzen

Ga ervan uit dat coupon-lookup kan falen en dat staat fout kan zijn: de couponservice is down, de coupon is verlopen of de coupon is al ingewisseld door deze gebruiker. De test moet bewijzen wat er vervolgens gebeurt (coupon verworpen met een duidelijke fout, total onveranderd).

Een minimale, high-signal testset (5 tests) en wat elk test:

Weiger lege of alleen-witruimte code: vangt bugs die blank als geldig accepteren en slechte trimming.
Procentcoupon afronding (subtotal 101, 33%): vangt afrondingsfouten en off-by-one cents.
Vaste korting groter dan subtotal (subtotal 500, korting 1000): bewijst de invariant dat total nooit negatief wordt.
Minimum spend grens (subtotal 999 vs 1000): vangt verkeerde vergelijkingslogica (< vs <=).
Coupon lookup failure of timeout: bewijst veilige fallback (geen korting toegepast) en stabiele foutafhandeling.

Als deze slagen, heb je de gebruikelijke breekpunten gedekt zonder de suite te vullen met duplicerende happy-path tests.

Snelle checklist voor high-signal AI-gegeneerde tests

Plan voordat je genereert

Stel eerst een helder contract en testmatrix op, genereer daarna code met vertrouwen.

Gebruik planning

Voer een korte kwaliteitscheck uit voordat je accepteert wat het model genereert. Het doel is tests die elk een specifiek, waarschijnlijk risico beschermen.

Gebruik deze checklist als poort:

Grenzen per input: voor elk inputveld (strings, IDs, timestamps, flags) minstens één randgeval (leeg vs alleen-witruimte, max lengte, nul vs negatief, ontbrekende optionele velden, net voorbij de limiet).
Dependency failures: minstens één test waar een dependency zich misdraagt (DB-timeout, third-party API 500, verlopen auth token). Bewijs veilig gedrag (duidelijke fout, geen gedeeltelijke writes).
Invarianties met sterke asserties: kies 1–3 regels die altijd moeten gelden en assert ze direct. Vermijd vage asserts zoals “response is ok”.
Eén unieke bug per test: lees elke testtitel en vraag: “Welke exacte bug zou dit vangen?” Als twee tests hetzelfde beantwoorden, merge ze.
Verwijdertest: probeer een test te verwijderen. Als er niets betekenisvol verloren gaat (geen grens, geen faalmodus, geen invariant), verdiende hij zijn plaats niet.

Een snelle praktische truc na generatie: hernoem tests naar “should <gedrag> when <randvoorwaarde>” en “should not <slecht resultaat> when <falen>”. Als je ze niet netjes kunt hernoemen, zijn ze niet gefocust.

Als je bouwt met Koder.ai, past deze checklist ook goed bij snapshots en rollback: genereer tests, draai ze en rollback als de nieuwe set ruis toevoegt zonder de coverage te verbeteren.

Volgende stappen: maak dit herhaalbaar

Behandel je prompt als een herbruikbaar harnas, niet als éénmalig verzoek. Bewaar één blueprint prompt (die de grenzen, faalmodi en invarianties forceert) en hergebruik die voor elke nieuwe functie, endpoint of UI-flow.

Een eenvoudige gewoonte die resultaten snel verbetert: eis één zin per test die uitlegt welke bug hij zou vangen. Als die zin generiek is, is de test waarschijnlijk ruis.

Houd een levende lijst met domein-invarianties voor je product. Bewaar die niet alleen in je hoofd. Voeg eraan toe telkens wanneer je een echte bug vindt.

Een lichtgewicht workflow die je kunt herhalen:

Haal een klein contract: inputs, outputs, foutafhandeling en 3–5 invarianties.
Run de blueprint prompt en vraag grenzen, faalmodi, invarianties en korte rechtvaardigingen.
Implementeer alleen de top 5–10 tests die verschillende risico's dekken.
Refactor en run de prompt opnieuw om te zien welke nieuwe risico's verschijnen.
Snoei duplicaten en houd de tests die eerdere incidenten zouden hebben gevangen.

Als je apps via chat bouwt, run deze cyclus binnen Koder.ai (Koder.ai) zodat contract, plan en gegenereerde tests op één plek blijven. Wanneer een refactor gedrag onverwacht verandert, maken snapshots en rollback het makkelijker om te vergelijken en te itereren totdat je high-signal set stabiel blijft.

Veelgestelde vragen

Hoeveel unit tests zou ik per functie moeten genereren?

Standaard: mik op een klein aantal tests dat een echt bug zou hebben opgevangen.

Een handige bovengrens is 6–10 tests per unit (functie/module). Als je meer nodig hebt, doet je unit waarschijnlijk te veel of is je contract niet duidelijk.

Wat is er mis met het genereren van veel happy-path tests?

Happy-path tests bewijzen meestal alleen dat je voorbeeld nog werkt. Ze missen vaak wat er in productie misgaat.

High-signal tests richten zich op:

Grensgevallen (0/1/max, leeg/null, off-by-one)
Faalmodi (timeouts, ongeldige input, dependency errors)
Invarianties (regels die altijd moeten gelden, zoals “geen gedeeltelijke schrijftes bij fout”)

Wat moet ik opschrijven voordat ik een AI vraag tests te genereren?

Begin met een klein contract dat je in één adem kunt lezen:

Inputs: typen, toegestane bereiken, wat telt als leeg/ontbrekend
Outputs: vorm van succes en fout
Bijwerkingen: wat er geschreven/gewijzigd kan worden (DB, bestanden, netwerk)
“Mag nooit gebeuren”: crash, stille dataverlies, dubbele afschrijving, gedeeltelijke writes

Genereer vervolgens tests vanuit dat contract, niet alleen vanuit voorbeelden.

Welke grensgevallen zijn meestal de moeite waard om te testen?

Test eerst deze:

Min/max waarden (0, 1, max, max+1)
Leeg vs aanwezig ("", [], null/nil)
Off-by-one (n-1, n, n+1)
Formatteerranden (alleen-witruimte strings, voorloopnullen)
Tijdranden (net voor/na vervallen)

Hoe schrijf ik een goede “failure mode” test in plaats van een oppervlakkige?

Een goede failure-mode test bewijst twee dingen:

De functie geeft een duidelijke, verwachte fout terug (type/bericht/status).
Ze faalt veilig:

geen gedeeltelijke staatwijzigingen
geen interne details gelekt
geen onbedoelde retries of bijwerkingen

Als er een database-write bij betrokken is, controleer altijd wat er in de opslag gebeurde na de fout.

Hoe zet ik een invariant om in een testassertie?

Standaardbenadering: zet de invariant om in een assertie op observeerbare uitkomsten.

Voorbeelden:

“Total nooit negatief” → expect(total).toBeGreaterThanOrEqual(0)
“Bij fout geen staatwijziging” → controleer geen nieuwe rijen / geen flags omgeslagen
“Idempotent” → roep twee keer aan en assert dat de tweede call de staat niet verandert

Wanneer is een happy-path test toch de moeite waard?

Een happy-path test is het waard wanneer hij een invariant of een kritieke integratie beschermt.

Goede redenen om er één te houden:

Hij controleert een sleutelinvariant op normale input (bijv. afrondregels)
Hij vergrendelt een API-contract waar callers op vertrouwen
Hij beschermt tegen een regressie die in het verleden problemen gaf

Anders: ruil hem in voor grens-/faaltests die meer bugklassen vangen.

Wat moet ik het model laten outputten voordat ik testcode genereer?

Duw eerst op PHASE 1: alleen plan.

Eis dat het model oplevert:

maximaal 6–10 voorgestelde tests
voor elk: intentie, setup, input, verwacht resultaat, waarom het high-signal is
een kleine boundary-matrix
een failure-mode lijst
3–5 invarianties en hoe die te asserten

Pas na goedkeuring van het plan genereer je code. Dit voorkomt “20 look-alike tests”.

Hoe voorkom ik dat tests fragiel worden doordat ze te veel mocken?

Standaard: mock alleen de boundary die je niet beheert (DB/netwerk/klok), en laat de rest echt.

Om over-mocking te vermijden:

Mock geen interne helpers alleen om implementatie te spiegelen
Gebruik indien mogelijk een echte in-memory versie of een kleine fake met duidelijk gedrag
Mock de klok/toeval alleen als het de assertie beïnvloedt

Als een test bij een refactor breekt maar gedrag niet veranderde, is hij vaak te veel implementation-coupled of over-gemockt.

Hoe zie ik snel of een AI-gegeneerde test weinig waarde heeft?

Gebruik een simpele deletetest:

Als je de test verwijdert en geen enkele grens, geen faalmodus en geen invariant verliest, verdiende hij zijn plek niet.

Check ook op duplicaten:

Als twee tests voor dezelfde bug falen, houd de met de sterkere assertie.
Als asserties alleen “niet null” of “status 200” zijn, verscherp ze of verwijder de test.