Välja API-komprimering: ZSTD vs Brotli vs GZIP

Q: When is API response compression actually worth enabling?

Aktivera svarskomprimering när svaren är texttunga (JSON/GraphQL/XML/HTML), medelstora till stora och dina användare finns på långsamma eller dyra nätverk eller när du betalar betydande egresskostnader . Hoppa över komprimering (eller använd hög tröskel) för små svar , redan komprimerad media (JPEG/MP4/ZIP/PDF) och CPU-bundna tjänster där extra arbete per förfrågan försämrar p95/p99-latens.

Q: How should I choose between ZSTD, Brotli, and GZIP?

Ett praktiskt prioriteringsförslag för många API:er är: - först (snabbt, bra ratio) - sedan (ofta minst för text, kan kosta mer CPU) - sedan (bredast kompatibilitet) Basera slutgiltigt val på vad klienten annonserar i , och ha alltid en säker fallback (vanligtvis eller ).

Q: What compression levels are sensible defaults for dynamic API responses?

Börja lågt och mät. - ZSTD: nivå 1–3 (eller upp till 3–5 ) för de flesta dynamiska JSON-API:er - Brotli: nivå 1–4 för runtime-komprimering; reservera 8–11 för förkomprimerat/statisk innehåll - GZIP: nivå 5–6 som en bra standard Högre nivåer ger oftast avtagande marginalnytta i storleksminskning men kan spika CPU och försämra p95/p99.

Q: Should I compress every response, or only above a certain size?

Använd en minsta svarsstorlek så att du inte slösar CPU på pyttesmå payloads. - Typiskt startvärde: 1–2 KB - Om du är CPU-begränsad eller mycket chattig: överväg 4 KB Tuna per endpoint genom att jämföra sparade bytes vs tillagd server-tid och påverkan på p50/p95/p99.

Q: What payload types compress well (and which usually don’t)?

Fokusera på innehållstyper som är strukturerade och repetitiva : - Bra: JSON , GraphQL , XML , HTML , stora textloggar - “Kanske”: Protobuf/MessagePack (ofta fortfarande komprimerbara—mät) - Vanligtvis inte värt det: JPEG/PNG/WebP , MP4 , ZIP/gz , många PDF Ett vanligt tillvägagångssätt är att aktivera komprimering endast för textliknande och stänga av det för redan komprimerade format.

Q: How do Accept-Encoding and Content-Encoding work for APIs?

Komprimering ska följa HTTP-förhandling: - Klienten skickar (t.ex. ) - Servern svarar med en stödd Om klienten inte skickar är det säkraste ofta ingen komprimering . Returnera aldrig som klienten inte annonserade, annars riskerar du att klienten misslyckas med att läsa kroppen.

Q: Why is Vary: Accept-Encoding important when using compression?

Lägg till: - Detta förhindrar att CDN:er/proxies cachar (t.ex.) en -variant och felaktigt skickar den till en klient som inte bad om eller inte kan dekoda (eller ). Om du stödjer flera encodings är den här headern avgörande för korrekt caching.

Q: What are the most common compression bugs in production?

Vanliga fel i produktion inkluderar: - Dubbelkomprimering (origin komprimerar och gateway/CDN komprimerar igen) - Header/body mismatch ( säger gzip men kroppen är inte gzip) - Dålig förhandling (ignorerar ) - Proxy/CDN-interferens (tar bort eller ändrar headers) - Felaktig vid streaming/komprimering När du felsöker, fånga råa responsheaders och verifiera dekomprimering med ett känt bra verktyg/klient.

Q: How should I roll out and monitor API compression safely?

Rulla ut det som en prestandafunktion: - Canary eller liten andel först, sedan ramp (t.ex. 1% → 5% → 25% → 100%) - Ha en snabb rollback (feature flag eller gateway-konfig) - Mät: - CPU-användning/saturation - p50/p95/p99-latens och TTFB - wire bytes (komprimerat vs okomprimerat) - fel/tidsgränser och klientdekomprimeringsfel Om tail-latens ökar under belastning, sänk nivån, höj tröskeln eller byt till en snabbare codec (ofta ZSTD).

Logga in Kom igång

Välja API-komprimering: ZSTD vs Brotli vs GZIP | Koder.ai

Vad API-komprimering är (och när det är värt det)

API-svarskomprimering innebär att din server kodar svarskroppen (ofta JSON) till en mindre byte-ström innan den skickas över nätverket. Klienten (webbläsare, mobilapp, SDK eller en annan tjänst) dekomprimerar sedan den. Över HTTP förhandlas detta via headers som Accept-Encoding (vad klienten stöder) och Content-Encoding (vad servern valde).

Vad det gör för API:er

Komprimering ger i huvudsak tre fördelar:

Mindre bandbredd: Mindre svar använder färre bytes end-to-end.
Lägre latens på begränsade länkar: Färre bytes betyder ofta snabbare nedladdning på mobil, överbelastat Wi‑Fi och vid samtal mellan regioner.
Lägre egresskostnad: Om du betalar för utgående data kan mindre överföring direkt minska kostnader.

Tidskostnaden är enkel: komprimering sparar bandbredd men kräver CPU (komprimera/dekomprimera) och ibland minne (buffrar). Om det är värt det beror på din flaskhals.

När komprimering hjälper mest

Komprimering fungerar särskilt bra när svaren är:

Texttunga och repetitiva, som JSON, GraphQL-svar, HTML eller loggar.
Medelstora till stora, där tiotals eller hundratals kilobytes spelar roll.
Serverade över långsamma eller dyra nätverk, t.ex. mobil, internationella klienter eller cross-region-trafik.

Om du returnerar stora JSON-listor (kataloger, sökresultat, analysdata) är komprimering ofta en enkel och effektiv förbättring.

När det hjälper minst

Komprimering är ofta dålig användning av CPU när svaren är:

Små (till exempel några hundra bytes). Header- och CPU-överhuvud kan överväga vinsten.
Redan komprimerade (JPEG/PNG, MP4, ZIP, många PDF). Ofta ger återkomprimering liten eller ingen reduktion och kan till och med öka storleken.
CPU-bundna tjänster (hetta endpoints som redan kämpar med beräkning). Att lägga till komprimering kan öka tail-latensen.

Beslutsaxlarna du kommer använda i denna guide

När du väljer mellan ZSTD vs Brotli vs GZIP för API-komprimering handlar det praktiskt sett oftast om:

Storleksreduktion (kompressionsgrad)
Latens (serverns time-to-first-byte plus klientens dekodning)
Klientsupport (vad dina anropare och mellanhänder pålitligt hanterar)

Allt annat i den här artikeln handlar om att balansera dessa tre för ditt specifika API och trafikmönster.

ZSTD vs Brotli vs GZIP: Kort jämförelse

Alla tre minskar payload-storleken, men de optimerar för olika begränsningar—hastighet, kompressionsgrad och kompatibilitet.

Snabböversikt

ZSTD (Zstandard): Ofta bästa balans för API:er när du bryr dig om låg latens och förutsägbar CPU. Stark ratio utan att vara långsam.
Brotli: Vinner ofta på minsta antal bytes, särskilt för texttunga svar (JSON, HTML-liknande innehåll). Högre nivåer kan kosta mer CPU.
GZIP: "Fungerar överallt"-alternativet. Brett stödd och lätt att operera, men oftast långsammare och/eller större än moderna alternativ vid jämförbar CPU-budget.

Typiska styrkor (och vad det betyder för API:er)

ZSTD-hastighet: Bra när ditt API är känsligt för tail-latens eller dina servrar är CPU-bundna. Den kan komprimera tillräckligt snabbt för att overhead ofta är försumbar jämfört med nätverkstid—särskilt för medelstora till stora JSON-svar.

Brotli-kompressionsgrad: Bäst när bandbredd är huvudbegränsning (mobilklienter, dyr egress, CDN-leverans) och svaren är mest text. Mindre payloads kan vara värda det även om komprimeringen tar längre tid.

GZIP-kompatibilitet: Bäst när du behöver maximal klientstöd med minimal förhandlingsrisk (äldre SDK:er, inbäddade klienter, legacy-proxies). Det är en säker baseline även om det inte är topprestanda.

Vad "kompressionsnivå" egentligen ändrar

Kompressionsnivåer är förinställningar som byter CPU-tid mot mindre output:

Lägre nivåer: Snabbare komprimering, större payloads. Bra för realtids-API:er.
Högre nivåer: Mindre payloads, långsammare komprimering (och ibland mer minne). Bättre för stora, cachebara svar.

Dekomprimering är vanligtvis mycket billigare än komprimering för alla tre, men mycket höga nivåer kan fortfarande öka klientens CPU/batteripåverkan—viktigt för mobil.

Enkel tumregel

Standardval: Använd ZSTD för de flesta JSON/REST/GraphQL-API:er där latens spelar roll.
Byt till Brotli: När du optimerar för minsta antal bytes (texttunga svar, CDN-leverans, långsamma nät) och du har CPU att avvara.
Stanna kvar vid GZIP: När du behöver bred kompatibilitet eller din infrastruktur/verktyg inte stödjer nyare encodings.

Kompressionsgrad vs Latens: Kärnens trade-off

Komprimering säljs ofta som “mindre svar = snabbare API”. Det är ofta sant på långsamma eller dyra nätverk—men det är inte automatiskt. Om komprimering lägger till tillräckligt med server-CPU-tid kan du få långsammare svar trots färre bytes på tråden.

Var tiden går

Det hjälper att separera två kostnader:

Komprimeringstid (serversida): arbete som görs innan servern kan börja skicka bytes. Detta kan direkt lägga till svarstid (TTFB).
Dekomprimeringstid (klientsida): arbete efter att bytes mottagits. Vanligtvis billigare än komprimering, men kan påverka lågpresterande enheter.

En hög kompressionsgrad kan minska överföringstid, men om komprimering lägger till (säg) 15–30 ms CPU per svar kan du förlora mer än du tjänar—särskilt på snabba anslutningar.

Tail-latens-fällan under belastning

Under belastning kan komprimering skada p95/p99-latens mer än p50. När CPU-belastningen ökar köas förfrågningar. Köning förstärker små per-förfrågningskostnader till stora förseningar—medelvärden ser ok ut, men de långsammaste användarna drabbas.

Mät det som en prestandafunktion

Gissa inte. Kör A/B-test eller stegvis utrullning och jämför:

p50 och p95-latens (och helst p99)
CPU-användning och saturation på API-instanser
Svarsstorlekar och time-to-first-byte

Testa med realistiska trafikmönster och payloads. "Bästa" kompressionsnivån är den som minskar total tid, inte bara bytes.

CPU- och minneskostnader på server och klient

Keep rollback ready

Use snapshots and rollback to revert compression changes without a stressful incident.

Rollback

Komprimering är inte "gratis"—den flyttar arbete från nätverket till CPU och minne på båda sidor. I API:er syns det som längre hanteringstid per förfrågan, större minnesavtryck och ibland klient-sidiga fördröjningar.

Var CPU:n spenderas

Största CPU-delen läggs på att komprimera svar. Komprimering hittar mönster, bygger state/dictionarier och skriver kodad output.

Dekomprimering är vanligtvis billigare, men fortfarande relevant:

Servrar kan dekomprimera requests (sällsynt för JSON-API:er, vanligare för uppladdningar eller batchade händelser).
Klienter dekomprimerar svar på den kritiska vägen innan de parsar JSON.

Om ditt API redan är CPU-bundet (tunga app-servrar, dyr auth, komplexa frågor) kan hög kompressionsnivå öka tail-latens även om payloads blir mindre.

Minnesöverväganden

Komprimering kan öka minnesanvändning på flera sätt:

Buffrar: implementationer kan behöva in-/ut-buffrar; större payloads betyder större buffrar.
Full buffering vs streaming: streaming-komprimering kan börja skicka tidigare och hålla minnet lägre, medan full buffering ökar toppminnet per förfrågan.

I containeriserade miljöer kan högre toppminne leda till fler OOM-killar eller hårdare gränser som minskar densiteten.

Påverkan på autoscaling och container-gränser

Komprimering lägger till CPU-cykler per svar, vilket minskar genomströmning per instans. Det kan trigga autoscaling tidigare och höja kostnader. Ett vanligt mönster: bandbredd minskar, men CPU-kostnaden ökar—så rätt val beror på vilken resurs som är knapp hos er.

Varför dekomprimeringshastighet spelar roll för klienter

På mobil eller lågpresterande enheter konkurrerar dekomprimering med rendering, JavaScript-exekvering och batteriförbrukning. Ett format som sparar några KB men tar längre tid att dekomprimera kan upplevas som långsammare, särskilt när "time to usable data" är viktig.

ZSTD för API:er: styrkor, begränsningar och bra standardinställningar

Zstandard (ZSTD) är ett modernt komprimeringsformat designat för att ge en stark kompressionsgrad utan att sakta ner ditt API. För många JSON-tunga API:er är det en stark "default": tydligt mindre svar än GZIP vid liknande eller lägre latens, plus mycket snabb dekomprimering på klienter.

Vad ZSTD är bäst på

ZSTD är mest värdefullt när du bryr dig om end-to-end-tid, inte bara minsta antal bytes. Det tenderar att komprimera snabbt och dekomprimera extremt snabbt—nyttigt för API:er där varje millisekund CPU-tid konkurrerar med annan request-hantering.

Det presterar också bra över ett brett spektrum av payloadstorlekar: små till medelstora JSON ser ofta meningsfulla vinster, medan stora svar kan få ännu större förbättringar.

Förnuftiga kompressionsnivåer för API:er

För de flesta API:er, börja med låga nivåer (vanligtvis nivå 1–3). Dessa ger ofta bäst latens/storleks-avvägning.

Använd högre nivåer endast när:

Payloads är stora (hundratals KB till MB)
Bandbredd är dyr eller begränsad
Du har mätt att CPU inte är flaskhalsen

Ett pragmatiskt angreppssätt är en låg global default och sedan selektivt öka nivån för ett fåtal "stora svar"-endpoints.

Streaming och dictionary-läge

ZSTD stödjer streaming, vilket kan minska toppminne och börja skicka data tidigare för stora svar.

Dictionary-läge kan ge stor vinst för API:er som returnerar många liknande objekt (upprepade nycklar, stabila scheman). Det är mest effektivt när:

Payloads är relativt små men frekventa
Du kan hantera versionshanterade dictionary säkert

Kompatibilitetsbegränsningar att bevaka

Serversidesstöd är enkelt i många stackar, men klientkompatibilitet kan vara avgörande. Vissa HTTP-klienter, proxys och gateways annonserar eller accepterar inte Content-Encoding: zstd som standard.

Om du servar tredjepartskonsumenter, behåll en fallback (vanligtvis GZIP) och aktivera ZSTD endast när Accept-Encoding tydligt inkluderar det.

Brotli för API:er: när det vinner och när det inte gör det

Plan compression per route

Use Planning Mode to map endpoints and decide per-route compression defaults before you ship.

Use Planning

Brotli är designat för att pressa text ordentligt. På JSON, HTML och andra "ordiga" payloads slår det ofta GZIP i kompressionsgrad—särskilt på högre nivåer.

Där Brotli vinner

Texttunga svar är Brotli:s styrka. Om ditt API skickar stora JSON-dokument (kataloger, sökresultat, konfigurationspaket) kan Brotli minska bytes märkbart, vilket hjälper på långsamma nätverk och kan reducera egresskostnader.

Brotli är också bra när du kan komprimera en gång och servera många gånger (cachebara svar, versionsstyrda resurser). I de fallen kan höga nivåer av Brotli vara värda det eftersom CPU-kostnaden fördelas över många träffar.

Där Brotli underpresterar

För dynamiska API-svar (genereras på varje request) kräver Brotli:s bästa ratio ofta högre nivåer som kan vara CPU-krävande och lägga till latens. När du räknar in komprimeringstid kan den verkliga vinsten över ZSTD (eller en väl-tunad GZIP) bli mindre än väntat.

Det är också mindre lockande för payloads som inte komprimerar väl (redan komprimerat binärt data). I de fallen bränner du bara CPU.

Praktisk nivåvägledning

Runtime-komprimering: använd låga nivåer (vanligtvis 1–4) för att undvika CPU-spikar.
Förkomprimerat/statisk: högre nivåer (ofta 8–11) kan vara värda det när kostnaden amorteras över många requests.

Notering om klientsupport

Webbläsare stödjer generellt Brotli väl över HTTPS, vilket förklarar dess popularitet för webbtrafik. För icke-webbläsar-API-klienter (mobila SDK:er, IoT-enheter, äldre HTTP-stackar) kan stödet vara inkonsekvent—förhandla korrekt via Accept-Encoding och behåll en fallback (typiskt GZIP).

Vanliga frågor

When is API response compression actually worth enabling?

Aktivera svarskomprimering när svaren är texttunga (JSON/GraphQL/XML/HTML), medelstora till stora och dina användare finns på långsamma eller dyra nätverk eller när du betalar betydande egresskostnader. Hoppa över komprimering (eller använd hög tröskel) för små svar, redan komprimerad media (JPEG/MP4/ZIP/PDF) och CPU-bundna tjänster där extra arbete per förfrågan försämrar p95/p99-latens.

Why can compression make an API slower even though responses are smaller?

För att komprimering ska göra en förfrågan snabbare byter den bort bandbredd mot CPU (och ibland minne). Komprimeringstid kan fördröja när servern börjar skicka bytes (TTFB) och under belastning kan det förstärka köbildning—det gör ofta att tail-latens blir sämre även om medelvärdet förbättras. Det bästa inställningen är den som minskar sluttill-sluttid, inte bara payload-storleken.

How should I choose between ZSTD, Brotli, and GZIP?

Ett praktiskt prioriteringsförslag för många API:er är:

zstd först (snabbt, bra ratio)
sedan br (ofta minst för text, kan kosta mer CPU)
sedan gzip (bredast kompatibilitet)

Basera slutgiltigt val på vad klienten annonserar i , och ha alltid en säker fallback (vanligtvis eller ).

What compression levels are sensible defaults for dynamic API responses?

Börja lågt och mät.

ZSTD: nivå 1–3 (eller upp till ) för de flesta dynamiska JSON-API:er

Should I compress every response, or only above a certain size?

Använd en minsta svarsstorlek så att du inte slösar CPU på pyttesmå payloads.

Typiskt startvärde: 1–2 KB
Om du är CPU-begränsad eller mycket chattig: överväg 4 KB

Tuna per endpoint genom att jämföra sparade bytes vs tillagd server-tid och påverkan på p50/p95/p99.

What payload types compress well (and which usually don’t)?

Fokusera på innehållstyper som är strukturerade och repetitiva:

How do Accept-Encoding and Content-Encoding work for APIs?

Komprimering ska följa HTTP-förhandling:

Klienten skickar Accept-Encoding (t.ex. zstd, br, gzip)
Servern svarar med en stödd Content-Encoding

Om klienten inte skickar är det säkraste ofta . Returnera aldrig som klienten inte annonserade, annars riskerar du att klienten misslyckas med att läsa kroppen.

Why is Vary: Accept-Encoding important when using compression?

Lägg till:

Vary: Accept-Encoding

Detta förhindrar att CDN:er/proxies cachar (t.ex.) en gzip-variant och felaktigt skickar den till en klient som inte bad om eller inte kan dekoda gzip (eller zstd/br). Om du stödjer flera encodings är den här headern avgörande för korrekt caching.

What are the most common compression bugs in production?

Vanliga fel i produktion inkluderar:

How should I roll out and monitor API compression safely?

Rulla ut det som en prestandafunktion:

Canary eller liten andel först, sedan ramp (t.ex. 1% → 5% → 25% → 100%)

Accept-Encoding

gzip

identity

Accept-Encoding

Content-Encoding