Q: Jak działają Accept-Encoding i Content-Encoding w API?

Kompresja powinna stosować się do negocjacji HTTP: - Klient wysyła (np. ) - Serwer odpowiada obsługiwanym Jeśli klient nie wysyła , najbezpieczniej jest zwykle nie kompresować . Nigdy nie odsyłaj , którego klient nie zadeklarował, bo możesz uniemożliwić mu odczyt ciała.

Question 1

Kiedy warto włączyć kompresję odpowiedzi API?

Accepted Answer

Używaj kompresji, gdy odpowiedzi są bogate w tekst (JSON/GraphQL/XML/HTML), średnie do duże , a Twoi użytkownicy korzystają z wolnych/drogich sieci lub płacisz znaczące koszty egressu . Pomiń ją (lub ustaw wysoki próg) dla malutkich odpowiedzi , już skompresowanych mediów (JPEG/MP4/ZIP/PDF) oraz dla usług obciążonych CPU, gdzie dodatkowa praca na żądanie pogorszy p95/p99 latency.

Question 2

Dlaczego kompresja może spowolnić API, mimo że odpowiedzi są mniejsze?

Accepted Answer

Ponieważ wymienia ona szerokość pasma na CPU (i czasem pamięć) . Czas kompresji może opóźnić moment, kiedy serwer zaczyna wysyłać bajty (TTFB), a pod obciążeniem zwiększa kolejki—często pogarszając tail latency nawet gdy średnia latencja się poprawia. Najlepsze ustawienie to takie, które skraca czas end‑to‑end , nie tylko liczbę bajtów.

Question 3

Jak wybrać między ZSTD, Brotli i GZIP?

Accepted Answer

Praktyczny priorytet dla wielu API to: - najpierw (szybki, dobry stosunek) - potem (często najmniejsze dla tekstu, może kosztować więcej CPU) - potem (najszersza kompatybilność) Zawsze opieraj ostateczny wybór na klienta i miej bezpieczny fallback (zwykle lub ).

Question 4

Jakie poziomy kompresji są rozsądnymi domyślnymi ustawieniami dla dynamicznych odpowiedzi API?

Accepted Answer

Zacznij od niskich poziomów i mierz. - ZSTD: poziom 1–3 (lub do 3–5 ) dla większości dynamicznych JSON API - Brotli: poziom 1–4 dla kompresji w czasie rzeczywistym; poziomy 8–11 rezerwuj dla prekompresowanych/statycznych zasobów - GZIP: poziom 5–6 jako dobry domyślny Wyższe poziomy przynoszą malejące korzyści rozmiarowe, a mogą znacząco podnieść zużycie CPU i pogorszyć p95/p99.

Question 5

Czy powinienem kompresować każdą odpowiedź, czy tylko powyżej pewnego rozmiaru?

Accepted Answer

Użyj progu minimalnego rozmiaru, żeby nie marnować CPU na malutkie payloady.

Typowy punkt startowy: 1–2 KB
Jeśli masz ograniczone CPU lub bardzo „rozmowne” API: rozważ 4 KB

Dostrój per endpoint, porównując zaoszczędzone bajty vs dodany czas serwera i wpływ na p50/p95/p99.

Question 6

Jakie typy payloadów dobrze się kompresują (a które raczej nie)?

Accepted Answer

Skup się na treściach, które są uporządkowane i powtarzalne : - Świetne: JSON , GraphQL , XML , HTML , duże logi tekstowe - „Może”: Protobuf/MessagePack (często kompresowalne—zmierz) - Zwykle nie warto: JPEG/PNG/WebP , MP4 , ZIP/gz , wiele PDF Często sensowne jest włączenie kompresji tylko dla typów przypominających tekst i wyłączenie jej dla znanych, już skompresowanych formatów.

Question 7

Jak działają Accept-Encoding i Content-Encoding w API?

Accepted Answer

Kompresja powinna stosować się do negocjacji HTTP:

Klient wysyła Accept-Encoding (np. zstd, br, gzip)
Serwer odpowiada obsługiwanym Content-Encoding

Jeśli klient nie wysyła , najbezpieczniej jest zwykle . Nigdy nie odsyłaj , którego klient nie zadeklarował, bo możesz uniemożliwić mu odczyt ciała.

Question 8

Dlaczego Vary: Accept-Encoding jest ważny przy użyciu kompresji?

Accepted Answer

Dodaj nagłówek: - To zapobiega sytuacji, w której CDN/proxy zcache’uje np. i poda go klientowi, który tego nie zażądał lub nie potrafi go dekodować (albo dla ). Jeśli obsługujesz wiele kodowań, ten nagłówek jest konieczny dla poprawnego cache’owania.

Question 9

Jakie są najczęstsze błędy związane z kompresją w produkcji?

Accepted Answer

Typowe problemy produkcyjne to: - Podwójna kompresja (origin kompresuje, potem gateway/CDN kompresuje ponownie) - Niezgodność nagłówków i ciała ( mówi gzip, ale ciało nie jest gzip) - Zła negocjacja (ignorowanie ) - Interferencja proxy/CDN (usuwanie lub modyfikacja nagłówków) - Niepoprawny przy streamingu/kompresji Podczas debugowania przechwyć surowe nagłówki odpowiedzi i sprawdź dekompresję za pomocą znanego, poprawnego narzędzia/klienta.

Question 10

Jak bezpiecznie wprowadzić, monitorować i debugować kompresję API?

Accepted Answer

Wprowadź to jako funkcję wydajności: - Najpierw canary: mały wycinek ruchu, potem stopniowe zwiększanie (np. 1% → 5% → 25% → 50% → 100%) - Miej szybki rollback (feature flag lub konfiguracja bramy) - Monitoruj: - Wykorzystanie CPU/saturację - p50/p95/p99 latency i TTFB - bajty w sieci (skompresowane vs nieskompresowane) - błędy/timeouts i błędy dekodowania po stronie klienta Jeśli tail latency rośnie pod obciążeniem, obniż poziom, zwiększ próg lub przejdź na szybszy kodek (często ZSTD).

ZSTD vs Brotli vs GZIP: wybór kompresji dla API

Co to jest kompresja API (i kiedy się opłaca)

Co to daje API

Kiedy kompresja daje najwięcej

Kiedy daje najmniej

Osie decyzji używane w tym przewodniku

ZSTD vs Brotli vs GZIP: szybkie porównanie

Jednozdaniowe podsumowanie

Typowe mocne strony (i co to znaczy dla API)

Co naprawdę zmienia „poziom kompresji”

Prosta zasada

Współczynnik kompresji kontra latencja: podstawowy kompromis

Gdzie upływa czas

Pułapka tail‑latency pod obciążeniem

Mierz to jak funkcję wydajności

Koszty CPU i pamięci po stronie serwera i klienta

Gdzie spędza się CPU

Kwestie pamięci

Wpływ na autoscaling i limity kontenerów

Dlaczego szybkość dekompresji ma znaczenie dla klientów

ZSTD dla API: mocne strony, ograniczenia i dobre domyślne ustawienia

Do czego ZSTD nadaje się najlepiej

Sensowne poziomy kompresji dla API

Streaming i tryb słownika

Ograniczenia kompatybilności

Często zadawane pytania