Go + Postgres Performance-Tuning: Ein fokussierter API-Leitfaden

Q: Wie erkenne ich schnell, ob meine Go-API wegen Postgres oder wegen meinem Code langsam ist?

Beginne damit, DB-Wartezeit und App-Verarbeitungszeit zu trennen. - Wenn die Datenbank langsam ist, wartet der Handler größtenteils auf die Abfrage. Die Go-CPU bleibt oft normal, während Anfragen „in flight“ hängen bleiben. - Wenn die App langsam ist, sind die Abfragen schnell, aber Zeit geht beim Aufbau von Objekten, zusätzlichen pro-Zeile-Abfragen, beim Marshalen großer JSONs oder beim Logging verloren. Go-CPU und Speicher steigen oft mit der Größe der Antwort. Füge einfache Zeitmessungen für „Warten auf Verbindung“ und „Abfrageausführung“ hinzu, um zu sehen, welche Seite dominiert.

Q: Welche Metriken sollte ich zuerst erfassen, bevor ich etwas tune?

Nutze ein kleines, wiederholbares Basis-Messset: - p95-Latenz pro wichtiger Route (nicht Mittelwert) - Fehlerrate (5xx, Timeouts, Abbrüche) - DB-Zeit pro Request (Zeit, die auf Postgres gewartet wird) Wähle ein klares Ziel, z. B. „p95 unter 200 ms bei 50 gleichzeitigen Nutzern, Fehler < 0,5%“. Ändere immer nur eine Sache auf einmal und teste mit derselben Anfrage-Mischung erneut.

Q: Sollte ich das Postgres-Slow-Query-Logging einschalten und welche Schwelle ist praktisch?

Schalte Slow-Query-Logging mit einer niedrigen Schwelle in der Vor-Launch-Phase ein (z. B. 100–200 ms) und logge die komplette Statement, damit du sie in einen SQL-Client kopieren kannst. Kurz: - Gut für Tests vor dem Start. - In Produktion wird es schnell laut. - Kann Overhead verursachen, wenn zu viel geloggt wird. Wenn du die schlimmsten Kandidaten gefunden hast, auf Sampling umstellen oder die Schwelle erhöhen.

Q: Was sind gute Startwerte für Connection-Pools in Go mit Postgres?

Ein praktischer Default ist ein kleines Vielfaches der CPU-Kerne pro App-Instanz, oft 5–20 max open connections , ähnliche Anzahl als max idle und Verbindungs-Recycling alle 30–60 Minuten . Zwei typische Fehler: - Pool zu klein: Anfragen warten auf eine Verbindung, obwohl Postgres-Abfragen kurz sind. - Pool zu groß: Postgres wird mit vielen Sessions überlastet und die Latenz wird uneinheitlich. Bedenke, dass Pools über mehrere Instanzen multiplizieren (20 Verbindungen × 10 Instanzen = 200 Verbindungen).

Q: Wie bestätige ich, dass der Connection-Pool der Engpass ist (nicht SQL)?

Teile DB-Aufrufe in zwei Messpunkte: - Zeit zum Erhalten einer Verbindung (Pool-Wartezeit) - Zeit zur Ausführung der Abfrage (Postgres-Arbeit) Wenn die meiste Zeit Pool-Wartezeit ist, passe Pool-Größen, Timeouts und Instanzanzahl an. Wenn die meiste Zeit in der Abfrage liegt, fokussiere auf und Indexe. Stelle außerdem sicher, dass du Rows immer schnell schließt, damit Verbindungen in den Pool zurückkehren.

Q: Worauf sollte ich zuerst in EXPLAIN schauen, wenn ein Endpunkt langsam ist?

Führe auf dem genauen SQL aus, das deine API sendet, und achte auf: - Seq Scan auf großen Tabellen - Große Abweichung zwischen geschätzten und tatsächlichen Zeilen - Sort , das die meiste Zeit ausmacht (oft mit ) - Viele „Rows Removed by Filter“ - Hohe shared read blocks in BUFFERS (starke Leseaktivität) Behebe die größte rote Warnung zuerst; tunke nicht alles auf einmal.

Q: Wie wähle ich den richtigen Index für einen List-Endpunkt mit Filtern und Sortierung?

Indexe sollten zu dem passen, was der Endpunkt tatsächlich tut: Filter + Sortierung . Gute Vorgehensweise: - Erstelle einen kompositen Index für häufige + -Muster. - Klein halten (2 Spalten oft, 3 manchmal). - Die selektivste Spalte zuerst, dann die Sortierspalte. Beispiel: Wenn du nach filterst und nach sortierst, ist oft sehr hilfreich.

Q: Wann lohnt sich ein Partial-Index in Postgres?

Eine Partial-Index lohnt sich, wenn der Großteil des Traffics eine vorhersehbare Teilmenge der Zeilen abfragt. Beispiel: - Viele Reads betreffen nur - Wenige Abfragen für inaktive Zeilen Ein Partial-Index wie bleibt kleiner, passt eher in den Speicher und reduziert Schreib-Overhead gegenüber einem Index auf alle Zeilen. Bestätige mit , dass Postgres ihn für deine stark frequentierten Abfragen nutzt.

Q: Warum wird LIMIT/OFFSET mit der Zeit langsamer und was soll ich stattdessen verwenden?

wird auf tiefen Seiten langsamer, weil Postgres die übersprungenen Zeilen trotzdem durchgehen (und oft sortieren) muss. Seite 1 ist billig, Seite 500 kann sehr teuer werden. Bevorzuge Keyset-/Cursor-Paginierung : - Nutze eine stabile Sortierung plus eindeutigen Tie-Breaker (häufig ). - Halte über Requests hinweg identisch. - Kodier oder Ähnliches als Cursor. So bleibt die Kosten pro Seite annähernd konstant, auch wenn die Tabelle wächst.

Q: Meine DB-Abfragen sind schnell, aber Antworten sind trotzdem langsam — sollte ich JSON-Payloads kürzen?

Ja, in Listen-Antworten meist. Die schnellste Antwort ist die, die du nicht sendest. Praktische Hebel: - Selektiere nur die benötigten Spalten (vermeide ). - Biete oder an, damit Clients schwere Felder anfordern können. - Begrenze verschachtelte Arrays (z. B. nur die letzten 10 Einträge) und hole den Rest über einen eigenen Endpunkt. - Vermeide N+1-Abfragen; nutze Joins oder batch-basierte zweite Abfragen. Oft senkst du damit Go-CPU, Speicherbedarf und Tail-Latenz merklich.

Anmelden Loslegen

Go + Postgres Performance-Tuning: Ein fokussierter API-Leitfaden | Koder.ai

Wie sich „langsam“ bei Go-APIs auf Postgres anfühlt

KI-generierte APIs wirken in frühen Tests oft schnell. Du triffst einen Endpunkt ein paar Mal, die Datenmenge ist klein und Anfragen kommen einzeln. Dann kommt echter Traffic: gemischte Endpunkte, burstartige Last, kältere Caches und viel mehr Zeilen als gedacht. Derselbe Code kann plötzlich sporadisch langsam wirken, obwohl nichts kaputt gegangen ist.

Langsam zeigt sich meist so: Latenzspitzen (die meisten Anfragen sind ok, manche dauern 5x bis 50x länger), Timeouts (ein kleiner Prozentanteil schlägt fehl) oder ausgelastete CPU (Postgres-CPU durch Abfragen oder Go-CPU durch JSON-Verarbeitung, Goroutinen, Logging und Retries).

Ein typisches Szenario ist ein List-Endpunkt mit flexiblen Suchfiltern, der eine große JSON-Antwort zurückliefert. In einer Testdatenbank scannt er ein paar tausend Zeilen und ist schnell fertig. In Produktion scannt er ein paar Millionen Zeilen, sortiert sie und wendet erst danach ein LIMIT an. Die API „funktioniert“ noch, aber die p95-Latenz explodiert und einige Anfragen laufen in Spitzenzeiten in Timeouts.

Um Datenbank- vs. App-Slowdowns zu trennen, halte das mentale Modell einfach.

Wenn die Datenbank der Flaschenhals ist, verbringt dein Go-Handler die meiste Zeit damit, auf die Abfrage zu warten. Du siehst möglicherweise viele Anfragen „in flight“, während die Go-CPU normal aussieht.

Wenn die App der Engpass ist, endet die Abfrage schnell, aber Zeit geht nach der Abfrage verloren: große Antwortobjekte bauen, JSON marshalen, zusätzliche Abfragen pro Zeile oder zu viel Arbeit pro Request. Go-CPU und Speicher steigen, und die Latenz wächst mit der Antwortgröße.

„Gut genug“ Performance vor dem Start ist nicht Perfektion. Für viele CRUD-Endpunkte strebe eine stabile p95-Latenz an (nicht nur den Durchschnitt), vorhersehbares Verhalten bei Bursts und keine Timeouts bei deinem erwarteten Peak. Das Ziel ist einfach: keine überraschenden langsamen Anfragen, wenn Daten und Traffic wachsen, und klare Signale, wenn etwas driftet.

Erst die Basis messen: die wenigen Zahlen, die zählen

Bevor du etwas tunest, entscheide, was „gut“ für deine API bedeutet. Ohne Basislinie ist es leicht, Stunden mit Einstellungsänderungen zu verbringen und nicht zu wissen, ob du verbessert oder nur den Bottleneck verschoben hast.

Drei Zahlen erzählen meist die meiste Geschichte:

p95-Request-Latenz (nicht der Durchschnitt)
Fehlerquote (HTTP 5xx, Timeouts, abgebrochene Requests)
DB-Zeit pro Request (wie lange jede Anfrage auf Postgres wartet)

p95 ist die Kennzahl für „schlechte Tage“. Wenn p95 hoch ist, der Durchschnitt aber ok, macht eine kleine Menge von Anfragen zu viel Arbeit, blockiert auf Locks oder triggert langsame Pläne.

Mach langsame Abfragen früh sichtbar. In Postgres aktiviere in der Vor-Launch-Phase Slow-Query-Logging mit einer niedrigen Schwelle (z. B. 100–200 ms) und logge das komplette Statement, damit du es in einen SQL-Client kopieren kannst. Das ist temporär — im Produktivbetrieb wird das Logging schnell laut.

Teste als Nächstes mit realistischen Requests, nicht nur einer einzelnen „hello world“-Route. Eine kleine Auswahl reicht, wenn sie dem entspricht, was Nutzer tatsächlich tun: ein List-Call mit Filtern und Sortierung, eine Detailseite mit ein paar Joins, ein Create/Update mit Validierung und eine Suchabfrage mit partiellen Treffern.

Wenn du Endpunkte aus einer Spezifikation generierst (z. B. mit einem Werkzeug wie Koder.ai), führe dieselben Handvoll Requests wiederholt mit konsistenten Eingaben aus. Das macht Änderungen wie Indexe, Paginierungsanpassungen und Query-Umformulierungen leichter messbar.

Wähle schließlich ein Ziel, das du laut sagen kannst. Beispiel: „Die meisten Requests bleiben unter 200 ms p95 bei 50 gleichzeitigen Nutzern und Fehler < 0,5%.“ Die genauen Zahlen hängen vom Produkt ab, aber ein klares Ziel verhindert endloses Herumtüfteln.

Connection-Pooling, das Postgres stabil hält

Ein Connection-Pool hält eine begrenzte Anzahl offener DB-Verbindungen und reused sie. Ohne Pool öffnet jede Anfrage vielleicht eine neue Verbindung, und Postgres verschwendet Zeit und Speicher mit Session-Management anstelle des Ausführens von Abfragen.

Das Ziel ist, Postgres sinnvoll beschäftigt zu halten, nicht Context-Switching zwischen zu vielen Verbindungen. Das ist oft der erste spürbare Gewinn, besonders bei KI-generierten APIs, die leise zu chatty Endpunkten werden können.

Einfache Startwerte

In Go stellst du üblicherweise max open connections, max idle connections und die Verbindungslifetime ein. Ein sicherer Startwert für viele kleine APIs ist ein kleines Vielfaches deiner CPU-Kerne (oft 5 bis 20 Verbindungen insgesamt), mit einer ähnlichen Anzahl an Idle-Verbindungen und periodischem Recycling (z. B. alle 30–60 Minuten).

Wenn du mehrere API-Instanzen betreibst, denk daran, dass sich der Pool multipliziert. Ein Pool von 20 Verbindungen über 10 Instanzen sind 200 Verbindungen, die auf Postgres treffen — so rennen Teams unerwartet in Verbindungsgrenzen.

Woran du erkennst, ob der Pool das Problem ist

Pool-Probleme fühlen sich anders an als langsames SQL.

Wenn der Pool zu klein ist, warten Anfragen, bevor sie überhaupt Postgres erreichen. Latenzspitzen tauchen auf, aber DB-CPU und Abfragezeiten können normal aussehen.

Wenn der Pool zu groß ist, sieht Postgres überlastet aus: viele aktive Sessions, Speicherdruck und ungleichmäßige Latenzen über Endpunkte.

Eine schnelle Methode, die beiden zu trennen, ist, deine DB-Calls in zwei Teile zu messen: Zeit, die auf eine Verbindung gewartet wird vs. Zeit, die die Abfrage ausführt. Wenn die meiste Zeit „warten“ ist, ist der Pool der Engpass. Wenn die meiste Zeit „in der Abfrage“ ist, konzentriere dich auf SQL und Indexe.

Nützliche schnelle Checks:

Logge Pool-Stats (open, in-use, idle) und achte auf in-use, das am Max klebt.
Füge ein Timeout beim Erwerben einer Verbindung hinzu, sodass Wartezeiten in Staging schnell fehlschlagen.
Überwache aktive Verbindungen in Postgres und wie nah du an max_connections bist.
Bestätige, dass jede Anfrage Rows schließt und Verbindungen prompt freigibt.
Lasttest mit derselben Anzahl App-Instanzen, die du betreiben willst.

pgxpool vs database/sql

Wenn du pgxpool verwendest, bekommst du einen Postgres-fokussierten Pool mit klaren Stats und guten Defaults für Postgres-Verhalten. database/sql bietet eine standardisierte Schnittstelle, die über Datenbanken hinweg funktioniert, aber du musst Pool-Settings und Treiberverhalten explizit setzen.

Eine praktische Regel: Wenn du komplett auf Postgres setzt und direkte Kontrolle willst, ist pgxpool oft einfacher. Wenn du Bibliotheken verwendest, die database/sql erwarten, bleib dabei, setze den Pool explizit und messe Wartezeiten.

Beispiel: Ein Endpunkt, der Bestellungen listet, dauert 20 ms, springt aber bei 100 gleichzeitigen Nutzern auf 2 s. Wenn die Logs 1.9 s Wartezeit auf eine Verbindung zeigen, hilft Query-Tuning nicht, bis Pool und totale Postgres-Verbindungen richtig dimensioniert sind.

Query-Plan lesen: schnelle Orientierung mit EXPLAIN

Wenn ein Endpunkt langsam wirkt, schau, was Postgres tatsächlich tut. Ein schneller Blick auf EXPLAIN zeigt oft innerhalb von Minuten die Lösung.

Führe das auf dem genauen SQL aus, das deine API sendet:

EXPLAIN (ANALYZE, BUFFERS)
SELECT id, status, created_at
FROM orders
WHERE user_id = $1 AND status = $2
ORDER BY created_at DESC
LIMIT 50;

Ein paar Zeilen sind am wichtigsten. Schau dir den obersten Node an (was Postgres gewählt hat) und die Totals am Ende (wie lange es gedauert hat). Vergleiche dann geschätzte vs. tatsächliche Zeilen. Große Abweichungen bedeuten meist, dass der Planner falsch geraten hat.

Was die wichtigsten Zeilen meist bedeuten

Wenn du Index Scan oder Index Only Scan siehst, benutzt Postgres einen Index — meist gut. Bitmap Heap Scan kann bei mittelgroßen Treffern in Ordnung sein. Seq Scan bedeutet, dass die ganze Tabelle gelesen wurde; das ist nur ok, wenn die Tabelle klein ist oder fast jede Zeile passt.

Häufige Warnsignale:

Seq Scan auf einer großen Tabelle
Geschätzte Zeilen vs. tatsächliche Zeilen weit auseinander (z. B. 10 geschätzt vs. 10.000 tatsächlich)
Sort, das den Großteil der Zeit benötigt (oft zusammen mit ORDER BY)
„Filter:“ entfernt viele Zeilen nach einem Scan
Viele shared read blocks in BUFFERS (viel Daten gelesen)

Warum Pläne falsch laufen (und einfache Fixes)

Langsame Pläne kommen meist von einigen Mustern:

Fehlender Index für dein WHERE + ORDER BY-Muster (z. B. (user_id, status, created_at))
Nicht passende Typen (z. B. ein UUID-Feld gegen einen Text-Parameter vergleichen), wodurch Indexnutzung verhindert wird
Funktionen in WHERE (z. B. WHERE lower(email) = $1), die Scans erzwingen, sofern du nicht einen passenden Ausdrucksindex hinzufügst

Wenn der Plan komisch aussieht und Schätzungen weit daneben liegen, sind Statistiken oft veraltet. Führe ANALYZE aus (oder lass autovacuum aufholen), damit Postgres aktuelle Zeilen- und Verteilungsdaten lernt. Das ist wichtig nach großen Imports oder wenn neue Endpunkte schnell viele Writes erzeugen.

Indexe für die Abfragen bauen, die du wirklich ausführst

Performance vor dem Bauen planen

Nutze den Planungsmodus, um Filter, Sortierung und Paginierung zu entscheiden, bevor der Code generiert wird.

Planer öffnen

Indexe helfen nur, wenn sie zu deinen Abfragen passen. Wenn du sie aus Vermutungen erstellst, bekommst du langsamere Writes, mehr Speicherbedarf und kaum Speedups.

Ein praktischer Denkansatz: Ein Index ist eine Abkürzung für eine spezifische Frage. Wenn deine API eine andere Frage stellt, ignoriert Postgres die Abkürzung.

Indexe um Filter + Sort bauen

Wenn ein Endpunkt nach account_id filtert und nach created_at DESC sortiert, ist ein einzelner komposit-er Index meist besser als zwei separate Indexe. Er hilft Postgres, die richtigen Zeilen zu finden und in richtiger Reihenfolge zurückzugeben, mit weniger Arbeit.

Faustregeln, die meist halten:

Indexiere die Spalten, auf denen du am meisten filterst, und füge dann die Spalte hinzu, nach der du sortierst.
Halte composite Indexe klein. Zwei Spalten sind üblich; drei manchmal ok; mehr ist meist ein Warnsignal.
Setze die selektivste Filterspalte zuerst (die, die am stärksten einschränkt).
Vermeide separate Indexe, die vollständig von einem besseren Composite-Index abgedeckt sind.
Ein gut gewählter Index ist besser als mehrere „vielleicht nützliche“.

Beispiel: Wenn deine API GET /orders?status=paid hat und immer die neuesten anzeigt, passt ein Index wie (status, created_at DESC) gut. Wenn die meisten Abfragen auch nach Kunde filtern, kann (customer_id, status, created_at) besser sein — aber nur, wenn das wirklich so in Produktion läuft.

Partial-Indexe für häufige Filter

Wenn der Großteil des Traffics eine enge Teilmenge der Zeilen trifft, kann ein Partial-Index günstiger und schneller sein. Wenn deine App z. B. meist aktive Datensätze liest, indexiere nur WHERE active = true, damit der Index kleiner ist und eher im Speicher bleibt.

Zur Bestätigung, dass ein Index hilft:

Führe EXPLAIN (oder EXPLAIN ANALYZE in einer sicheren Umgebung) und schaue, ob ein passender Index-Scan verwendet wird.
Vergleiche Zeit und gelesene Zeilen mit und ohne Index.
Achte auf „Rows Removed by Filter“, das hoch bleibt — das bedeutet oft, dass der Index nicht zu deinem Filter passt.

Entferne ungenutzte Indexe sorgfältig. Prüfe Nutzungsstatistiken (z. B. ob ein Index jemals gescannt wurde). Droppe einen nach dem anderen in Zeiten mit niedrigem Risiko und habe einen Rollback-Plan. Unbenutzte Indexe sind nicht harmlos — sie verlangsamen Inserts und Updates bei jedem Write.

Paginierungsmuster, die nicht langsamer werden

Paginierung ist oft der Punkt, an dem eine schnelle API langsam wirkt, obwohl die DB gesund ist. Behandle Paginierung als Abfragedesignproblem, nicht als UI-Detail.

Warum LIMIT/OFFSET langsamer wird

LIMIT/OFFSET wirkt einfach, aber tiefere Seiten sind meist teurer. Postgres muss die übersprungenen Zeilen oft durchlaufen (und sortieren). Seite 1 kann ein paar Dutzend Zeilen berühren. Seite 500 kann zehntausende Zeilen scannen und verwerfen, nur um 20 Ergebnisse zurückzugeben.

Es erzeugt zudem instabile Ergebnisse, wenn zwischen Requests Zeilen eingefügt oder gelöscht werden. Nutzer sehen Duplikate oder fehlende Items, weil die Bedeutung von „Zeile 10.000“ sich ändert.

Keyset-Paginierung (Cursor) mit „last seen“-Beispiel

Keyset-Paginierung fragt anders: „Gib mir die nächsten 20 Zeilen nach der letzten Zeile, die ich gesehen habe.“ So arbeitet die DB an einer kleinen, konsistenten Teilmenge.

Eine einfache Version nutzt eine wachsende id:

SELECT id, created_at, title
FROM posts
WHERE id > $1
ORDER BY id
LIMIT 20;

Deine API liefert einen next_cursor, der der letzten id auf der Seite entspricht. Der nächste Request nutzt diesen Wert als $1.

Bei zeitbasierter Sortierung nutze eine stabile Reihenfolge und breche Gleichstände auf. created_at alleine reicht nicht, wenn zwei Zeilen denselben Timestamp haben. Verwende einen zusammengesetzten Cursor:

WHERE (created_at, id) < ($1, $2)
ORDER BY created_at DESC, id DESC
LIMIT 20;

Ein paar Regeln verhindern Duplikate und fehlende Zeilen:

Immer einen eindeutigen Tie-Breaker in ORDER BY aufnehmen (meist id).
Sortierreihenfolge zwischen Requests identisch halten.
Den Cursor für Clients opak machen (encode created_at und id zusammen).
Wenn Nutzer filtern können, dieselben Filter auf jeder Seite anwenden.
Bevorzuge unveränderliche Sort-Felder (Erstellungszeit) gegenüber veränderlichen (Status, Score), wenn möglich.

JSON-Formen: schnellere Antworten mit kleineren Payloads

Bereitstellen und Domain nutzen

Hoste deine App und verbinde eine eigene Domain, wenn du bereit bist, sie zu teilen.

App veröffentlichen

Ein überraschend häufiger Grund, dass eine API langsam wirkt, ist nicht die Datenbank, sondern die Antwort. Große JSONs brauchen länger zum Bauen, länger zum Senden und länger für Clients zum Parsen. Der schnellste Gewinn ist oft: weniger zurückgeben.

Fange bei deinem SELECT an. Wenn ein Endpunkt nur id, name und status braucht, fordere genau diese Spalten an. SELECT * wird im Laufe der Zeit unauffällig schwerer, wenn Tabellen lange Texte, JSON-Blobs und Audit-Spalten bekommen.

Ein weiterer häufiger Slowdown ist N+1 beim Antwortenaufbau: Du holst eine Liste von 50 Items und führst dann 50 weitere Abfragen aus, um related data anzuhängen. Das mag Tests bestehen, bricht aber unter echtem Traffic zusammen. Bevorzuge eine einzige Abfrage, die alles zurückgibt (vorsichtige Joins), oder zwei Abfragen, wobei die zweite nach IDs batcht.

Ein paar Wege, Payloads kleiner zu halten ohne Clients zu brechen:

Nutze ein include=-Flag (oder fields=-Maske), damit Listenantworten schlank bleiben und Details Extras opt-in sind.
Begrenze verschachtelte Arrays (z. B. nur die neuesten 10 Events) und biete einen separaten Endpunkt für die vollständige Historie an.
Gib keine rohen internen JSON-Spalten zurück, wenn Clients nur ein paar Keys brauchen.
Nutze kurze Codes statt sich wiederholender langer Labels.

JSON in Postgres oder in Go bauen?

Beides kann schnell sein. Wähle nach dem, was du optimieren willst.

Postgres-JSON-Funktionen (jsonb_build_object, json_agg) sind nützlich, wenn du weniger Roundtrips und vorhersehbare Shapes aus einer Abfrage willst. Das Shapen in Go ist nützlich, wenn du bedingte Logik brauchst, Structs wiederverwenden willst oder das SQL leichter wartbar halten willst. Wenn dein JSON-bildendes SQL schwer lesbar wird, wird es auch schwer zu tunen.

Eine gute Regel: Lass Postgres filtern, sortieren und aggregieren. Lass Go die finale Präsentation übernehmen.

Wenn du APIs schnell generierst (z. B. mit Koder.ai), hilft frühes Einführen von include-Flags, Endpunkte zu vermeiden, die mit der Zeit aufblähen. Es gibt außerdem einen sicheren Weg, Felder hinzuzufügen, ohne jede Antwort schwerer zu machen.

Ein Schritt-für-Schritt-Tuninglauf vor den ersten Nutzern

Du brauchst kein riesiges Testlabor, um die meisten Performance-Probleme zu finden. Ein kurzer, wiederholbarer Durchlauf bringt die Probleme zutage, die nach Traffic zu Ausfällen führen, vor allem wenn der Startpunkt generierter Code ist.

Bevor du etwas änderst, schreib eine kleine Basislinie auf:

p95 und p99 Latenz für deine meistgenutzten Endpunkte
Fehlerquote und Timeouts
Datenbank-CPU und aktive Verbindungen
Die fünf langsamsten Queries nach Gesamtzeit (nicht nur die einzelne Schlimmste)

Der Tuning-Durchlauf

Fang klein an, ändere eine Sache auf einmal und teste nach jeder Änderung erneut.

Führe einen 10–15-minütigen Lasttest durch, der realistische Nutzung abbildet. Treffe dieselben Endpunkte, die deine ersten Nutzer nutzen werden (Login, Listen, Suche, Create). Sortiere dann Routen nach p95-Latenz und Gesamtzeit.
Prüfe Verbindungsdruck, bevor du SQL tustest. Ein Pool, der zu groß ist, überlastet Postgres. Einer, der zu klein ist, erzeugt lange Wartezeiten. Achte auf steigende Wartezeiten zum Erhalten einer Verbindung und auf Verbindungsspitzen. Passe Pool- und Idle-Limits zuerst an und wiederhole den Test.
EXPLAIN die Top-slow Queries und behebe das größte Warnsignal. Übliche Ursachen sind Full Table Scans auf großen Tabellen, Sorts auf großen Ergebnismengen und Joins, die Zeilenzahlen explodieren lassen. Mach die schlimmste Query langweilig.
Füge oder passe einen Index an und teste erneut. Indexe helfen, wenn sie zu deinem WHERE und ORDER BY passen. Füge nicht fünf auf einmal hinzu. Wenn dein langsamer Endpunkt „Bestellungen nach user_id sortiert nach created_at“ ist, kann ein Composite-Index auf (user_id, created_at) den Unterschied zwischen sofort und quälend machen.
Straffe Antworten und Paginierung und teste nochmal. Wenn ein Endpunkt 50 Reihen mit großen JSON-Blobs zurückgibt, zahlen DB, Netzwerk und Client drauf. Gib nur die Felder zurück, die die UI braucht, und bevorzuge Paginierung, die nicht langsamer wird, wenn Tabellen wachsen.

Führe ein einfaches Änderungsprotokoll: was geändert wurde, warum und wie sich p95 bewegt hat. Wenn eine Änderung deine Basislinie nicht verbessert, revertiere sie und mach weiter.

Häufige Fehler und Fallen

Ohne Angst experimentieren

Probiere einen Index- oder Abfragewechsel, messe p95 und mache schnell rückgängig, falls es andere Routen verschlechtert.

Snapshots nutzen

Die meisten Performance-Probleme in Go-APIs mit Postgres sind selbstverschuldet. Die gute Nachricht: Ein paar Checks fangen viele davon ab, bevor echter Traffic kommt.

Eine klassische Falle ist, Pool-Größe wie einen Geschwindigkeitsregler zu behandeln. Sie „so hoch wie möglich“ zu stellen, macht oft alles langsamer. Postgres verbringt mehr Zeit mit Session-Management, Speicher und Locks, und deine App beginnt in Wellen zu timeouten. Ein kleinerer, stabiler Pool mit vorhersehbarer Parallelität gewinnt meist.

Ein anderer Fehler ist „alles indexieren“. Zusätzliche Indexe helfen Reads, verlangsamen aber Writes und können Query-Pläne überraschend ändern. Wenn deine API häufig insertet oder updated, fügt jeder zusätzliche Index Arbeit hinzu. Messen vor und nach und prüfe Pläne nach dem Hinzufügen.

Paginierungs-Schulden schleichen sich leise ein. Offset-Paginierung sieht früh gut aus, aber p95 steigt über Zeit, weil DB mehr Zeilen überspringen muss.

Die Größe von JSON-Payloads ist eine weitere versteckte Steuer. Kompression spart Bandbreite, beseitigt aber nicht die Kosten für Erstellen, Allozieren und Parsen großer Objekte. Kürze Felder, vermeide tiefe Verschachtelung und gib nur, was der Bildschirm braucht.

Wenn du nur den Durchschnitt beobachtest, verpasst du, wo echte Nutzer leiden. p95 (und manchmal p99) ist der Punkt, an dem Pool-Sättigung, Lock-Waits und langsame Pläne zuerst sichtbar werden.

Ein schneller Pre-Launch-Check:

Beobachte Pool-Wartezeiten und Postgres-Verbindungszahlen während eines kleinen Lasttests.
Vergleiche Durchschnitt vs. p95 für denselben Endpunkt.
Verifiziere, dass Paginierung nicht schlechter wird, wenn die Tabelle 10× größer ist.
Prüfe Antwortgrößen für List-Endpunkte (Bytes zählen).
Führe EXPLAIN nach dem Hinzufügen von Indexen oder Ändern von Filtern erneut aus.

Schnelle Checkliste und nächste Schritte vor Launch

Vor echten Nutzern willst du Evidenz, dass deine API unter Last vorhersehbar bleibt. Das Ziel sind nicht perfekte Zahlen, sondern das Aufspüren der wenigen Probleme, die Timeouts, Spitzen oder eine Datenbank, die keine neue Arbeit mehr annimmt, verursachen.

Führe Checks in einer Staging-Umgebung durch, die Produktion ähnelt (ähnliche DB-Größe, gleiche Indexe, gleiche Pool-Settings): Messe p95 pro Schlüssel-Endpoint unter Last, erfasse die Top-slow Queries nach Gesamtzeit, beobachte Pool-Wartezeit, EXPLAIN (ANALYZE, BUFFERS) die schlimmste Query, um zu bestätigen, dass der erwartete Index genutzt wird, und sanity-checke Payload-Größen auf den belebtesten Routen.

Dann mache einen Worst-Case-Run, der zeigt, wie Produkte brechen: Fordere eine tiefe Seite an, wende den breitesten Filter an und teste das mit einem Cold-Start (API neu starten und dieselbe Anfrage als erstes treffen). Wenn tiefe Paginierung mit jeder Seite langsamer wird, wechsle vor dem Launch zu Cursor-basierter Paginierung.

Schreib deine Defaults auf, damit das Team später konsistente Entscheidungen trifft: Pool-Limits und Timeouts, Paginierungsregeln (max page size, ob Offset erlaubt ist, Cursor-Format), Query-Regeln (nur benötigte Spalten auswählen, SELECT * vermeiden, teure Filter begrenzen) und Logging-Regeln (Slow-Query-Schwelle, wie lange Samples aufbewahren, wie Endpunkte zu labeln sind).

Wenn du mit Koder.ai Go + Postgres-Services erzeugst und exportierst, hilft ein kurzer Planungsdurchlauf vor Deployment, Filter, Paginierung und Antwortformen bewusst zu gestalten. Sobald du Indexe und Query-Shapes optimierst, machen Snapshots und Rollback das Zurücknehmen einer „Verbesserung“, die einen Endpunkt besser, andere aber schlechter macht, leichter. Wenn du einen zentralen Ort suchst, um diesen Workflow zu iterieren, ist Koder.ai auf koder.ai darauf ausgelegt, Services per Chat zu generieren und zu verfeinern, und den Source zu exportieren, wenn du bereit bist.

FAQ

Wie erkenne ich schnell, ob meine Go-API wegen Postgres oder wegen meinem Code langsam ist?

Beginne damit, DB-Wartezeit und App-Verarbeitungszeit zu trennen.

Wenn die Datenbank langsam ist, wartet der Handler größtenteils auf die Abfrage. Die Go-CPU bleibt oft normal, während Anfragen „in flight“ hängen bleiben.
Wenn die App langsam ist, sind die Abfragen schnell, aber Zeit geht beim Aufbau von Objekten, zusätzlichen pro-Zeile-Abfragen, beim Marshalen großer JSONs oder beim Logging verloren. Go-CPU und Speicher steigen oft mit der Größe der Antwort.

Füge einfache Zeitmessungen für „Warten auf Verbindung“ und „Abfrageausführung“ hinzu, um zu sehen, welche Seite dominiert.

Welche Metriken sollte ich zuerst erfassen, bevor ich etwas tune?

Nutze ein kleines, wiederholbares Basis-Messset:

p95-Latenz pro wichtiger Route (nicht Mittelwert)
Fehlerrate (5xx, Timeouts, Abbrüche)
DB-Zeit pro Request (Zeit, die auf Postgres gewartet wird)

Wähle ein klares Ziel, z. B. „p95 unter 200 ms bei 50 gleichzeitigen Nutzern, Fehler < 0,5%“. Ändere immer nur eine Sache auf einmal und teste mit derselben Anfrage-Mischung erneut.

Sollte ich das Postgres-Slow-Query-Logging einschalten und welche Schwelle ist praktisch?

Schalte Slow-Query-Logging mit einer niedrigen Schwelle in der Vor-Launch-Phase ein (z. B. 100–200 ms) und logge die komplette Statement, damit du sie in einen SQL-Client kopieren kannst.

Kurz:

Gut für Tests vor dem Start.
In Produktion wird es schnell laut.
Kann Overhead verursachen, wenn zu viel geloggt wird.

Wenn du die schlimmsten Kandidaten gefunden hast, auf Sampling umstellen oder die Schwelle erhöhen.

Was sind gute Startwerte für Connection-Pools in Go mit Postgres?

Ein praktischer Default ist ein kleines Vielfaches der CPU-Kerne pro App-Instanz, oft 5–20 max open connections, ähnliche Anzahl als max idle und Verbindungs-Recycling alle 30–60 Minuten.

Zwei typische Fehler:

Pool zu klein: Anfragen warten auf eine Verbindung, obwohl Postgres-Abfragen kurz sind.
Pool zu groß: Postgres wird mit vielen Sessions überlastet und die Latenz wird uneinheitlich.

Bedenke, dass Pools über mehrere Instanzen multiplizieren (20 Verbindungen × 10 Instanzen = 200 Verbindungen).

Wie bestätige ich, dass der Connection-Pool der Engpass ist (nicht SQL)?

Teile DB-Aufrufe in zwei Messpunkte:

Zeit zum Erhalten einer Verbindung (Pool-Wartezeit)
Zeit zur Ausführung der Abfrage (Postgres-Arbeit)

Wenn die meiste Zeit Pool-Wartezeit ist, passe Pool-Größen, Timeouts und Instanzanzahl an. Wenn die meiste Zeit in der Abfrage liegt, fokussiere auf EXPLAIN und Indexe.

Stelle außerdem sicher, dass du Rows immer schnell schließt, damit Verbindungen in den Pool zurückkehren.

Worauf sollte ich zuerst in EXPLAIN schauen, wenn ein Endpunkt langsam ist?

Führe EXPLAIN (ANALYZE, BUFFERS) auf dem genauen SQL aus, das deine API sendet, und achte auf:

Seq Scan auf großen Tabellen
Große Abweichung zwischen geschätzten und tatsächlichen Zeilen
Sort, das die meiste Zeit ausmacht (oft mit )

Wie wähle ich den richtigen Index für einen List-Endpunkt mit Filtern und Sortierung?

Indexe sollten zu dem passen, was der Endpunkt tatsächlich tut: Filter + Sortierung.

Gute Vorgehensweise:

Erstelle einen kompositen Index für häufige WHERE + ORDER BY-Muster.
Klein halten (2 Spalten oft, 3 manchmal).

Wann lohnt sich ein Partial-Index in Postgres?

Eine Partial-Index lohnt sich, wenn der Großteil des Traffics eine vorhersehbare Teilmenge der Zeilen abfragt.

Beispiel:

Viele Reads betreffen nur active = true
Wenige Abfragen für inaktive Zeilen

Ein Partial-Index wie ... WHERE active = true bleibt kleiner, passt eher in den Speicher und reduziert Schreib-Overhead gegenüber einem Index auf alle Zeilen.

Bestätige mit , dass Postgres ihn für deine stark frequentierten Abfragen nutzt.

Warum wird LIMIT/OFFSET mit der Zeit langsamer und was soll ich stattdessen verwenden?

LIMIT/OFFSET wird auf tiefen Seiten langsamer, weil Postgres die übersprungenen Zeilen trotzdem durchgehen (und oft sortieren) muss. Seite 1 ist billig, Seite 500 kann sehr teuer werden.

Bevorzuge Keyset-/Cursor-Paginierung:

Meine DB-Abfragen sind schnell, aber Antworten sind trotzdem langsam — sollte ich JSON-Payloads kürzen?

Ja, in Listen-Antworten meist. Die schnellste Antwort ist die, die du nicht sendest.

Praktische Hebel:

Selektiere nur die benötigten Spalten (vermeide SELECT *).
Biete include= oder an, damit Clients schwere Felder anfordern können.

ORDER BY

EXPLAIN

fields=