Oszacowanie kosztów budowy AI według funkcji: prosta metoda budżetowa

Q: Jaka jest różnica między tokenami, kredytami i krokami budowy?

Tokeny to kawałki tekstu, które model czyta/pisze (Twój prompt, jego odpowiedź oraz historię czatu, którą musi ponownie przeczytać). Kredyty to jednostka rozliczeniowa platformy (często obejmująca użycie modelu plus zadania platformy, takie jak uruchamianie agentów czy edycje plików). Kroki budowy to znaczące zmiany w projekcie (dodanie tabeli, podpięcie ekranu, dodanie endpointu). Jedna funkcja zwykle wymaga wielu kroków, a każdy krok może wywołać wiele wywołań modelu.

Q: Ile buforu powinienem dodać i gdzie go umieścić?

Dodaj dwie oddzielne linie: - Bufor nieznanych: zwykle 10–20% - Późniejsze zmiany (on request): oddzielna pula na nowe pomysły po zaakceptowaniu funkcji Trzymanie „późniejszych zmian” osobno zapobiega obwinianiu pierwotnego oszacowania za normalny wzrost zakresu.

Q: Jak zascoopować integrację, żeby oszacowanie nie było strzałem w ciemno?

Rozbij „podłącz do X” na małe, testowalne kroki: - auth (klucz API/OAuth + odświeżanie tokenów) - jeden obiekt end-to-end na ścieżce "happy path" - zachowanie synchronizacji (webhooki vs harmonogram, paginacja, limity) - obsługa błędów (retry, idempotencja, ścieżka ponownego uruchomienia) - testowanie nietypowych danych i timeoutów Zablokuj kontrakt danych (dokładne pola) zanim wygenerujesz kod, aby model nie wymyślał dodatkowych tabel i ekranów.

Q: Jak oszacować redesigny i zmiany UI bez przeciekania budżetu?

Zakresuj pracę UI jak listę stron i stanów: - strony wchodzące w zakres - stany (ładowanie/puste/błąd/sukces) - co się zmienia (wygląd vs zachowanie) - liczba rund (np. 1 budowa + 1 dopracowanie) Jeśli redesign zmienia walidację, ładowanie danych lub kroki użytkownika, potraktuj go jak funkcję, a nie "tylko UI."

Q: Jaka jest praktyczna lista kontrolna promptu, żeby ograniczyć koszty?

Użyj zwartej struktury promptu: - cel + użytkownik - ekrany i akcje (co użytkownik klika) - podstawowe tabele/pola (tylko niezbędne) - 2–4 kryteria akceptacji na funkcję - wyraźne elementy poza zakresem Buduj małymi kawałkami (jeden endpoint albo jeden ekran naraz) i re-estymuj po każdej części.

Zaloguj się Rozpocznij

Oszacowanie kosztów budowy AI według funkcji: prosta metoda budżetowa | Koder.ai

Dlaczego koszty budowy AI wydają się nieprzewidywalne

Budowanie z pomocą AI wydaje się tanie — aż nagle przestaje. To dlatego, że nie płacisz za stałą cenę funkcji. Płacisz za próby: wiadomości, wygenerowany kod, poprawki, testy i powtórki. Gdy plan jest nieostry, liczba prób szybko rośnie.

Większość skoków kosztów wynika z kilku powtarzalnych wzorców:

Zakres jest domyślny, a nie zapisany (na przykład „dodaj auth” bez ról, dostawców czy resetu hasła).
Powtarzające się próby się kumulują (prompt, który jest prawie dobry, prowadzi do 3–10 odpowiedzi uzupełniających).
Specyfikacje zmieniają się w trakcie budowy (nowe pola, nowe ekrany, inne reguły), więc wcześniejsza praca jest zastępowana.
Ukryte wymagania pojawiają się późno (ładowanie, walidacja, przypadki brzegowe, stany błędów).
„Jeszcze jedna poprawka” cichaczem przeradza się w przebudowę kilku ekranów.

Podczas szacowania bądź jasny co do tego, na co właściwie przeznaczasz budżet:

Kredyty lub jednostki użycia, które nalicza Twoja platforma
Tokeny (rozmiar promptów i wyników)
Czas (Twój czas przeglądu, testowania i poprawiania)

Traktuj każde oszacowanie jako przedział, nie pojedynczą liczbę. Funkcja może wyglądać na małą w UI, a być dużą w logice, albo odwrotnie. Najlepszy scenariusz to mocny pierwszy szkic. Najgorszy — kilka pętli poprawek.

Reszta tego przewodnika używa powtarzalnych koszyków funkcji: auth, CRUD, integracje i przebudowy UI. Jeśli używasz platformy rozliczanej kredytami typu vibe-coding, takiej jak Koder.ai (koder.ai), szybko to poczujesz: rozpoczęcie od „zbuduj dashboard” i późniejsze dodawanie ról, logów audytu i nowego układu spala znacznie więcej kredytów niż spisanie tych ograniczeń z góry.

Kredyty i tokeny w prostych słowach

Ludzie często mieszają trzy różne pojęcia: tokeny, kredyty i kroki budowy. Rozdzielenie ich ułatwia przewidywanie kosztów.

Token to mały kawałek tekstu, który model czyta lub pisze. Twój prompt używa tokenów, odpowiedź modelu używa tokenów, a długa historia czatu zużywa tokeny, bo model musi ją ponownie przeczytać.

Kredyt to jednostka rozliczeniowa Twojej platformy. Na narzędziach takich jak Koder.ai kredyty zwykle obejmują użycie modelu plus pracę platformy stojącą za czatem (np. uruchamianie agentów, tworzenie plików i sprawdzanie wyników). Nie musisz znać wewnętrznych szczegółów, aby budżetować, ale musisz rozpoznać, co zwiększa użycie.

Krok budowy to jedno sensowne zmiany w projekcie: „dodaj logowanie emailowe”, „stwórz tabelę users” albo „podłącz ten ekran do endpointu”. Pojedyncza funkcja często wymaga wielu kroków, a każdy krok może wywołać wiele wywołań modelu.

Użycie rośnie najszybciej, gdy masz długi kontekst (obszerne specyfikacje, dużą historię czatu, wiele plików odniesienia), dużo iteracji, duże wyniki (przepisywanie całych plików, duże bloki kodu) albo niejednoznaczne prośby, które zmuszają model do zgadywania.

Małe zmiany w promptach mogą znacząco zmienić koszty, bo wpływają na liczbę koniecznych poprawek. „Kompletny system auth” zaprasza do wielu opcji, których nie prosiłeś. „Email i hasło tylko, bez logowania społecznościowego, dokładnie dwa ekrany” redukuje ruchome elementy.

Zasada, która się sprawdza: im mniej ruchomych elementów, tym mniej poprawek.

Sposób szacowania kosztu zorientowany na funkcje

Przestań szacować w „ekranach” lub „wiadomościach”. Szacuj w funkcjach, które użytkownik nazwałby na głos. To łączy budżet z rezultatami, a nie z tym, jak rozmowna stanie się budowa.

Dla każdej funkcji oszacuj trzy części:

Budowa: wygenerowanie kodu i podpięcie go do aplikacji
Test: uruchomienie przepływu, naprawa oczywistych błędów, obsługa kluczowych przypadków brzegowych
Poprawki: druga runda po zobaczeniu działającej funkcji (korekta tekstów, walidacja, drobne poprawki UX)

Większość przekroczeń budżetu dzieje się podczas testowania i poprawek, nie przy pierwszym szkicu.

Użyj zakresu dla każdej części: niski (proste), typowy (trochę wymiany) i wysoki (niespodzianki). Jeśli Twoja platforma rozlicza kredytami, śledź to w kredytach. Jeśli śledzisz tokeny bezpośrednio, śledź tokeny. Cel jest ten sam: prognoza, która pozostaje uczciwa, gdy rzeczywistość się zmienia.

Dwie pozycje pomagają zapobiec samozadawnym przekroczeniom:

Bufor nieznanych (10–20%) jako własna pozycja. Nie ukrywaj go w funkcjach.
Późniejsze zmiany na żądanie jako osobna pula dla nowych pomysłów po zaakceptowaniu funkcji ("dodaj zespoły", "zrób dashboard jak X"). Jeśli tego nie oddzielisz, obwinisz pierwotne oszacowanie za normalne zmiany.

Oto lekki szablon, który możesz skopiować:

Feature: Password login
- Build:    low 30 | typical 60 | high 120
- Test:     low 15 | typical 30 | high 60
- Revise:   low 10 | typical 20 | high 40
Subtotal (typical): 110

Buffer (15%): 17
Later changes (held): 50

Powtórz to dla każdej funkcji (auth, CRUD, integracja, odświeżenie UI). Sumuj używając „typowy” dla planu i „wysoki” jako kontrola najgorszego scenariusza.

Szacowanie powszechnych funkcji: auth i CRUD

Auth i CRUD wyglądają prosto, ale stają się drogie, gdy zakres jest niejasny. Traktuj je jak menu: każda opcja dodaje koszt.

Auth: określ dokładny kształt, nie tylko "logowanie"

Zapisz, co oznacza „gotowe” dla kontroli dostępu. Największe czynniki to liczba metod logowania i liczba ścieżek uprawnień.

Bądź konkretny w kwestiach:

Metody logowania (email/hasło, magic link, Google, Apple, SSO)
Role i uprawnienia (admin/editor/viewer, plus co każda rola może zrobić)
Zasady dotyczące hasła (długość, złożoność, blokady, przepływ resetu)
Zasady sesji (wygasanie, wylogowanie, zachowaj mnie)
Cykl życia konta (zaproszenia, dezaktywacja/usunięcie, weryfikacja email)

Jeśli powiesz tylko "dodaj auth", otrzymasz ogólne rozwiązanie i później zapłacisz za łatki uwzględniające przypadki brzegowe. Decydowanie o kształcie z góry jest tańsze.

CRUD: licz ekrany i reguły, nie tylko tabele

Koszt CRUD zależy od liczby encji i ilości zachowań dla każdej z nich. Praktyczny model: każda encja często implikuje 3–6 ekranów (lista, szczegóły, tworzenie, edycja, czasem widoki admina lub audytu), plus pracę API i walidację.

Podczas zakresowania CRUD nazwij encje i uwzględnij pola, typy i reguły walidacji (wymagane, unikalne, zakresy). Następnie zdefiniuj zachowanie listy: filtry, sortowanie, paginacja i wyszukiwanie. „Wyszukiwanie” może znaczyć prosty filtr zawierający lub coś znacznie cięższego.

Zdecyduj też, czy ekrany admina różnią się od ekranów użytkownika. Osobne layouty, dodatkowe pola i akcje masowe mogą podwoić pracę.

Przypadki brzegowe, które szybko podnoszą koszty, to uprawnienia na poziomie wiersza, logi audytu, import/eksport CSV, soft delete i workflowy zatwierdzania. Wszystko to jest wykonalne, ale budżet pozostaje przewidywalny, gdy explicitnie wybierzesz, co chcesz przed generowaniem funkcji.

Szacowanie integracji bez zgadywania

Buduj w małych krokach

Wygeneruj pojedynczy ekran lub endpoint, przetestuj go, a potem przejdź do następnego kroku.

Create Project

Integracje wydają się drogie, bo kryją pracę. Naprawa to rozbicie ich na małe, testowalne kroki zamiast „połącz z X”. To sprawia, że oszacowanie jest bardziej przewidywalne i daje czystszy prompt.

Solidny zakres integracji zwykle obejmuje:

Połączenie i uwierzytelnianie (klucze API lub OAuth, odświeżanie tokenów)
Jeden obiekt end-to-end (jedno żądanie happy-path)
Zachowanie synchronizacji (webhooki lub harmonogram, paginacja, limity)
Obsługę błędów (retry, idempotencja, ścieżka ponownego uruchomienia)
Testowanie i przypadki brzegowe (błędne dane, brak uprawnień, timeouty)

Zanim wyślesz prompt, zablokuj kontrakt danych. Wypisz obiekty i dokładne pola, których potrzebujesz. „Synchronizuj klientów” jest niejasne. „Synchronizuj Customer{id, email, status} i Order{id, total, updated_at}” powstrzyma model przed wymyślaniem dodatkowych tabel, ekranów i endpointów.

Potem zdecyduj kierunek i częstotliwość. Synchronizacja jednokierunkowa (tylko import) jest znacznie tańsza niż dwukierunkowa, bo dwukierunkowa potrzebuje reguł konfliktów i więcej testów. Jeśli musisz robić dwukierunkowo, wybierz regułę nadrzędności z góry (źródło prawdy, last-write-wins lub przegląd manualny).

Planuj obsługę błędów jakby była pewna. Dziennik zdarzeń plus alert i przycisk "ponów synchronizację" ręcznie często wystarczy. Utrzymanie minimalności zapobiega płaceniu za pełny system operacyjny, o który nie prosiłeś.

Na koniec dodaj bufor na dziwactwa zewnętrznego API i testy. Nawet "proste" API przynoszą paginację, nietypowe enumy, niespójne dokumentacje i limity. Doliczenie dodatkowych 20–40% na testy integracji i poprawki jest realistyczne.

Szacowanie przebudów i zmian UI

Prace UI to miejsce, gdzie budżety cicho przeciekają. „Redesign” może oznaczać wymianę kolorów lub przebudowę całego przepływu, więc nazwij, co się zmienia: układ, komponenty, treści czy kroki użytkownika.

Oddziel zmiany wyłącznie wizualne od zmian wpływających na zachowanie. Zmiany wizualne dotykają stylów, odstępów i struktury komponentów. Gdy zmieniasz działanie przycisku, walidację lub sposób ładowania danych, to jest praca funkcjonalna.

Zakresuj to jak listę stron

Unikaj „przebudowy całej aplikacji.” Wypisz dokładne ekrany i stany. Jeśli nie potrafisz wymienić stron, nie oszacujesz.

Trzymaj zakres krótki i konkretny:

Strony w zakresie (np. Login, Dashboard, Settings)
Stany w zakresie (puste, ładowanie, błąd, sukces)
Co się zmienia (układ, komponenty, treść, przepływ)
Styl referencyjny (kilka uwag: kolory, typografia, odstępy)
Dozwolone rundy (np. 1 budowa + 1 dopracowanie)

Taki prompt powstrzymuje model przed zgadywaniem projektu w całej bazie kodu, a to właśnie powoduje wymiany.

Nie pomijaj rund QA

Zmiany UI zwykle potrzebują co najmniej dwóch kontroli: desktop i mobile. Dodaj szybkie podstawy dostępności (kontrast, stany fokusu, nawigacja klawiaturą), nawet jeśli nie robisz pełnego audytu.

Praktyczna metoda szacowania to:

(liczba stron) x (głębokość zmian) x (liczba rund)

Przykład: 3 strony x średnia głębokość (nowy layout + poprawki komponentów) x 2 rundy (budowa + dopracowanie) to przewidywalny kawałek kredytów. Jeśli dodatkowo zmieniasz onboarding, potraktuj go jako osobną pozycję.

Krok po kroku: zbuduj zakres w promptach z budżetem

Najtańszy sposób kontrolowania kredytów to zdecydować, czego chcesz, zanim poprosisz model o budowę. Rework to miejsce, gdzie koszty skaczą.

Zacznij od jednego akapitu określającego użytkownika i cel. Na przykład: „Recepcjonistka małego gabinetu loguje się, dodaje pacjentów, umawia wizyty i widzi listę na dziś.” To ustawia granice i zniechęca model do wymyślania dodatkowych ról, ekranów czy przepływów.

Następnie opisz produkt jako ekrany i akcje, nie jako ogólne moduły. Zamiast "moduł wizyt", napisz "Ekran kalendarza: utwórz, przełóż, anuluj, wyszukaj." To sprawia, że praca jest policzalna.

Dołącz tylko dane niezbędne. Nie potrzebujesz jeszcze wszystkich pól, tylko tych, które czynią funkcję realną. Mocny prompt zwykle zawiera:

Użytkownicy i role (kto co może)
Ekrany z akcjami (co użytkownik klika)
Główne tabele i kluczowe pola (co trzeba przechować)
Kryteria akceptacji (jak wiesz, że działa)
Poza zakresem (czego nie budować)

Kryteria akceptacji zapobiegają płaceniu dwa razy. Dla każdej funkcji napisz 2–4 checki jak "Użytkownik może zresetować hasło przez email" albo "Tworzenie wizyty zapobiega podwójnemu terminowi." Jeśli używasz Koder.ai, te checki naturalnie pasują do Trybu Planowania przed generowaniem kodu.

Bądź explicity o elementach poza zakresem: "bez panelu admina", "bez płatności", "bez wielojęzyczności", "bez synchronizacji z zewnętrznym kalendarzem." To powstrzyma niespodziewane prace typu "miło by było".

Buduj w małych kawałkach i przeszacowuj po każdym kawałku. Prosty rytm: wygeneruj jeden ekran lub endpoint, uruchom go, napraw problemy, potem idź dalej. Jeśli kawałek kosztuje więcej niż oczekiwano, obetnij zakres lub zmniejsz następny kawałek zanim odpłyniesz.

Jak utrzymać prompty tańsze bez utraty jakości

Szybkie szacowanie według funkcji

Rozbij aplikację na auth, CRUD i integracje, aby zakresy kredytów były realistyczne.

Try Koder

Większość skoków kosztów wynika z robienia za dużo w jednym zapytaniu. Traktuj model jak współpracownika: briefuj go w małych, jasnych krokach.

Zacznij od planu, nie od kodu. Poproś o krótki plan budowy z założeniami i otwartymi pytaniami, potwierdź go, a potem poproś o pierwszy mały krok implementacyjny. Gdy w jednym promptcie łączysz planowanie, budowę, testowanie, copywriting i stylizację, zapraszasz długie odpowiedzi i więcej błędów.

Utrzymuj kontekst zwarty. Dołącz tylko ekrany, komponenty lub notatki API, które mają znaczenie dla zmiany. Jeśli używasz Koder.ai, wybierz konkretne pliki i odnoś się do nich po nazwie. Dodatkowe pliki zwiększają tokeny i wciągają zmiany w niepowiązane obszary.

Proś o małe różnice. Jeden prompt powinien zmieniać jedną rzecz kiedy to możliwe: pojedynczy endpoint, jeden formularz, jeden stan błędu, jeden ekran. Małe zmiany są łatwiejsze do przeglądu, a jeśli coś pójdzie nie tak, nie płacisz za ponowne robienie niepowiązanej pracy.

Zestaw prostych zasad:

Proś o: najpierw plan, potem jeden krok implementacji, potem krótką listę kontrolną przeglądu
Dostarczaj: minimalny kontekst (bieżące zachowanie, pożądane zachowanie, ograniczenia)
Ogranicz: stała liczba rund poprawek (np. dwie)
Wymagaj: krótkie podsumowanie zmian, żeby niespodzianki były oczywiste
Zapisuj: co spowodowało prace naprawcze i aktualizuj szablon promptu

Przerywaj pętle wcześnie. Jeśli druga próba nadal nie jest dobra, zmień dane wejściowe, nie tylko sformułowanie. Dodaj brakujący szczegół, usuń sprzeczne wymaganie albo pokaż dokładny przypadek, który zawodzi. Powtarzanie „spróbuj jeszcze raz” często pali tokeny bez przybliżania rozwiązania.

Przykład: chcesz "logowanie + zapomniane hasło" i ładniejszy layout. Zrób to w trzech promptach: (1) nakreśl przepływy i wymagane ekrany, (2) zaimplementuj tylko auth, (3) dopracuj odstępy i kolory UI. Każdy krok jest łatwiejszy do przeglądu i tańszy.

Typowe błędy, które dmuchają budżet

Większość przekroczeń nie wynika z dużych funkcji. Pochodzą z małych luk w zakresie, które mnożą potrzebę dodatkowych rund promptów, więcej wygenerowanego kodu i więcej poprawek.

Pięć zabójców budżetu (i co zamiast tego)

Budowanie zanim uzgodnisz, co to znaczy "gotowe"

Jeśli generujesz kod bez kryteriów akceptacji, zapłacisz za przepisywanie. Napisz 3–5 checków najpierw: co użytkownik może zrobić, jakie błędy się pokażą, jakie dane muszą być zapisane.

Używanie niejasnych słów

"Nowoczesne", "ładne" i "ulepsz to" zapraszają długie rundy. Zastąp je konkretami, np. "układ dwukolumnowy na desktopie, kolumna pojedyncza na mobile" albo "kolor przycisku primary #1F6FEB."

Upychanie wielu funkcji w jednym promptcie

"Dodaj auth, dodaj billing, dodaj panel admina" utrudnia śledzenie zmian i szacowanie następnych kroków. Rób jedną funkcję na raz i proś o krótkie podsumowanie zmienionych plików.

Zmiana modelu danych późno

Zmiana nazw tabel, relacji lub kluczy w trakcie pracy wymusza edycje w UI, API i migracjach. Zablokuj podstawowe encje wcześnie, nawet jeśli niektóre pola pozostają "na przyszłość."

Pominięcie testowania aż do końca

Błędy zamieniają się w pętle regeneruj-napraw-regeneruj. Poproś o mały zestaw testów dla każdej funkcji, nie jeden ogromny test później.

Konkretny przykład: prosisz Koder.ai o "ulepszenie CRM" i on zmienia layouty, zmienia nazwy pól i poprawia endpointy w jednym kroku. Potem integracja przestaje działać, a Ty spalony kredyty na znalezienie, co się przesunęło. Jeśli zamiast tego powiesz "nie zmieniaj modelu danych, tylko zaktualizuj stronę listy, nie dotykaj tras API i przejdź te 4 checki", ograniczasz churn i trzymasz koszty stabilnie.

Szybka lista kontrolna kosztów przed startem

Wysyłaj CRUD przewidywalnie

Zdefiniuj pola, walidacje i reguły list, aby tabele i ekrany pasowały do budżetu.

Build CRUD

Traktuj budżetowanie jak planowanie małego projektu, nie jak pojedynczy magiczny prompt. 2-minutowy check łapie większość przyczyn przepalenia budżetu.

Przejdź przez te punkty i napraw każde „nie” zanim wygenerujesz więcej kodu:

Masz listę funkcji z twardymi krawędziami: co robi, czego nie robi i gdzie się zaczyna i kończy.
Masz przedział dla każdej funkcji (niski, typowy, wysoki) i zobowiązujesz się do jednej liczby dla pierwszej budowy.
Twój prompt zawiera kryteria akceptacji i wyraźne elementy poza zakresem.
Budujesz w małych kawałkach i przeglądasz po każdym: weryfikuj zachowanie, czytaj zmiany i dopiero potem decyduj, czy iść dalej.
Zarezerwowałeś budżet na części, które prawie zawsze rosną: integracje i poprawki UI.

Jeśli używasz Koder.ai, traktuj każdy kawałek jak punkt migawki: wygeneruj fragment, przetestuj go, a potem kontynuuj. Migawki i przywracanie są najbardziej przydatne przed ryzykownymi zmianami (edycje modelu danych, szerokie refaktory UI lub przepisywanie integracji).

Prosty przykład: zamiast promptu "Zbuduj zarządzanie użytkownikami", doprecyzuj do "Logowanie email/hasło, reset hasła wliczony, bez logowania społecznościowego, admin może dezaktywować użytkowników, testy dla logowania i resetu." Jasne checki redukują poprawki, a poprawki to miejsce, gdzie znikają tokeny i kredyty.

Przykład: oszacowanie małej aplikacji z listy funkcji

Oto mały, realistyczny przykład, który możesz skopiować. Aplikacja to narzędzie wewnętrzne dla zespołu: logowanie, dwa proste moduły i jedna integracja.

Załóżmy, że jeden "cykl budowy" to: krótki plan, wygenerowanie lub aktualizacja kodu, szybki przegląd i naprawa. Twoje kredyty głównie śledzą, ile cykli wykonujesz i jak duże są te cykle.

Lista funkcji dla narzędzia wewnętrznego:

Feature	What's included	Low	Typical	High
Login + roles	Sign in, sign out, two roles (Admin, User), protected pages	1 cycle	2 cycles	4 cycles
CRUD module 1	"Employees" list, create/edit, basic validation, search	2 cycles	3 cycles	6 cycles
CRUD module 2	"Assets" list, create/edit, assign to employee, audit fields	2 cycles	4 cycles	7 cycles
One integration	Send an event to an external service when an asset is assigned	1 cycle	2 cycles	5 cycles

Sekwencja promptów, która utrzymuje kontrolę checkpointów:

Planowanie: potwierdź pola, ekrany i reguły dla każdej funkcji oraz co jest poza zakresem.
Buduj moduł 1: wygeneruj Employees end-to-end, potem zatrzymaj się.
Przegląd: przetestuj przepływ, napraw błędy i zablokuj pola przed przejściem dalej.
Powtórz dla modułu 2.
Dodaj integrację na końcu, gdy główne przepływy są stabilne.

Koszty rosną, gdy zmieniasz decyzje po stworzeniu kodu. Typowe wyzwalacze to zmiany ról (nowe role lub ścieżki uprawnień), późne pola (zwłaszcza te, które dotykają obu modułów i integracji), błędy integracji (błędy uwierzytelniania, niezgodność payloadów) i redesign UI po stworzeniu formularzy.

Kolejne kroki: planuj funkcja po funkcji, buduj w cyklach i sprawdzaj kredyty po każdym cyklu. Używaj migawek przed ryzykownymi zmianami, aby szybko przywrócić stan i trzymać projekt w typowym przedziale.

Często zadawane pytania

Dlaczego koszty budowy AI wydają się nieprzewidywalne nawet dla prostych funkcji?

Budżetuj w przedziale, ponieważ płacisz za próby, nie za stałą cenę funkcji. Koszty rosną z powodu:

niejasnego zakresu (więcej rund pytań i odpowiedzi)
długiego kontekstu (historia czatu + dużo plików do przeanalizowania)
dużych wyników (przepisywanie całych plików)
testowania i poprawek po pierwszym szkicu

„Mała” zmiana UI może być droga, jeśli wpływa na logikę, dane lub przepływy.

Jaka jest różnica między tokenami, kredytami i krokami budowy?

Tokeny to kawałki tekstu, które model czyta/pisze (Twój prompt, jego odpowiedź oraz historię czatu, którą musi ponownie przeczytać).

Kredyty to jednostka rozliczeniowa platformy (często obejmująca użycie modelu plus zadania platformy, takie jak uruchamianie agentów czy edycje plików).

Kroki budowy to znaczące zmiany w projekcie (dodanie tabeli, podpięcie ekranu, dodanie endpointu). Jedna funkcja zwykle wymaga wielu kroków, a każdy krok może wywołać wiele wywołań modelu.

Jak szacować koszty według funkcji zamiast liczby promptów?

Szacuj według funkcji, które użytkownik nazwałby na głos ("logowanie z hasłem", "lista pracowników", "przypisz zasób") zamiast "ekranów" czy "wiadomości". Dla każdej funkcji zaplanuj trzy części:

Budowa: wygenerowanie kodu i podpięcie go do aplikacji
Test: przeprowadzenie przepływu, naprawa oczywistych błędów i obsługa kluczowych przypadków brzegowych
Poprawki: druga runda po zobaczeniu działającego rozwiązania

Następnie przypisz wartości: niski / typowy / wysoki i zsumuj.

Ile buforu powinienem dodać i gdzie go umieścić?

Dodaj dwie oddzielne linie:

Bufor nieznanych: zwykle 10–20%
Późniejsze zmiany (on request): oddzielna pula na nowe pomysły po zaakceptowaniu funkcji

Trzymanie „późniejszych zmian” osobno zapobiega obwinianiu pierwotnego oszacowania za normalny wzrost zakresu.

Jakie szczegóły muszę określić dla auth, aby uniknąć poprawek?

Opisz, co oznacza „skończone” dla auth. Największe czynniki kosztowe to:

liczba metod logowania (email/hasło vs magic link vs SSO)
liczba ról/ścieżek uprawnień
cykl życia konta (zaproszenia, dezaktywacja/usunięcie, weryfikacja)
zasady sesji (wygaśnięcie, wylogowanie, pamiętaj mnie)
reset hasła i blokady

Jeśli chcesz przewidywalnych kosztów, domyślnie wybierz jedną metodę (email/hasło) i 1–2 role.

Co sprawia, że funkcje CRUD stają się niespodziewanie drogie?

Koszt CRUD zależy od zachowań, nie tylko od tabel. Dla każdej encji zdefiniuj:

potrzebne ekrany (lista/szczegóły/utwórz/edytuj + ewentualne widoki admina/audytu)
pola, typy i reguły walidacji
zachowanie listy (filtry, sortowanie, paginacja, wyszukiwanie)
reguły uprawnień (kto może zobaczyć/edytować które wiersze)

Jeśli dodasz import/eksport CSV, logi audytu, soft delete czy workflowy akceptacji, potraktuj je jako osobne pozycje w budżecie.

Jak zascoopować integrację, żeby oszacowanie nie było strzałem w ciemno?

Rozbij „podłącz do X” na małe, testowalne kroki:

auth (klucz API/OAuth + odświeżanie tokenów)
jeden obiekt end-to-end na ścieżce "happy path"
zachowanie synchronizacji (webhooki vs harmonogram, paginacja, limity)
obsługa błędów (retry, idempotencja, ścieżka ponownego uruchomienia)
testowanie nietypowych danych i timeoutów

Zablokuj kontrakt danych (dokładne pola) zanim wygenerujesz kod, aby model nie wymyślał dodatkowych tabel i ekranów.

Jak oszacować redesigny i zmiany UI bez przeciekania budżetu?

Zakresuj pracę UI jak listę stron i stanów:

strony wchodzące w zakres
stany (ładowanie/puste/błąd/sukces)
co się zmienia (wygląd vs zachowanie)
liczba rund (np. 1 budowa + 1 dopracowanie)

Jeśli redesign zmienia walidację, ładowanie danych lub kroki użytkownika, potraktuj go jak funkcję, a nie "tylko UI."

Jaka jest praktyczna lista kontrolna promptu, żeby ograniczyć koszty?

Użyj zwartej struktury promptu:

cel + użytkownik
ekrany i akcje (co użytkownik klika)
podstawowe tabele/pola (tylko niezbędne)
2–4 kryteria akceptacji na funkcję
wyraźne elementy poza zakresem

Buduj małymi kawałkami (jeden endpoint albo jeden ekran naraz) i re-estymuj po każdej części.

Co robić, gdy utknę w pętli regenerate-fix-regenerate?

Zatrzymaj się po dwóch nieudanych próbach i zmień dane wejściowe, a nie tylko słowa. Typowe poprawki:

dodaj brakujące ograniczenia (role, dokładne pola, konkretne ekrany)
usuń sprzeczne wymagania
podaj przypadek, który zawodzi (co zrobiłeś, co się stało, co powinno się stać)
poproś o małą różnicę (zmień tylko jedną rzecz)

Na końcu każdego kroku poproś o krótkie podsumowanie zmienionych plików, żeby wykryć niezamierzone zmiany.