Mindset Kinerja John Carmack untuk Grafik Waktu Nyata

Q: Mengapa artikel menekankan waktu frame (ms) alih-alih FPS?

Waktu frame adalah waktu per frame dalam milidetik (ms), dan ini memetakan langsung berapa banyak pekerjaan yang dilakukan CPU/GPU. - FPS bersifat kebalikan dan bisa menyembunyikan variabilitas. - Waktu frame memperlihatkan stutter (misalnya, frame 40–120 ms sesekali) walau rata-rata FPS terlihat baik. - Lebih mudah untuk membuat anggaran: 16.6 ms = 60 FPS , 33.3 ms = 30 FPS .

Q: Bagaimana cara cepat mengetahui apakah saya CPU-bound atau GPU-bound?

Jalankan eksperimen cepat yang menyingkap pembatas: - Turunkan resolusi : peningkatan besar biasanya berarti Anda pixel/GPU-bound . - Matikan fitur satu per satu (shadow, SSR, AO, partikel): yang mengubah waktu frame secara signifikan biasanya adalah penyebab saat ini. - Konfirmasi dengan profiler CPU dan capture GPU . Hindari menulis ulang sistem sampai Anda bisa menyebutkan biaya dominan dalam milidetik.

Masuk Mulai

Mengapa Pendekatan Carmack Masih Relevan

John Carmack sering diperlakukan seperti legenda mesin game, tetapi bagian yang berguna bukanlah mitologinya—melainkan kebiasaan yang bisa diulang. Ini bukan soal meniru gaya satu orang atau menganggap "langkah jenius." Ini tentang prinsip praktis yang konsisten menghasilkan perangkat lunak yang lebih cepat dan lebih halus, terutama ketika tenggat waktu dan kompleksitas menumpuk.

Rekayasa kinerja, dengan kata-kata sederhana

Rekayasa kinerja berarti membuat perangkat lunak memenuhi target kecepatan di perangkat keras nyata, dalam kondisi nyata—tanpa merusak kebenaran program. Bukan "buat cepat dengan cara apa pun." Ini sebuah loop disiplin:

tentukan apa arti "cukup cepat"
ukur ke mana waktu sebenarnya pergi
ubah satu hal dengan sengaja
verifikasi bahwa metrik yang benar membaik

Pola pikir ini muncul berulang kali dalam kerja Carmack: berargumen dengan data, buat perubahan yang dapat dijelaskan, dan pilih pendekatan yang mudah dipelihara.

Mengapa grafik waktu nyata memperlihatkan kenyataan

Grafik waktu nyata tidak pandang bulu karena ada tenggat setiap frame. Jika Anda melewatinya, pengguna langsung merasakannya sebagai stutter, lag input, atau gerakan yang tidak rata. Perangkat lunak lain dapat menyembunyikan inefisiensi di balik antrean, layar muat, atau pekerjaan latar belakang. Renderer tidak bisa bernegosiasi: Anda selesai tepat waktu, atau tidak.

Itulah mengapa pelajarannya meluas di luar game. Sistem apa pun dengan kebutuhan latensi ketat—UI, audio, AR/VR, trading, robotika—diuntungkan dengan berpikir dalam anggaran, memahami bottleneck, dan menghindari lonjakan tak terduga.

Apa yang akan Anda bawa pulang

Anda akan mendapatkan checklist, heuristik, dan pola pengambilan keputusan yang dapat diterapkan ke pekerjaan Anda sendiri: cara menetapkan anggaran waktu frame (atau latensi), cara memprofil sebelum mengoptimalkan, cara memilih "satu hal" untuk diperbaiki, dan cara mencegah regresi sehingga performa menjadi rutinitas—bukan panik di tahap akhir.

Pikirkan dalam Anggaran Waktu Frame, Bukan Nuansa

Pemikiran performa ala Carmack dimulai dengan perubahan sederhana: berhenti bicara tentang "FPS" sebagai satuan utama dan mulailah bicara tentang waktu frame.

FPS bersifat kebalikan ("60 FPS" terdengar baik, "55 FPS" terdengar dekat), tetapi pengalaman pengguna ditentukan oleh berapa lama tiap frame berlangsung—dan, sama pentingnya, seberapa konsisten waktu-waktu itu. Lonjakan dari 16.6 ms ke 33.3 ms terlihat instan meskipun rata-rata FPS Anda masih terlihat wajar.

Waktu frame vs. FPS (mengapa waktu frame unggul)

FPS menyembunyikan variabilitas. Dua build bisa sama-sama “rata-rata 60 FPS,” tetapi satu mungkin stutter karena sesekali frame 40–60 ms.
Waktu frame memetakan kerja. Setiap milidetik adalah bagian nyata dari pekerjaan CPU/GPU yang bisa Anda atributkan ke sistem.
Target lebih jelas. "Tetap di bawah 16.6 ms" adalah persyaratan konkret; "terasa halus" bukan.

Anggaran: apa yang sebenarnya Anda belanjakan

Sebuah produk waktu nyata memiliki beberapa anggaran, bukan hanya "render lebih cepat":

Waktu CPU (logika game, animasi, culling, submit draw call)
Waktu GPU (shading, post-processing, overdraw, resolusi)
Memori (jejak, lonjakan, fragmentasi, headroom streaming)
Waktu muat (boot, muat level, kompilasi shader, stall streaming)

Anggaran ini saling berinteraksi. Menghemat waktu GPU dengan menambahkan batching berat di CPU bisa berbalik merugikan, dan mengurangi memori bisa meningkatkan biaya streaming atau dekompresi.

Contoh: 16.6 ms pada 60 FPS

Jika target Anda 60 FPS, total anggaran Anda adalah 16.6 ms per frame. Pembagian kasar mungkin seperti:

CPU: 7 ms (simulasi, gameplay, visibility)
GPU: 9 ms (render + post)
OS/driver + buffer overhead: ~0.6 ms

Jika baik CPU atau GPU melebihi anggaran, Anda melewatkan frame. Inilah sebabnya tim berbicara tentang "CPU-bound" atau "GPU-bound"—bukan sekadar label, tetapi cara memutuskan dari mana milidetik berikutnya realistis didapat.

"Cukup cepat" adalah persyaratan produk

Intinya bukan mengejar metrik kesombongan seperti "FPS tertinggi di PC high-end." Intinya adalah mendefinisikan apa yang cukup cepat untuk audiens Anda—target hardware, resolusi, batas baterai, termal, dan responsivitas input—lalu memperlakukan performa sebagai anggaran eksplisit yang bisa Anda kelola dan pertahankan.

Profiling Dulu: Ukur, Baru Putuskan

Langkah default Carmack bukanlah "optimalkan," melainkan "verifikasi." Masalah performa waktu nyata penuh dengan cerita yang masuk akal—pause GC, "shader lambat", "terlalu banyak draw call"—dan sebagian besar salah pada build Anda di hardware Anda. Profiling adalah cara menggantikan intuisi dengan bukti.

Mulai dengan pengukuran (sebelum menebak)

Perlakukan profiling seperti fitur kelas satu, bukan alat penyelamat menit terakhir. Tangkap waktu frame, timeline CPU dan GPU, serta hitungan yang menjelaskannya (segitiga, draw call, perubahan state, alokasi, cache miss jika bisa). Tujuannya menjawab satu pertanyaan: ke mana sebenarnya waktu pergi?

Model yang berguna: dalam setiap frame lambat, satu hal adalah faktor pembatas. Mungkin GPU terhambat pada pass berat, CPU macet di update animasi, atau main thread terhenti pada sinkronisasi. Temukan constraint itu dulu; semuanya lain hanyalah noise.

Iterasi seperti ilmuwan

Loop disiplin menjaga Anda dari thrashing:

Ukur baseline dengan adegan dan jalur kamera yang bisa diulang
Ubah satu hal
Ukur ulang, dan catat delta

Jika peningkatan tidak jelas, anggap tidak membantu—karena kemungkinan besar tidak akan bertahan saat konten berikutnya masuk.

Waspadai optimisasi placebo

Pekerjaan performa sangat rentan terhadap penipuan diri:

Kesalahan benchmarking: scene uji tidak konsisten, build debug, tugas latar, thermal throttling, perbedaan vsync
Bias konfirmasi: "terasa lebih cepat" tanpa data waktu frame
Rata-rata yang menyesatkan: mean lebih baik bisa menyembunyikan spike yang lebih buruk

Profiling terlebih dahulu menjaga usaha Anda fokus, tradeoff Anda beralasan, dan perubahan Anda lebih mudah dipertahankan dalam review.

Bottleneck: Temukan Satu Hal yang Sebenarnya Lambat

Masalah performa waktu nyata terasa berantakan karena semuanya terjadi sekaligus: gameplay, rendering, streaming, animasi, UI, fisika. Insting Carmack adalah memotong kebisingan dan mengidentifikasi pembatas dominan—satu hal yang saat ini menentukan waktu frame Anda.

Kategori bottleneck umum

Sebagian besar perlambatan masuk ke beberapa golongan:

CPU-bound: main thread (atau worker kritis) tidak menyelesaikan kerjanya tepat waktu—logika game, submission draw-call, fisika, evaluasi animasi.
GPU-bound: GPU tidak selesai frame—shader berat, terlalu banyak piksel, post-processing mahal, geometri kompleks.
Memory-bound: Anda dibatasi oleh bandwidth/latensi—cache miss, layout data buruk, banyak akses acak, menyalin buffer besar.
I/O-bound: streaming aset, kompilasi shader, dekompresi, pembacaan file, tunggu jaringan.

Tujuannya bukan memberi label untuk laporan—tetapi memilih tuas yang tepat.

Cara cepat mendiagnosis (sebelum menulis ulang apa pun)

Beberapa eksperimen cepat bisa memberitahu apa yang benar-benar mengendalikan:

Uji skala resolusi: turunkan resolusi render (atau paksa dynamic resolution). Jika waktu frame membaik banyak, Anda kemungkinan GPU/pixel limited. Jika nyaris tidak berubah, lihat ke CPU atau pekerjaan GPU non-pixel.
Toggle fitur: matikan shadows, SSR, AO, partikel, atau pass mahal satu per satu. Perubahan berarti di situlah waktu pergi.
Instrumentasi dan capture: gunakan timer bawaan, profiler CPU, dan capture GPU untuk melihat di mana milidetik benar-benar mendarat.

Prinsip "satu batu besar"

Anda jarang menang dengan mengikis 1% dari sepuluh sistem. Temukan biaya terbesar yang berulang tiap frame dan serang itu dulu. Menghapus satu pelanggar 4 ms mengalahkan minggu-minggu micro-optimisasi.

Bottleneck bergeser

Setelah Anda memperbaiki batu besar, batu besar berikutnya menjadi terlihat. Itu normal. Perlakukan pekerjaan performa sebagai loop: ukur → ubah → ukur ulang → reprioritaskan. Tujuannya bukan profil sempurna; melainkan kemajuan stabil menuju waktu frame yang dapat diprediksi.

Kelancaran Menang: Spike, Stutter, dan Tail Latency

Waktu frame rata-rata bisa terlihat baik sementara pengalaman masih terasa buruk. Grafik waktu nyata dinilai dari momen terburuk: frame terlewat saat ledakan besar, hitch saat memasuki ruangan baru, tiba-tiba stutter saat membuka menu. Itu adalah tail latency—frame lambat yang jarang tapi cukup sering pengguna langsung merasakannya.

Mengapa ekor penting lebih dari rata-rata

Sebuah game berjalan 16.6 ms sebagian besar waktu (60 FPS) namun spike ke 60–120 ms setiap beberapa detik akan terasa "rusak," walau rata-rata masih tercetak sebagai 20 ms. Manusia sensitif terhadap ritme. Satu frame panjang merusak prediktabilitas input, gerakan kamera, dan sinkronisasi audio/visual.

Sumber spike umum

Spike sering berasal dari pekerjaan yang tidak tersebar merata:

Garbage collection atau page fault mem-pause dunia
Kompilasi shader dan pembuatan pipeline yang dipicu "on the fly"
Streaming aset yang tiba-tiba membutuhkan dekompresi, upload, atau I/O file
Penjadwalan OS dan pekerjaan latar yang mencuri CPU time (atau perubahan frekuensi/termal)

Strategi mengurangi stutter

Tujuannya membuat pekerjaan mahal menjadi dapat diprediksi:

Precompute apa yang bisa: bangun shader offline, bake data, siapkan lookup table.
Warm up lebih awal: kompilasi shader, buat pipeline, sentuh aset kritis saat loading screen atau adegan pemanasan terkontrol.
Amortisasi tugas mahal: sebarkan streaming, dekompresi, dan upload ke banyak frame alih-alih satu.
Batasi kerja per frame: terapkan anggaran waktu (mis. "tidak lebih dari 2 ms untuk streaming per frame"), dan tunda sisanya.

Log dan visualisasikan ekor

Jangan hanya plot garis FPS rata-rata. Rekam timing per-frame dan visualisasikan:

Histogram waktu frame untuk melihat klaster dan outlier
Persentil (p95, p99, p99.9) untuk melacak ekor secara eksplisit
Penanda spike dengan event terkait (mulai GC, kompilasi shader, muat aset)

Jika Anda tidak bisa menjelaskan 1% frame terburuk Anda, Anda belum benar-benar menjelaskan performa.

Buat Tradeoff Jelas (Kualitas vs Kecepatan vs Kompleksitas)

Eksperimen Tanpa Kekacauan

Gunakan snapshot untuk menguji satu perubahan sekaligus dan kembalikan saat data tidak mendukung.

Coba Snapshot

Pekerjaan performa menjadi lebih mudah saat Anda berhenti berpura-pura bisa mendapatkan semuanya sekaligus. Gaya Carmack mendorong tim untuk menyebutkan tradeoff secara terang-terangan: apa yang kita dapatkan, apa yang kita bayar, dan siapa yang merasakan perbedaannya?

Sebutkan sumbu (dan biaya sebenarnya)

Sebagian besar keputusan berada pada beberapa sumbu:

Kualitas: fidelitas visual, akurasi simulasi, rasa input
Kecepatan: waktu frame, waktu muat, waktu kompilasi, waktu iterasi
Memori: VRAM, RAM, bandwidth
Kompleksitas: debugging lebih sulit, lebih banyak edge case, beban pengujian bertambah
Waktu untuk kirim: risiko jadwal, risiko integrasi, fokus tim

Jika suatu perubahan memperbaiki satu sumbu tetapi diam-diam membebani tiga lainnya, dokumentasikan. "This adds 0.4 ms GPU and 80 MB VRAM to gain softer shadows" adalah pernyataan yang bisa dipakai. "Terlihat lebih baik" bukan.

Definisikan threshold "cukup baik"

Grafik waktu nyata bukan tentang kesempurnaan; ini tentang mencapai target secara konsisten. Sepakati threshold seperti:

minimum FPS / maksimum waktu frame pada mesin referensi
spike terburuk yang dapat diterima (bukan hanya rata-rata)
batas memori per platform

Setelah tim setuju bahwa, misalnya, 16.6 ms pada 1080p di GPU baseline adalah tujuan, argumen menjadi konkret: apakah fitur ini menjaga kita di bawah anggaran, atau memaksa penurunan kualitas di tempat lain?

Pilih keputusan yang dapat dibalik

Saat belum yakin, pilih opsi yang bisa dibatalkan:

feature flag untuk efek berisiko
pengaturan yang skalabel (low/medium/high) yang memetakan ke biaya nyata
jalur fallback untuk hardware lama

Keterbalikan melindungi jadwal. Anda bisa mengirimkan jalur aman dan menyimpan yang ambisius di balik toggle.

Optimalkan apa yang pengguna bisa rasakan

Hindari overengineering untuk kemenangan yang tidak terlihat. Peningkatan rata-rata 1% jarang bernilai sebulan kompleksitas—kecuali itu menghilangkan stutter, memperbaiki latensi input, atau mencegah crash memori keras. Prioritaskan perubahan yang langsung dirasakan pemain, dan biarkan sisanya menunggu.

Disiplin Rekayasa: Ketepatan Memungkinkan Kecepatan

Pekerjaan performa menjadi jauh lebih mudah ketika program itu benar. Banyak waktu optimisasi sebenarnya dihabiskan mengejar bug correctness yang hanya tampak seperti masalah performa: loop O(N²) karena kerja ganda, pass render berjalan dua kali karena flag tak direset, memory leak yang perlahan menaikkan waktu frame, atau race condition yang berubah menjadi stutter acak.

Perlakukan correctness sebagai alat performa

Engine yang stabil dan dapat diprediksi memberi Anda pengukuran bersih. Jika perilaku berubah antar run, Anda tidak bisa mempercayai profil, dan akan berakhir mengoptimalkan noise.

Praktik rekayasa disiplin membantu percepatan:

Invarian jelas: definisikan apa yang harus selalu benar (mis. "setiap objek terlihat disubmit sekali", "resource GPU tidak dimutasi saat sedang in-flight", "frame graph tidak memiliki siklus").
Validasi di debug build: tambahkan assert dan cek ringan yang menjerit lebih awal—sebelum status rusak berubah menjadi hitching misterius. Validasi ukuran buffer, transisi state, dan bahwa alokasi per-frame tetap di bawah batas yang diketahui.

Buat bug performa bisa direproduksi kapan pun

Banyak spike waktu frame adalah "Heisenbug": mereka hilang ketika Anda menambahkan logging atau step-through debugger. Penawarnya adalah reproduksi deterministik.

Buat harness pengujian kecil dan terkontrol:

Scene uji minimal yang mengisolasi fitur (shadowing, partikel, UI, streaming)
Jalur kamera terkunci dan input yang ter-script agar setiap run comparable
Pengaturan terkunci (resolusi, level kualitas, fixed time step bila mungkin) untuk menghapus variabel

Saat hitch muncul, Anda ingin tombol yang memutarnya 100 kali—bukan laporan samar bahwa itu "kadang muncul setelah 10 menit."

Ubah lebih sedikit, pelajari lebih banyak

Pekerjaan kecepatan diuntungkan dari perubahan kecil yang dapat direview. Refactor besar menciptakan banyak mode kegagalan sekaligus: regresi, alokasi baru, dan kerja tersembunyi ekstra. Diff kecil membuat lebih mudah menjawab satu pertanyaan penting: apa yang berubah pada waktu frame, dan mengapa?

Disiplin bukan birokrasi di sini—itu adalah cara menjaga pengukuran dapat dipercaya sehingga optimisasi menjadi lugas, bukan penuh takhayul.

Bekerja dengan Mesin: Data, Cache, dan Overhead

Buat Aplikasi Checklist Kinerja

Ubah checklist anggaran waktu frame menjadi aplikasi web internal sederhana dalam hitungan jam, bukan minggu.

Mulai Gratis

Performa waktu nyata bukan hanya tentang "kode lebih cepat." Ini tentang menyusun kerja agar CPU dan GPU bisa melakukannya secara efisien. Carmack sering menekankan satu kebenaran sederhana: mesin itu literal. Ia menyukai data yang dapat diprediksi dan membenci overhead yang bisa dihindari.

Pemikiran berorientasi data: buat memori mudah dibaca

CPU modern sangat cepat—sampai mereka menunggu memori. Jika data Anda tersebar di banyak objek kecil, CPU menghabiskan waktu mengejar pointer alih-alih melakukan perhitungan.

Model mental yang berguna: jangan pergi belanja sepuluh kali untuk sepuluh barang. Masukkan semuanya ke satu keranjang dan jalan sekali. Dalam kode, itu berarti menyimpan nilai yang sering dipakai berdekatan (sering dalam array atau struct yang padat) sehingga setiap fetch cache line membawa data yang akan Anda gunakan.

Pola alokasi: churn kecil jadi masalah besar

Alokasi sering menciptakan biaya tersembunyi: overhead allocator, fragmentasi memori, dan jeda tak terduga ketika sistem harus merapikan. Bahkan jika tiap alokasi "kecil", aliran konstan bisa menjadi pajak yang Anda bayar tiap frame.

Perbaikan umum adalah membosankan dengan sengaja: reuse buffer, pool objek, dan prefer alokasi long-lived untuk hot path. Tujuannya bukan kecerdikan—melainkan konsistensi.

Batching: kurangi overhead sebelum mengoptimalkan matematika

Jumlah waktu frame yang mengejutkan bisa hilang ke bookkeeping: perubahan state, draw call, kerja driver, syscall, dan koordinasi thread.

Batching adalah versi "satu keranjang besar" untuk rendering dan simulasi. Alih-alih mengeluarkan banyak operasi kecil, kelompokkan pekerjaan serupa sehingga Anda melintasi boundary mahal lebih sedikit kali. Seringkali, mengurangi overhead mengalahkan micro-optimisasi shader atau loop bagian dalam—karena mesin menghabiskan lebih sedikit waktu menyiapkan kerja dan lebih banyak waktu melakukan kerja.

Kesederhanaan sebagai Strategi Performa

Pekerjaan performa bukan hanya soal kode lebih cepat—itu juga soal memiliki lebih sedikit kode. Kompleksitas punya biaya yang Anda bayar setiap hari: bug butuh waktu lebih lama untuk diisolasi, perbaikan memerlukan pengujian lebih teliti, iterasi melambat karena setiap perubahan menyentuh lebih banyak bagian, dan regresi merayap lewat jalur yang jarang dipakai. Kompleksitas ini tidak hanya membuang waktu pengembang; sering menambahkan overhead runtime (branch tambahan, alokasi, cache miss, sinkronisasi) yang sulit terlihat sampai terlambat.

Pajak tersembunyi dari kompleksitas

Sistem "cerdas" bisa terlihat elegan sampai Anda berada di bawah tenggat dan spike frame muncul hanya di satu peta, satu GPU, atau satu kombinasi pengaturan. Setiap feature flag, jalur fallback, dan kasus khusus menggandakan jumlah perilaku yang harus Anda pahami dan ukur. Kompleksitas itu bukan hanya menyia-nyiakan waktu pengembang; sering menambahkan overhead runtime yang sulit terlihat sampai terlambat.

Pilih solusi yang bisa Anda jelaskan

Aturan yang baik: jika Anda tidak bisa menjelaskan model performa kepada rekan dalam beberapa kalimat, kemungkinan besar Anda tidak bisa mengoptimalkannya secara andal.

Solusi sederhana punya dua keuntungan:

Lebih mudah diprofil dan dipahami (lebih sedikit variabel)
Mengurangi "unknown unknowns", di mana tweak kecil menyebabkan perlambatan tak terduga

"Menghapus kode" adalah alat optimisasi nyata

Kadang jalur tercepat adalah menghapus fitur, memotong opsi, atau menyatukan beberapa varian menjadi satu. Lebih sedikit fitur berarti lebih sedikit jalur kode, lebih sedikit kombinasi state, dan lebih sedikit tempat performa bisa menurun tanpa terdeteksi.

Menghapus kode juga langkah kualitas: bug terbaik adalah yang Anda hapus dengan menghapus modul yang bisa menghasilkannya.

Refactor atau patch? Checklist keputusan cepat

Patch (perbaikan bedah) ketika:

Anda telah mengidentifikasi hot path spesifik dan perubahan kecil secara terukur memperbaikinya
sistem stabil dan banyak digunakan; mengubah arsitektur berisiko menambah regresi
Anda butuh perbaikan aman yang muat dalam timeline rilis saat ini

Refactor (sederhanakan struktur) ketika:

profiling menunjukkan overhead tersebar di banyak call site atau lapisan
Anda sering merusak performa di area yang sama setelah perubahan tak terkait
kode memerlukan pengetahuan tribal untuk dimodifikasi dengan aman
Anda bisa menghapus atau menggabungkan jalur dan akhirya punya lebih sedikit konsep

Kesederhanaan bukan berarti "kurang ambisius." Ini memilih desain yang tetap bisa dipahami saat tekanan—saat performa paling penting.

Cegah Regresi: Jadikan Performa Sebuah Kebiasaan

Pekerjaan performa hanya melekat jika Anda bisa melihat kapan ia tergelincir. Itulah tujuan pengujian regresi performa: cara yang dapat diulang untuk mendeteksi ketika perubahan baru membuat produk lebih lambat, kurang halus, atau lebih boros memori. Berbeda dengan tes fungsional (yang menjawab "apakah ini bekerja?"), tes regresi menjawab "apakah ini masih terasa sama cepat?" Build bisa 100% benar secara fungsional dan tetap menjadi rilis buruk jika menambah 4 ms waktu frame atau menggandakan waktu muat.

Alur kerja ringan yang benar-benar dipakai

Anda tidak butuh lab untuk mulai—cukup konsistensi.

Pilih beberapa baseline scene yang mewakili penggunaan nyata: satu view GPU-heavy, satu view CPU-heavy, dan satu scene stress "worst case". Jaga agar mereka stabil dan ter-script sehingga jalur kamera dan input identik tiap run.

Jalankan tes pada hardware tetap (PC/console/devkit yang dikenal). Jika Anda mengganti driver, OS, atau pengaturan clock, catatlah. Perlakukan kombinasi hardware/software seperti bagian dari fixture tes.

Simpan hasil dalam riwayat versi: hash commit, konfigurasi build, ID mesin, dan metrik yang terukur. Tujuannya bukan angka sempurna—melainkan garis tren yang dapat dipercaya.

Metrik ramah CI yang harus dilacak

Pilih metrik yang sulit untuk diperdebatkan:

Persentil waktu frame (p50/p95/p99), bukan hanya FPS rata-rata. Persentil menonjolkan stutter dan ekor panjang.
Peak memory (dan lonjakan alokasi). Kebocoran memori sering muncul sebelum crash.
Waktu loading (cold start dan transisi level/scene), karena pemain lebih memperhatikan detik daripada mikro-optimisasi.

Tentukan ambang sederhana (mis. p95 tidak boleh regresi lebih dari 5%).

Apa yang dilakukan saat menemukan regresi

Perlakukan regresi seperti bug dengan pemilik dan tenggat.

Pertama, bisect untuk menemukan perubahan yang memperkenalkannya. Jika regresi menghalangi rilis, revert cepat dan re-land dengan perbaikan.

Saat memperbaiki, tambahkan guardrail: pertahankan test, tambahkan catatan di kode, dan dokumentasikan anggaran yang diharapkan. Kebiasaan itulah yang menang—performa menjadi sesuatu yang Anda pelihara, bukan sesuatu yang "dilakukan nanti."

Mengirimkan Sistem Kompleks: Performa, Tenggat, dan Realitas

Rencanakan Batas Kinerja

Tentukan anggaran, ambang batas, dan rencana rollback sebelum Anda menghasilkan kode.

Gunakan Perencanaan

"Mengirimkan" bukanlah peristiwa di kalender—itu adalah persyaratan rekayasa. Sistem yang hanya berjalan baik di lab, atau hanya mencapai waktu frame setelah seminggu pengaturan manual, belum selesai. Mindset Carmack memperlakukan keterbatasan dunia nyata (variasi hardware, konten berantakan, perilaku pemain yang tak terduga) sebagai bagian dari spes sejak hari pertama.

Mengirim berarti memilih apa yang harus benar

Saat mendekati rilis, kesempurnaan kurang bernilai dibandingkan prediktabilitas. Definisikan non-negotiable secara gamblang: target FPS, spike waktu frame terburuk, batas memori, dan waktu muat. Lalu perlakukan apa pun yang melanggar itu sebagai bug, bukan "polish." Ini mengubah pekerjaan performa dari optimisasi opsional menjadi pekerjaan reliabilitas.

Prioritaskan apa yang benar-benar dirasakan pemain

Tidak semua perlambatan sama. Perbaiki masalah yang paling terlihat oleh pengguna terlebih dahulu:

Stutter dan spike panjang biasanya lebih penting daripada rendering yang sedikit lebih lambat dalam kualitas yang dirasakan.
Hitching menu, pop streaming, dan lag input sering merusak pengalaman lebih daripada sedikit penurunan FPS rata-rata.
Regresi dalam skenario umum (pertarungan sibuk, putaran kamera, momen penuh efek) layak diprioritaskan daripada kasus sudut yang jarang.

Disiplin profiling akan sangat membantu: Anda tidak menebak isu mana yang "terasa besar," Anda memilih berdasarkan dampak terukur.

Tahapkan perubahan dan pilih default yang aman

Pekerjaan performa siklus akhir berisiko karena "perbaikan" bisa memperkenalkan biaya baru. Gunakan rollout bertahap: land instrumentasi dulu, lalu perubahan di balik toggle, kemudian perluas eksposur. Pilih default yang aman untuk performa—pengaturan yang melindungi waktu frame meski mengurangi kualitas visual sedikit—terutama untuk konfigurasi yang terdeteksi otomatis.

Jika Anda mengirim ke banyak platform atau tier, perlakukan default sebagai keputusan produk: lebih baik terlihat sedikit kurang mewah daripada terasa tidak stabil.

Komunikasikan keterbatasan ke pemangku kepentingan non-teknis

Terjemahkan tradeoff ke hasil: "Efek ini menambah 2 ms tiap frame pada GPU mid-tier, yang berisiko turun di bawah 60 FPS saat pertarungan." Tawarkan opsi, bukan kuliah: turunkan resolusi, sederhanakan shader, batasi spawn rate, atau terima target lebih rendah. Keterbatasan lebih mudah diterima bila dibingkai sebagai pilihan konkret dengan dampak pengguna yang jelas.

Checklist Praktis untuk Menerapkan Mindset Ini Hari Ini

Anda tidak perlu engine baru atau rewrite untuk mengadopsi pola pikir performa ala Carmack. Anda butuh loop yang bisa diulang yang membuat performa terlihat, dapat diuji, dan sulit rusak tanpa sengaja.

Loop yang bisa diulang (ukur → anggaran → isolasi → optimalkan → validasi → dokumentasi)

Ukur: tangkap baseline (rata-rata, p95, spike terburuk) untuk waktu frame dan subsistem kunci.
Anggaran: tetapkan anggaran per-frame untuk CPU dan GPU (dan memori bila ketat). Tulis anggaran di samping tujuan fitur.
Isolasi: reproduksi biaya di scene atau tes minimal. Jika tidak bisa reproduksi, Anda tidak bisa memperbaikinya secara andal.
Optimalkan: ubah satu hal pada satu waktu. Pilih perubahan yang mengurangi kerja, bukan sekadar "membuat lebih cepat."
Validasi: profil ulang, bandingkan delta, dan cek regresi kualitas serta masalah correctness.
Dokumentasi: catat apa yang berubah, mengapa itu membantu, dan apa yang harus diwaspadai di masa depan.

Aturan jempol yang bisa langsung diterapkan

Optimalkan bilah terbesar, bukan tebakan paling mengganggu.
Kejar spike sebelum rata-rata jika pengguna merasakan stutter.
Jika Anda tidak bisa menjelaskan biaya, Anda belum menguasai fitur itu.
Pilih biaya yang dapat diprediksi daripada ledakan kasus terburuk yang jarang.
Anggarkan kerja baru dari awal (ms CPU, ms GPU, memori, bandwidth).
Hindari loop tersembunyi per-objek/per-frame yang skala dengan konten.
Jadikan tes performa bagian dari syarat "done", bukan scramble pra-rilis.

Template "review performa" sederhana (sebelum merge)

Ringkasan fitur: apa yang berubah, apa yang diaktifkan
Target platform & pengaturan: (mis. mode perf konsol, PC mid-tier)
Anggaran: CPU __ ms, GPU __ ms, memori __ MB
Baseline vs setelah: avg / ms, p95 / ms, spike terburuk / ms
Asumsi bottleneck: CPU atau GPU? bukti:
Scene uji & langkah reproduksi:
Risiko & guardrail: apa yang mungkin regresi, metrik apa yang memberi peringatan
Rencana rollback: cara menonaktifkan atau menurunkan secara halus

Di mana Koder.ai cocok dalam alur ini

Jika Anda ingin mengoperasionalkan kebiasaan ini di seluruh tim, kuncinya mengurangi friction: eksperimen cepat, harness yang bisa diulang, dan rollback yang mudah.

Koder.ai bisa membantu di sini saat Anda membangun tooling pendukung—bukan engine itu sendiri. Karena ini platform vibe-coding yang menghasilkan kode sumber nyata yang dapat diekspor (web app di React; backend di Go dengan PostgreSQL; mobile di Flutter), Anda bisa cepat memutar dashboard internal untuk persentil waktu frame, histori regresi, dan checklist "review performa", lalu iterasi via chat saat kebutuhan berkembang. Snapshot dan rollback juga cocok dengan loop "ubah satu hal, ukur ulang."

Jika Anda ingin panduan praktis lebih lanjut, jelajahi /blog atau lihat bagaimana tim mengoperasionalkan ini di /pricing.

Pertanyaan umum

Mengapa artikel menekankan waktu frame (ms) alih-alih FPS?

Waktu frame adalah waktu per frame dalam milidetik (ms), dan ini memetakan langsung berapa banyak pekerjaan yang dilakukan CPU/GPU.

FPS bersifat kebalikan dan bisa menyembunyikan variabilitas.
Waktu frame memperlihatkan stutter (misalnya, frame 40–120 ms sesekali) walau rata-rata FPS terlihat baik.
Lebih mudah untuk membuat anggaran: 16.6 ms = 60 FPS, 33.3 ms = 30 FPS.

Bagaimana saya menetapkan anggaran waktu frame yang praktis untuk proyek saya?

Pilih target (mis. 60 FPS) dan konversikan menjadi batas keras (16.6 ms). Kemudian bagi tenggat tersebut ke dalam anggaran yang eksplisit.

Contoh titik awal:

CPU: ~7 ms
GPU: ~9 ms
Buffer overhead: ~0.6 ms

Perlakukan ini sebagai persyaratan produk, dan sesuaikan menurut platform, resolusi, termal, dan sasaran latensi input.

Apa setup profiling minimum yang harus saya miliki sebelum mengoptimalkan?

Mulailah dengan membuat pengujian yang dapat diulang, lalu ukur sebelum mengubah apa pun.

Gunakan scene tetap + jalur kamera tetap
Tangkap timeline CPU + timeline GPU
Catat angka pendukung (jumlah draw call, segitiga, alokasi, peristiwa streaming)

Hanya setelah Anda tahu ke mana waktu pergi barulah putuskan apa yang akan dioptimalkan.

Bagaimana cara cepat mengetahui apakah saya CPU-bound atau GPU-bound?

Jalankan eksperimen cepat yang menyingkap pembatas:

Turunkan resolusi: peningkatan besar biasanya berarti Anda pixel/GPU-bound.
Matikan fitur satu per satu (shadow, SSR, AO, partikel): yang mengubah waktu frame secara signifikan biasanya adalah penyebab saat ini.
Konfirmasi dengan profiler CPU dan capture GPU.

Hindari menulis ulang sistem sampai Anda bisa menyebutkan biaya dominan dalam milidetik.

Mengapa spike waktu frame (tail latency) lebih penting daripada rata-rata FPS?

Karena pengguna merasakan frame terburuk, bukan rata-rata.

Lacak:

Persentil (p95/p99/p99.9) untuk mengekspos tail latency
Histogram untuk melihat klaster vs outlier
Korelasi event (GC, kompilasi shader, pemuatan aset) untuk mengatribusi spike

Build yang rata-rata 16.6 ms tapi spike ke 80 ms tetap akan terasa rusak.

Apa cara praktis untuk mengurangi stutter dan hitching?

Buat pekerjaan mahal menjadi dapat diprediksi dan terjadwal:

Precompute (kompilasi shader offline, data yang dibake)
Warm up (kompilasi/buat pipeline saat loading atau pada adegan pemanasan terkontrol)
Amortisasi streaming/dekompresi/uploads ke banyak frame
Batasi kerja per frame (mis. streaming mendapat maksimal 2 ms per frame)

Juga catat spike agar Anda bisa mereproduksi dan memperbaikinya, bukan hanya berharap hilang.

Bagaimana saya memutuskan antara kualitas visual, performa, dan kompleksitas?

Jadikan tradeoff eksplisit dalam angka dan dampak pada pengguna.

Gunakan pernyataan seperti:

This adds 0.4 ms GPU and 80 MB VRAM to improve shadow softness.

Lalu putuskan berdasarkan threshold yang disepakati:

Mengapa correctness sangat penting untuk pekerjaan performa?

Karena ketidakstabilan koreksi membuat data performa tidak dapat dipercaya.

Langkah praktis:

Definisikan invarian (mis. setiap objek yang terlihat disubmit sekali saja).
Tambahkan validasi di debug build (assert batas alokasi, validasi transisi state).
Bangun harness reproduksi deterministik (scene minimal, input ter-script).

Jika perilaku berubah tiap kali dijalankan, Anda akan mengoptimalkan noise bukannya bottleneck.

Apa maksud "work with the machine" dalam praktik (cache, data, batching)?

Sebagian besar pekerjaan "kode cepat" sebenarnya adalah pekerjaan pada memori dan overhead.

Fokus pada:

Localitas data: jaga data hot berdekatan untuk mengurangi cache miss.
Kontrol alokasi: reuse buffer, pool objek, hindari churn per-frame.
Batching: kurangi draw call/perubahan state/sync point sebelum micro-optimize math.

Seringkali, memangkas overhead memberi keuntungan lebih besar daripada memperbaiki loop bagian dalam.

Bagaimana saya mencegah regresi performa saat proyek berkembang?

Buat performa terukur, dapat diulang, dan sulit untuk rusak tanpa sengaja.

Simpan set kecil baseline scene (CPU-heavy, GPU-heavy, worst-case).
Jalankan pada hardware/config tetap dan simpan hasil dengan hash commit.

Mindset Kinerja John Carmack untuk Grafik Waktu Nyata | Koder.ai