Pemikiran Kausal Judea Pearl: AI Lebih Baik, Debugging, dan Keputusan

Q: Apa perbedaan praktis antara korelasi dan kausalitas dalam pekerjaan produk dan AI?

Korelasi membantu Anda memrediksi atau mendeteksi (mis. “ketika X naik, Y sering naik juga”). Kausalitas menjawab pertanyaan keputusan: “Jika kita mengubah X dengan sengaja, apakah Y akan berubah?” Gunakan korelasi untuk peramalan dan pemantauan; gunakan pemikiran kausal saat Anda akan meluncurkan perubahan, menetapkan kebijakan, atau mengalokasikan anggaran.

Q: Mengapa "lebih banyak notifikasi = retensi lebih tinggi" gagal ketika tim mengirim lebih banyak notifikasi?

Karena korelasi tersebut kemungkinan disebabkan oleh konfounding . Pada contoh notifikasi, pengguna yang sangat terlibat memicu/menerima lebih banyak notifikasi dan juga kembali lebih sering . Jika Anda meningkatkan notifikasi untuk semua orang, Anda telah mengubah pengalaman (sebuah intervensi) tanpa mengubah keterlibatan mendasar—jadi retensi mungkin tidak membaik dan bahkan bisa turun.

Q: Apa itu konfounder, mediator, dan collider—dan mengapa mereka penting?

- Konfounder: memengaruhi baik penyebab yang diusulkan maupun hasil (menciptakan asosiasi menyesatkan). - Mediasi: berada di jalur dari penyebab → hasil (bagian dari mekanisme). - Collider: disebabkan oleh dua variabel; pengkondisian padanya dapat menciptakan hubungan palsu. Kesalahan umum adalah “kontrol untuk semua hal”, yang bisa secara tidak sengaja menyesuaikan untuk mediator atau collider dan menghasilkan bias.

Q: Apa itu kontrafaktual, dan kapan itu berguna?

Kontrafaktual bertanya: untuk kasus spesifik ini , apa yang akan terjadi jika kita melakukan sesuatu yang berbeda. Ini berguna untuk: - rekursi pengguna (“apa yang perlu saya ubah agar disetujui?”) - pemeriksaan keadilan (“apakah keputusan berubah jika hanya atribut sensitif berbeda?”) - debugging keputusan aneh (“perubahan minimal apa yang membalik prediksi?”) Ia membutuhkan model kausal agar Anda tidak mengusulkan perubahan tidak realistis.

Q: Bagaimana pemikiran kausal membantu ketika performa model ML turun di produksi?

Fokus pada apa yang berubah hulu dan apa yang mungkin dieksploitasi model: - pergeseran dataset (perubahan segmen pengguna, UI, musim) - jalan pintas spurious (proxy seperti watermark atau pola phrasing) - kebocoran (fitur yang berada di hilir label/proses pelabelan) Pola pikir kausal mendorong Anda menguji intervensi terarah (ablasi, pertubasi) daripada mengejar pergerakan metrik yang hanya kebetulan.

Q: Mengapa "explainability" model bisa menyesatkan tanpa kausalitas?

Tidak selalu. Pentingnya fitur menjelaskan apa yang memengaruhi prediksi , bukan apa yang harus Anda ubah . Fitur yang sangat “penting” bisa jadi proxy atau gejala (mis. tiket dukungan memprediksi churn). Mengintervensi proxy itu (“mengurangi tiket dengan membuat dukungan lebih sulit diakses”) bisa berbalik meningkatkan churn. Penjelasan kausal mengaitkan pentingnya dengan tuas valid dan hasil yang diharapkan di bawah intervensi.

Masuk Mulai

Pemikiran Kausal Judea Pearl: AI Lebih Baik, Debugging, dan Keputusan | Koder.ai

Mengapa Sebab-Akibat Lebih Baik daripada Sekadar Menemukan Pola

Sebuah tim melihat sesuatu yang “jelas” di dashboard mereka: pengguna yang menerima lebih banyak notifikasi kembali lebih sering. Jadi mereka menaikkan volume notifikasi. Seminggu kemudian, retensi turun dan keluhan churn naik. Apa yang terjadi?

Polanya nyata—tetapi menyesatkan. Pengguna yang paling terlibat secara alami memicu lebih banyak notifikasi (karena mereka menggunakan produk lebih sering), dan mereka juga secara alami kembali lebih sering. Notifikasi tidak menyebabkan retensi; keterlibatan menyebabkan keduanya. Tim bertindak berdasarkan korelasi dan tanpa sengaja menciptakan pengalaman yang lebih buruk.

Apa arti “pemikiran kausal” (dengan bahasa sederhana)

Pemikiran kausal adalah kebiasaan bertanya: apa yang menyebabkan apa, dan bagaimana kita tahu? Alih-alih berhenti pada “kedua hal ini bergerak bersama,” Anda mencoba memisahkan:

Sinyal yang Anda amati (apa yang Anda lihat di log, metrik, dan grafik)
Tuas yang bisa Anda tarik (apa yang bisa Anda ubah di dunia nyata)
Efek samping dan pengaruh tersembunyi (faktor lain yang mendorong keduanya)

Ini bukan tentang skeptisisme terhadap data—melainkan tentang bersikap spesifik pada pertanyaannya. “Apakah notifikasi berkorelasi dengan retensi?” berbeda dari “Apakah mengirim lebih banyak notifikasi akan meningkatkan retensi?” Pertanyaan kedua adalah kausal.

Di mana ini langsung membantu

Tulisan ini fokus pada tiga area praktis di mana pencarian pola sering gagal:

Sistem AI: Memahami apakah model menggunakan alasan yang tepat (atau sekadar jalan pintas) ketika membuat prediksi.
Debugging: Menemukan akar penyebab sebenarnya ketika metrik menurun atau insiden terjadi, daripada mengejar kebetulan paling keras.
Keputusan produk: Memilih perubahan yang benar-benar menggerakkan hasil, bukan sekadar “mencocokkan” segmen pengguna berkinerja tinggi.

Apa yang diharapkan dari artikel ini

Ini bukan tur inferensi kausal yang berat matematika. Anda tidak perlu mempelajari notasi do-calculus untuk mendapat nilai di sini. Tujuannya adalah seperangkat model mental dan alur kerja yang bisa digunakan tim Anda untuk:

merumuskan pertanyaan yang lebih baik,
menghindari jebakan umum seperti konfounding,
dan memutuskan kapan Anda perlu eksperimen versus penalaran observasional yang hati-hati.

Jika Anda pernah mengirim perubahan yang “terlihat bagus di data” tetapi tidak bekerja di dunia nyata, pemikiran kausal adalah tautan yang hilang.

Siapa Judea Pearl, dan Apa yang Ia Ubah?

Judea Pearl adalah ilmuwan komputer dan filsuf sains yang karyanya membentuk ulang cara banyak tim memandang data, AI, dan pengambilan keputusan. Sebelum revolusi kausalnya, banyak praktik “belajar dari data” di bidang komputasi fokus pada asosiasi statistik: menemukan pola, memasang model, memprediksi apa yang terjadi selanjutnya. Pendekatan ini kuat—tetapi sering runtuh ketika Anda mengajukan pertanyaan produk atau teknik yang mengandung kata karena.

Perubahan inti Pearl adalah memperlakukan kausalitas sebagai konsep kelas pertama, bukan intuisi samar di atas korelasi. Alih-alih hanya bertanya, “Ketika X tinggi, apakah Y juga tinggi?”, pemikiran kausal bertanya, “Jika kita mengubah X, apakah Y akan berubah?” Perbedaan ini terdengar kecil, tetapi memisahkan prediksi dari pengambilan keputusan.

Dari asosiasi ke pertanyaan kausal

Asosiasi menjawab “apa yang cenderung terjadi bersamaan.” Kausalitas bertujuan menjawab “apa yang akan terjadi jika kita campur tangan.” Ini penting dalam komputasi karena banyak keputusan nyata adalah intervensi: mengirim fitur, mengubah peringkat, menambah pengaman, mengubah set pelatihan, atau menyesuaikan kebijakan.

Bukan sihir: asumsi yang bisa Anda nyatakan dan debatkan

Pearl membuat kausalitas lebih praktis dengan membingkainya sebagai pilihan pemodelan ditambah asumsi eksplisit. Anda tidak “menemukan” kausalitas secara otomatis dari data secara umum; Anda mengusulkan sebuah cerita kausal (sering berdasarkan pengetahuan domain) dan kemudian menggunakan data untuk menguji, mengestimasi, dan menyempurnakannya.

Artefak kunci yang dipopulerkan Pearl

Graf kausal (DAG): Diagram sederhana yang mengodekan asumsi hubungan sebab-akibat.
Intervensi (“do”): Menalar tentang apa yang berubah ketika Anda secara aktif menetapkan sebuah variabel, bukan hanya mengamatinya.
Kontrafaktual: “Apa yang akan terjadi untuk kasus spesifik ini jika kita melakukan hal berbeda?”

Alat-alat ini memberi tim bahasa bersama untuk bergerak dari pencarian pola ke menjawab pertanyaan kausal dengan ketegasan dan disiplin.

Korelasi vs Kausalitas: Pertanyaan Sebenarnya yang Anda Ajukan

Korelasi berarti dua hal bergerak bersama: ketika satu naik, yang lain cenderung naik (atau turun). Ini sangat berguna—terutama di tim yang berat data—karena membantu dengan prediksi dan deteksi.

Jika penjualan es krim melonjak saat suhu naik, sinyal terkorrelasi (suhu) dapat meningkatkan peramalan. Dalam pekerjaan produk dan AI, korelasi menggerakkan model peringkat (“tampilkan lebih banyak apa yang diklik pengguna serupa”), deteksi anomali (“metrik ini biasanya mengikuti metrik itu”), dan diagnostik cepat (“error naik saat latensi naik”).

Masalah muncul ketika kita memperlakukan korelasi sebagai jawaban untuk pertanyaan berbeda: apa yang terjadi jika kita mengubah sesuatu dengan sengaja? Itu adalah kausalitas.

Mengapa korelasi gagal untuk “apa jika kita mengubah X?”

Hubungan terkorrelasi mungkin didorong oleh faktor ketiga yang memengaruhi kedua variabel. Mengubah X tidak selalu mengubah Y—karena X mungkin bukan alasan Y bergerak pada awalnya.

Contoh sederhana konfounding: belanja pemasaran vs penjualan

Bayangkan Anda memplot belanja pemasaran mingguan terhadap penjualan mingguan dan melihat korelasi positif kuat. Mudah untuk menyimpulkan “lebih banyak belanja menyebabkan lebih banyak penjualan.”

Tetapi anggaplah keduanya naik selama musim liburan. Musim (sebagai konfounder) mendorong permintaan lebih tinggi dan juga memicu anggaran lebih besar. Jika Anda menaikkan belanja pada minggu non-liburan, penjualan mungkin tidak naik banyak—karena permintaan mendasar tidak ada.

Tanda bahwa Anda sesungguhnya bertanya pertanyaan kausal

Anda berada di wilayah kausal ketika Anda mendengar diri Anda bertanya:

“Jika kita meningkatkan/menurunkan X, apa yang terjadi pada Y?”
“Haruskah kita meluncurkan fitur ini atau mempertahankan yang lama?”
“Perubahan mana yang akan mengurangi churn, bukan hanya memprediksinya?”
“Apakah kampanye ini berhasil, atau penjualan akan naik sendiri?”
“Apa dampak menghapus sebuah langkah, menambah peringatan, atau mengubah harga?”

Saat kata kerja adalah mengubah, meluncurkan, menghapus, atau mengurangi, korelasi adalah petunjuk awal—bukan aturan keputusan.

Diagram Kausal (DAG) sebagai Bahasa Tim Bersama

Diagram kausal—sering digambar sebagai DAG (Directed Acyclic Graph)—adalah cara sederhana untuk membuat asumsi tim terlihat. Alih-alih berdebat secara samar (“mungkin modelnya” atau “mungkin UI”), Anda letakkan ceritanya di papan.

Node dan panah: tata bahasa dasar

Node adalah variabel yang Anda pedulikan: email pemasaran terkirim, niat pengguna, skor model, pembelian.
Panah berarah mewakili pengaruh kausal: jika mengubah A akan mengubah B, gambar A → B.

Tujuannya bukan kebenaran sempurna; melainkan draf bersama tentang “bagaimana kami kira sistem bekerja” yang bisa dikritik.

Konfounder, mediator, dan collider (dengan satu contoh kecil)

Misalkan Anda menilai apakah tutorial onboarding baru (T) meningkatkan aktivasi (A).

Konfounder: motivasi pengguna (M) memengaruhi baik apakah mereka menyelesaikan tutorial maupun apakah mereka aktif: M → T dan M → A. Jika Anda mengabaikan M, Anda mungkin memberi kredit pada tutorial untuk apa yang sebenarnya disebabkan motivasi.
Mediator: tutorial mungkin meningkatkan pemahaman produk (U), yang kemudian meningkatkan aktivasi: T → U → A. U adalah bagian dari mekanisme.
Collider: bayangkan Anda menganalisis hanya pengguna yang menghubungi dukungan (S), di mana kebingungan dan motivasi sama-sama meningkatkan tiket dukungan: U → S ← M. Mengondisikan pada S bisa menciptakan koneksi menyesatkan antara U dan M, mendistorsi estimasi efek T pada A.

Mengapa “menyesuaikan untuk semua” bisa berbahaya

Refleks analitik umum adalah “kontrol untuk semua variabel yang tersedia.” Dalam istilah DAG, itu bisa berarti secara tidak sengaja menyesuaikan untuk:

Mediator (yang dapat menyembunyikan sebagian efek yang ingin Anda ukur), atau
Collider (yang dapat memperkenalkan bias begitu saja).

Dengan DAG, Anda menyesuaikan variabel dengan alasan—biasanya untuk memblok jalur konfounding—bukan karena variabel itu ada.

Cara membuat sketsa grafik pertama di rapat

Mulai dengan papan tulis dan tiga langkah:

Tuliskan hasil di sebelah kanan (mis. aktivasi), dan penyebab yang diusulkan di kiri (mis. tutorial).
Tanyakan: “Apa yang membuat keduanya lebih mungkin?” (konfounder) dan “Apa yang berada di tengah?” (mediator).
Tandai apa yang Anda kondisikan dalam analisis (filter, kohort, aturan kelayakan). Itu sering menyembunyikan collider.

Bahkan DAG kasar menyelaraskan produk, data, dan engineering pada pertanyaan kausal yang sama sebelum Anda menjalankan angka.

Intervensi: Berpikir dalam “Do”, Bukan “See”

Perubahan besar dalam pemikiran kausal Judea Pearl adalah memisahkan mengamati sesuatu dari mengubahnya.

Jika Anda mengamati bahwa pengguna yang mengaktifkan notifikasi mempertahankan lebih baik, Anda telah mempelajari pola. Tetapi Anda masih belum tahu apakah notifikasi menyebabkan retensi, atau apakah pengguna yang terlibat hanya lebih cenderung menyalakan notifikasi.

Sebuah intervensi berbeda: itu berarti Anda secara aktif menetapkan sebuah variabel ke nilai tertentu dan melihat apa yang terjadi selanjutnya. Dalam istilah produk, itu bukan “pengguna memilih X,” melainkan “kami mengirimkan X.”

“Do” vs “See” (tanpa matematika)

Pearl sering memberi label perbedaan ini sebagai:

See: “Kami melihat notifikasi dalam keadaan ON.”
Do: “Kami menyalakan notifikasi (atau menjadikannya default) dan sekarang kami mengukur efeknya.”

Ide “do” pada dasarnya adalah catatan mental bahwa Anda memutus alasan biasa sebuah variabel mengambil nilai. Saat Anda campur tangan, notifikasi ON bukan karena pengguna yang terlibat memilihnya; notifikasi ON karena Anda memaksa atau mendorong pengaturan tersebut. Intervensi membantu mengisolasi sebab-akibat.

Intervensi adalah bagaimana keputusan produk sebenarnya terjadi

Sebagian besar pekerjaan produk nyata berbentuk intervensi:

Peluncuran fitur dan perubahan UI
Penyesuaian kebijakan peringkat atau rekomendasi
Perubahan harga dan paket
Aturan penipuan, ambang moderasi, atau kebijakan kredit

Tindakan-tindakan ini bertujuan untuk mengubah hasil, bukan hanya menggambarkannya. Pemikiran kausal menjaga pertanyaan tetap jujur: “Jika kita melakukan ini, apa yang akan berubah?”

Catatan: intervensi tetap membutuhkan asumsi

Anda tidak bisa menginterpretasikan sebuah intervensi (atau bahkan merancang eksperimen yang baik) tanpa asumsi tentang apa yang memengaruhi apa—diagram kausal Anda, meskipun informal. Misalnya, jika musim memengaruhi baik belanja pemasaran maupun pendaftaran, maka “melakukan” perubahan belanja tanpa memperhitungkan musim masih bisa menyesatkan. Intervensi kuat, tetapi hanya menjawab pertanyaan kausal ketika cerita kausal dasar setidaknya cukup tepat.

Kontrafaktual: Menjawab “Bagaimana Jika?” untuk Satu Kasus

Bandingkan varian dengan snapshot

Simpan kondisi yang sudah terbukti baik sebelum perubahan berisiko dan bandingkan hasilnya.

Gunakan Snapshot

Kontrafaktual adalah jenis pertanyaan “bagaimana jika?” yang khusus: untuk kasus ini, apa yang akan terjadi jika kita melakukan tindakan berbeda (atau jika satu input berbeda)? Ini bukan “apa yang terjadi rata-rata?”—melainkan “apakah hasil ini akan berubah untuk orang ini, tiket ini, transaksi ini?”

Mengapa tim peduli: rekursi, keadilan, dan tiket dukungan

Kontrafaktual muncul saat seseorang meminta jalan menuju hasil yang berbeda:

Rekursi pengguna: “Apa yang perlu saya ubah agar disetujui?”
Pemeriksaan keadilan: “Jika pelamar ini memiliki kualifikasi yang identik tetapi atribut sensitif berbeda, apakah keputusan berubah?”
Dukungan dan debugging: “Pengguna ini mengatakan sistem ‘tidak masuk akal’—perubahan input apa yang membalik prediksi?”

Pertanyaan-pertanyaan ini bersifat tingkat pengguna. Mereka juga cukup konkret untuk memandu perubahan produk, kebijakan, dan penjelasan.

Contoh AI konkret

Bayangkan model pinjaman yang menolak suatu aplikasi. Penjelasan berbasis korelasi mungkin mengatakan, “Tabungan rendah berkorelasi dengan penolakan.” Sebuah kontrafaktual bertanya:

Jika tabungan pemohon $3.000 lebih tinggi (semua hal lain sama), apakah model akan menyetujuinya?

Jika jawabannya “ya,” Anda mempelajari sesuatu yang dapat ditindaklanjuti: perubahan yang masuk akal dapat membalik keputusan. Jika jawabannya “tidak,” Anda menghindari memberi saran menyesatkan seperti “tingkatkan tabungan” ketika penghambat sebenarnya adalah rasio utang terhadap pendapatan atau riwayat pekerjaan yang tidak stabil.

Batasan utama: kontrafaktual tidak “langsung ada di data”

Kontrafaktual bergantung pada model kausal—cerita tentang bagaimana variabel saling memengaruhi—bukan sekadar dataset. Anda harus memutuskan apa yang bisa berubah secara realistis, apa yang akan berubah sebagai konsekuensi, dan apa yang harus tetap sama. Tanpa struktur kausal itu, kontrafaktual bisa menjadi skenario mustahil (“meningkatkan tabungan tanpa mengubah pendapatan atau pengeluaran”) dan menghasilkan rekomendasi yang tidak membantu atau tidak adil.

Pemikiran Kausal untuk Keandalan AI dan Debugging

Ketika model ML gagal di produksi, penyebab akar jarang “algoritme menjadi lebih buruk.” Lebih sering, sesuatu di sistem berubah: apa data yang dikumpulkan, bagaimana label dibuat, atau apa yang pengguna lakukan. Pemikiran kausal membantu Anda berhenti menebak dan mulai mengisolasi perubahan mana yang menyebabkan degradasi.

Mode kegagalan umum (dan mengapa mereka menipu metrik)

Beberapa pelaku yang berulang muncul di banyak tim:

Jalan pintas spurious: model mempelajari proxy mudah (watermark, warna latar, kekhasan frasa) yang berkorelasi dengan label di pelatihan tetapi bukan sinyal asli.
Perpindahan dataset: proses pembangkitan data berubah (segmen pengguna baru, UI baru, musiman), sehingga hubungan pelatihan tidak lagi berlaku.
Kebocoran: fitur secara tak sengaja menyertakan informasi yang berada di hilir label (atau proses pelabelan), menaikkan performa offline.

Ini bisa tampak “baik” di dashboard agregat karena korelasi dapat tetap tinggi bahkan ketika alasan model benar telah berubah.

Bagaimana graf kausal mengekspos jalan pintas

Diagram kausal sederhana (DAG) mengubah debugging menjadi peta. Itu memaksa Anda bertanya: apakah fitur ini penyebab label, konsekuensi darinya, atau konsekuensi dari bagaimana kita mengukurnya?

Misalnya, jika Kebijakan pelabelan → Rekayasa fitur → Input model, Anda mungkin membangun pipeline di mana model memprediksi kebijakan alih-alih fenomena mendasar. DAG membuat jalur itu terlihat sehingga Anda bisa membloknya (hapus fitur, ubah instrumentasi, atau definisikan ulang label).

Intervensi untuk debugging (pikirkan “ubah X dan lihat Y”)

Alih-alih hanya memeriksa prediksi, coba intervensi terkontrol:

Edit data terarah: tukar latar, hapus watermark, ganggu timestamp—lalu jalankan inferensi lagi.
Ablasi: hapus fitur proxy yang dicurigai dan ukur dampak kausal pada kesalahan.
Irisan kontrafaktual: pertahankan semuanya kecuali satu faktor (jenis perangkat, lokal) untuk menguji sensitivitas.

Daftar periksa: pertanyaan kausal saat performa menurun

Perubahan hulu apa yang bisa menyebabkan ini (produk, logging, perilaku pengguna, kebijakan pelabelan)?
Fitur mana yang mungkin berada di hilir label atau proses pelabelan (resiko kebocoran)?
Konfounder apa yang bisa menjelaskan baik fitur maupun hasil (mis. wilayah memengaruhi bahasa dan konversi)?
Intervensi apa yang bisa kita jalankan dengan aman untuk mengisolasi faktor yang dicurigai?
Jika kita menghapus jalan pintas, apakah masih ada jalur kausal dari sinyal nyata → prediksi?

Dari Penjelasan ke Sebab: Apa yang Kelewat oleh “Explainability” AI

Tambahkan pertanyaan kausal ke PRD Anda

Gunakan Mode Perencanaan untuk menulis intervensi, metrik, dan batasan sebelum Anda meluncurkan.

Mulai Perencanaan

Banyak alat “explainability” menjawab pertanyaan sempit: Mengapa model menghasilkan skor ini? Mereka sering melakukan ini dengan menyoroti input berpengaruh (kepentingan fitur, peta saliency, nilai SHAP). Itu bisa berguna—tetapi bukan hal yang sama dengan menjelaskan sistem tempat model berada.

Menjelaskan prediksi vs menjelaskan sistem

Penjelasan prediksi bersifat lokal dan deskriptif: “Pinjaman ini ditolak terutama karena pendapatan rendah dan utilisasi tinggi.”

Penjelasan sistem bersifat kausal dan operasional: “Jika kita meningkatkan pendapatan terverifikasi (atau mengurangi utilisasi) dengan cara yang mencerminkan intervensi nyata, apakah keputusan akan berubah—dan apakah hasil hilir akan membaik?”

Yang pertama membantu menginterpretasi perilaku model. Yang kedua membantu memutuskan apa yang harus dilakukan.

Mengapa model kausal mengubah makna “penjelasan”

Pemikiran kausal mengikat penjelasan pada intervensi. Alih-alih bertanya variabel mana yang berkorelasi dengan skor, Anda bertanya variabel mana yang merupakan tuas sah dan efek apa yang diproduksi saat diubah.

Model kausal memaksa Anda eksplisit tentang:

Apa yang bisa diintervensi (harga, pesan, ambang, UI)
Apa yang sekadar diamati (niat pengguna, kondisi ekonomi)
Apa yang terkofound (faktor tersembunyi yang mendorong input dan hasil)

Ini penting karena fitur “penting” bisa jadi proxy—berguna untuk prediksi, berbahaya untuk aksi.

Risiko penjelasan pasca-faktual yang mengikuti korelasi

Penjelasan pasca-faktual bisa tampak meyakinkan sambil tetap murni korelasional. Jika “jumlah tiket dukungan” kuat memprediksi churn, plot kepentingan fitur bisa menggoda tim untuk “mengurangi tiket” dengan membuat dukungan lebih sulit dijangkau. Intervensi itu bisa meningkatkan churn, karena tiket adalah gejala masalah produk—bukan penyebab.

Penjelasan berbasis korelasi juga rapuh saat distribusi berubah: begitu perilaku pengguna berubah, fitur yang disorot tidak lagi berarti sama.

Di mana penjelasan kausal berharga

Penjelasan kausal sangat berharga ketika keputusan punya konsekuensi dan akuntabilitas:

Audit: membenarkan keputusan dalam istilah intervensi yang masuk akal dan jalur sensitif-keadilan.
Tinjauan insiden: memisahkan akar penyebab dari sinyal yang berkorelasi ketika sesuatu rusak.
QA dan pemantauan: menguji perubahan “bagaimana jika” (ambang, kebijakan, UX) sebelum diluncurkan dan setelah drift.

Saat Anda perlu bertindak, bukan sekadar menginterpretasi, penjelasan butuh kerangka kausal.

Eksperimen, A/B Test, dan Saat Anda Tidak Bisa Merandomisasi

A/B testing adalah inferensi kausal dalam bentuk paling sederhana dan praktis. Saat Anda menugaskan pengguna secara acak ke varian A atau B, Anda melakukan intervensi: Anda tidak hanya mengamati apa yang dipilih orang, Anda menetapkan apa yang mereka lihat. Dalam istilah Pearl, randomisasi membuat “do(varian = B)” nyata—jadi perbedaan hasil dapat secara kredibel diatribusikan ke perubahan, bukan siapa yang kebetulan memilihnya.

Mengapa randomisasi sangat kuat

Penugasan acak memutus banyak tautan tersembunyi antara sifat pengguna dan paparan. Pengguna power, pengguna baru, jam, jenis perangkat—faktor-faktor ini tetap ada, tetapi (rata-rata) seimbang di antara grup. Keseimbangan itu yang mengubah selisih metrik menjadi klaim kausal.

Saat eksperimen sulit (atau tidak pantas)

Bahkan tim hebat tidak selalu bisa menjalankan tes teracak bersih:

Sampel kecil: trafik rendah membuat hasil berisik dan lambat.
Efek jangka panjang: retensi, kepercayaan, dan churn bisa tampak berbulan-bulan kemudian.
Interferensi: pengobatan satu pengguna memengaruhi pengguna lain (berbagi sosial, dinamika marketplace).
Etika dan keselamatan: Anda tidak bisa “menguji” pengalaman berbahaya atau kebijakan tidak adil secara acak.
Kendala operasional: batasan platform, aturan hukum, atau ketergantungan mitra.

Dalam kasus ini, Anda tetap bisa berpikir kausal—hanya perlu eksplisit tentang asumsi dan ketidakpastian.

Alternatif quasi-eksperimental (tingkat tinggi)

Opsi umum termasuk difference-in-differences (bandingkan perubahan dari waktu ke waktu antara grup), regression discontinuity (gunakan aturan cutoff seperti “hanya pengguna dengan skor di atas X”), instrumental variables (dorongan alami yang mengubah paparan tanpa langsung mengubah hasil), dan matching/weighting untuk membuat grup lebih sebanding. Setiap metode menukar randomisasi dengan asumsi; diagram kausal membantu Anda menyatakan asumsi tersebut dengan jelas.

Pra-registrasi apa arti "sukses"

Sebelum mengirim tes (atau studi observasional), tuliskan: metrik utama, guardrail, populasi target, durasi, dan aturan keputusan. Pra-registrasi tidak menghilangkan bias, tetapi mengurangi pencarian metrik dan membuat klaim kausal lebih mudah dipercaya—dan lebih mudah diperdebatkan sebagai tim.

Keputusan Produk yang Lebih Baik dengan Pertanyaan Kausal

Sebagian besar debat produk terdengar seperti: “Metrik X bergerak setelah kita mengirim Y—jadi Y berhasil.” Pemikiran kausal merapatkan itu menjadi pertanyaan lebih jelas: “Apakah perubahan Y menyebabkan metrik X bergerak, dan seberapa besar?” Pergeseran itu mengubah dashboard dari bukti menjadi titik awal.

Tiga keputusan umum, ditulis ulang sebagai pertanyaan kausal

Perubahan harga: alih-alih “Apakah pendapatan naik setelah kenaikan harga?”, tanyakan:

“Berapa efek menaikkan harga 10% terhadap konversi berbayar, churn, dan tiket dukungan, dengan musiman dikontrol?”

Perbaikan onboarding: alih-alih “Pengguna baru menyelesaikan onboarding lebih sering sekarang,” tanyakan:

“Jika kami mempersingkat onboarding dari 6 menjadi 4 langkah, apa yang terjadi pada aktivasi dan retensi minggu-4 untuk pengguna baru?”

Perubahan peringkat rekomendasi: alih-alih “CTR meningkat,” tanyakan:

“Jika kita mengurutkan ulang hasil untuk mempromosikan kebaruan, apa efeknya pada kepuasan jangka panjang (kembali, hide, unsubscribe), bukan hanya klik?”

Bagaimana konfounding menyelinap ke dashboard

Dashboard sering mencampur “siapa yang mendapat perubahan” dengan “siapa yang sudah akan berkinerja baik.” Contoh klasik: Anda meluncurkan flow onboarding baru, tetapi pertama kali ditampilkan kepada pengguna pada versi aplikasi terbaru. Jika versi baru diadopsi oleh pengguna yang lebih terlibat, grafik Anda mungkin menunjukkan kenaikan yang sebagian (atau seluruhnya) disebabkan oleh adopsi versi, bukan onboarding.

Konfounder lain yang sering muncul di analitik produk:

Musiman dan kampanye (promo mendorong pendaftaran dan konversi)
Perubahan komposisi pengguna (lebih banyak pelanggan enterprise bulan ini)
Beban dukungan (outage meningkatkan tiket dan menurunkan retensi)

Tambahkan pertanyaan kausal ke PRD (agar tim tetap selaras)

Bagian PRD yang berguna bisa berjudul “Pertanyaan Kausal,” dan mencakup:

Utama: “Perubahan apa yang kita lakukan, dan hasil apa yang seharusnya ia sebabkan?”
Guardrail: “Apa yang tidak boleh memburuk jika ini berhasil?”
Konfounder: “Apa lagi yang bisa menggerakkan metrik pada waktu yang sama?”
Rencana pengukuran: “Eksperimen, holdout, rollout bertahap, atau perbandingan yang dicocokkan?”

Jika Anda menggunakan loop pembangunan cepat (terutama dengan pengembangan yang dibantu LLM), bagian ini makin penting: mencegah “kita bisa merilis cepat” berubah jadi “kita merilis tanpa tahu apa yang disebabkannya.” Tim yang membangun di Koder.ai sering menanamkan pertanyaan kausal ini ke mode perencanaan sejak awal, lalu mengimplementasikan varian dengan feature flag cepat, beserta snapshot/rollback untuk menjaga eksperimen aman ketika hasil (atau efek samping) mengejutkan Anda.

Selaraskan PM, data, engineering, dan support

PM menentukan keputusan dan kriteria keberhasilan. Mitra data menerjemahkannya ke estimasi kausal dapat diukur dan pemeriksaan kewarasan. Engineering memastikan perubahan dapat dikendalikan (feature flag, logging eksposur yang bersih). Support berbagi sinyal kualitatif—perubahan harga sering “berhasil” sambil diam-diam meningkatkan pembatalan atau volume tiket. Ketika semua setuju pada pertanyaan kausal, pengiriman menjadi pembelajaran—bukan sekadar pengiriman.

Alur Kerja Praktis: Tambahkan Kausalitas ke Perangkat Tim Anda

Siapkan variabel yang tepat

Buat backend Go + PostgreSQL yang sesuai model kausal dan kebutuhan data Anda.

Buat Backend

Pemikiran kausal tidak perlu peluncuran bergelar PhD. Perlakukan sebagai kebiasaan tim: tuliskan cerita kausal Anda, uji tekan, lalu biarkan data (dan eksperimen bila mungkin) mengonfirmasi atau mengoreksinya.

Apa yang Anda butuhkan (sebelum berdebat tentang hasil)

Untuk maju, kumpulkan empat input di muka:

Sebuah graf: diagram kausal cepat (DAG) dari variabel kunci.
Asumsi: apa yang Anda yakini menggerakkan apa, dan apa yang Anda memilih untuk diabaikan.
Sumber data: dari mana setiap variabel berasal (log, CRM, survei), plus celah yang diketahui.
Rencana validasi: bagaimana Anda akan memeriksa asumsi (A/B test, eksperimen alami, cek sensitivitas, atau tinjauan ahli).

Proses ringan: sketsa → kritik → uji → iterasi

Sketsa diagram paling sederhana yang menjawab satu pertanyaan (mis. “Apakah email onboarding akan meningkatkan retensi minggu-4?”).
Kritik bersama tim: analytics, PM, engineering, dan seseorang yang dekat dengan pengguna.
Uji asumsi: cari konfounding, efek seleksi, dan “panah yang hilang.” Jika mungkin, desain eksperimen kecil.
Iterasi: perbarui diagram dan rencana pengukuran saat Anda belajar.

Dalam praktiknya, kecepatan penting: semakin cepat Anda mengubah pertanyaan kausal menjadi perubahan terkontrol, semakin sedikit waktu yang Anda habiskan berdebat tentang pola ambigu. Itu sebabnya tim memakai platform seperti Koder.ai untuk bergerak dari “hipotesis + rencana” ke implementasi yang bekerja (web, backend, atau mobile) dalam hari, bukan minggu—sambil tetap menjaga ketelitian melalui rollout bertahap, deploy, dan rollback.

Template tinjauan diagram kausal (salin/-tempel)

Keputusan / intervensi: Tindakan apa yang mungkin kita ambil?
Hasil: Apa yang kita coba ubah?
Jalur kausal utama: Bagaimana intervensi mencapai hasil?
Konfounder: Apa yang memengaruhi intervensi dan hasil?
Mediator: Apa yang berada di tengah (jangan kendalikan ini secara tidak sengaja)?
Collider / filter seleksi: Di mana pengkondisian bisa menciptakan hubungan palsu?
Catatan pengukuran: Bagaimana variabel diamati; apa yang hilang atau berisik?
Pengecekan yang diusulkan: Eksperimen? Quasi-eksperimen? Analisis sensitivitas?

Jika Anda ingin menyegarkan memori tentang eksperimen, lihat /blog/ab-testing-basics. Untuk jebakan umum pada metrik produk yang meniru “efek”, lihat /blog/metrics-that-mislead.

Intisari dan Langkah Berikutnya

Pemikiran kausal adalah pergeseran dari “apa yang cenderung bergerak bersama?” menjadi “apa yang akan berubah jika kita bertindak?” Pergeseran itu—dipopulerkan dalam komputasi dan statistik oleh Judea Pearl—membantu tim menghindari cerita yang terdengar percaya diri tetapi tidak bertahan pada intervensi dunia nyata.

Poin utama (4–6 baris)

Korelasi adalah petunjuk, bukan jawaban.

Diagram kausal (DAG) membuat asumsi terlihat dan dapat didiskusikan.

Intervensi (“do”) berbeda dari observasi (“see”).

Kontrafaktual membantu menjelaskan kasus tunggal: “bagaimana jika satu hal ini berbeda?”

Pekerjaan kausal yang baik mendokumentasikan ketidakpastian dan penjelasan alternatif.

Mulai minggu ini: daftar periksa praktis kecil

Satu rapat (45 menit): Pilih satu pertanyaan berisiko tinggi (mis. “Apakah fitur ini akan mengurangi churn?”) dan tulis ulang sebagai intervensi: “Jika kita melakukan X, apa yang berubah di Y?”
Satu diagram (15–30 menit): Sketsa DAG sederhana di papan: intervensi, hasil, dan 3–6 penyebab yang mungkin memengaruhi keduanya. Tandai apa yang dapat Anda ukur vs. yang hilang.
Satu pengecekan (sprint ini): Pilih pemeriksaan paling kuat yang layak—A/B test bila bisa randomisasi, atau perbandingan quasi-eksperimental yang hati-hati bila tidak bisa. Tentukan sejak awal hasil apa yang akan mengubah keputusan Anda.

Jangan salah mengira diagram rapi sebagai kebenaran

Kausalitas membutuhkan kehati-hatian: konfounder tersembunyi, kesalahan pengukuran, dan efek seleksi bisa membalikkan kesimpulan. Antidotnya adalah transparansi—tuliskan asumsi, tunjukkan data yang dipakai, dan catat apa yang akan memalsukan klaim Anda.

Jika Anda ingin mempelajari lebih jauh, jelajahi artikel terkait di /blog dan bandingkan pendekatan kausal dengan metode analitik dan “explainability” lain untuk melihat di mana masing‑masing membantu—dan di mana bisa menyesatkan.

Pertanyaan umum

Apa perbedaan praktis antara korelasi dan kausalitas dalam pekerjaan produk dan AI?

Korelasi membantu Anda memrediksi atau mendeteksi (mis. “ketika X naik, Y sering naik juga”). Kausalitas menjawab pertanyaan keputusan: “Jika kita mengubah X dengan sengaja, apakah Y akan berubah?”

Gunakan korelasi untuk peramalan dan pemantauan; gunakan pemikiran kausal saat Anda akan meluncurkan perubahan, menetapkan kebijakan, atau mengalokasikan anggaran.

Mengapa "lebih banyak notifikasi = retensi lebih tinggi" gagal ketika tim mengirim lebih banyak notifikasi?

Karena korelasi tersebut kemungkinan disebabkan oleh konfounding. Pada contoh notifikasi, pengguna yang sangat terlibat memicu/menerima lebih banyak notifikasi dan juga kembali lebih sering.

Jika Anda meningkatkan notifikasi untuk semua orang, Anda telah mengubah pengalaman (sebuah intervensi) tanpa mengubah keterlibatan mendasar—jadi retensi mungkin tidak membaik dan bahkan bisa turun.

Apa itu diagram kausal (DAG), dan mengapa tim harus repot menggambarnya?

DAG (Directed Acyclic Graph) adalah diagram sederhana di mana:

node adalah variabel yang Anda pedulikan
panah berarti “A menyebabkan B” (jika mengubah A akan mengubah B)

Ini berguna karena membuat asumsi eksplisit, membantu tim setuju pada apa yang harus dikontrol, apa yang tidak boleh dikontrol, dan eksperimen apa yang benar-benar akan menjawab pertanyaan.

Apa itu konfounder, mediator, dan collider—dan mengapa mereka penting?

Konfounder: memengaruhi baik penyebab yang diusulkan maupun hasil (menciptakan asosiasi menyesatkan).
Mediasi: berada di jalur dari penyebab → hasil (bagian dari mekanisme).
Collider: disebabkan oleh dua variabel; pengkondisian padanya dapat menciptakan hubungan palsu.

Kesalahan umum adalah “kontrol untuk semua hal”, yang bisa secara tidak sengaja menyesuaikan untuk mediator atau collider dan menghasilkan bias.

Apa arti “do vs see” tanpa matematika?

“See” adalah mengamati apa yang terjadi secara alami (pengguna memilih sendiri, skor tinggi). “Do” adalah secara aktif menetapkan suatu variabel (meluncurkan fitur, memaksa default).

Inti: sebuah intervensi memutus alasan biasa mengapa sebuah variabel mengambil nilai tertentu, itulah sebabnya intervensi bisa mengungkap sebab-akibat lebih andal daripada pengamatan saja.

Apa itu kontrafaktual, dan kapan itu berguna?

Kontrafaktual bertanya: untuk kasus spesifik ini, apa yang akan terjadi jika kita melakukan sesuatu yang berbeda.

Ini berguna untuk:

rekursi pengguna (“apa yang perlu saya ubah agar disetujui?”)
pemeriksaan keadilan (“apakah keputusan berubah jika hanya atribut sensitif berbeda?”)
debugging keputusan aneh (“perubahan minimal apa yang membalik prediksi?”)

Ia membutuhkan model kausal agar Anda tidak mengusulkan perubahan tidak realistis.

Bagaimana pemikiran kausal membantu ketika performa model ML turun di produksi?

Fokus pada apa yang berubah hulu dan apa yang mungkin dieksploitasi model:

pergeseran dataset (perubahan segmen pengguna, UI, musim)
jalan pintas spurious (proxy seperti watermark atau pola phrasing)
kebocoran (fitur yang berada di hilir label/proses pelabelan)

Pola pikir kausal mendorong Anda menguji intervensi terarah (ablasi, pertubasi) daripada mengejar pergerakan metrik yang hanya kebetulan.

Mengapa "explainability" model bisa menyesatkan tanpa kausalitas?

Tidak selalu. Pentingnya fitur menjelaskan apa yang memengaruhi prediksi, bukan apa yang harus Anda ubah.

Fitur yang sangat “penting” bisa jadi proxy atau gejala (mis. tiket dukungan memprediksi churn). Mengintervensi proxy itu (“mengurangi tiket dengan membuat dukungan lebih sulit diakses”) bisa berbalik meningkatkan churn. Penjelasan kausal mengaitkan pentingnya dengan tuas valid dan hasil yang diharapkan di bawah intervensi.

Kapan kita harus menjalankan A/B test, dan bagaimana jika kita tidak bisa merandomisasi?

Tes A/B teracak paling baik jika memungkinkan, tetapi Anda mungkin perlu alternatif ketika:

trafik kecil
efek membutuhkan waktu lama muncul
ada interferensi (pengobatan satu pengguna memengaruhi pengguna lain)
etika/keamanan melarang randomisasi

Dalam kasus tersebut, pertimbangkan quasi-eksperimen seperti difference-in-differences, regression discontinuity, instrumental variables, atau matching/weighting—dengan keterbukaan mengenai asumsi.

Bagaimana kita memasukkan pemikiran kausal ke PRD dan dokumen keputusan?

Tambahkan bagian singkat yang memaksa kejelasan sebelum analisis:

Intervensi: apa tepatnya yang kita ubah?
Hasil + guardrail: apa yang harus membaik, dan apa yang tidak boleh memburuk?
Konfounder: apa lagi yang bisa menggerakkan metrik pada saat yang sama?
Rencana pengukuran: eksperimen, rollout bertahap, holdout, atau perbandingan yang dicocokkan

Ini menjaga tim selaras pada pertanyaan kausal daripada cerita dashboard pasca-faktum.