14 Tem 2025·8 dk

Judea Pearl’in Nedensel Düşüncesi: Daha İyi Yapay Zeka, Hata Ayıklama, Kararlar

Q: Ürün ve yapay zeka çalışmalarında korelasyon ile nedensellik arasındaki pratik fark nedir?

Korelasyon size tahmin veya tespit yapmada yardımcı olur (ör. “X yükseldiğinde Y genellikle yükselir”). Nedensellik ise bir karar sorusunu yanıtlar: “Eğer X'i kasıtlı olarak değiştirirsek, Y değişir mi?” Korelasyonu tahminleme ve izleme için, nedensel düşünmeyi ise bir değişiklik göndereceğiniz, politika belirleyeceğiniz veya bütçe ayıracağınız zaman kullanın.

Q: Takım daha fazla bildirim gönderince neden “daha fazla bildirim = daha yüksek tutunma” örneği başarısız oldu?

Çünkü korelasyon karıştırıcı tarafından yönlendiriliyor olabilir. Bildirim örneğinde, çok ilgili kullanıcılar hem daha fazla bildirim tetikler/asıldır hem de daha sık geri döner . Herkese daha fazla bildirim gönderirseniz, deneyimi (bir müdahale) değiştirirsiniz ama temel etkileşimi değiştirmezsiniz—bu yüzden tutunma artmayabilir, hatta kötüleşebilir.

Q: Karıştırıcılar, aracı değişkenler ve çarpışıcılar nedir ve neden önemlidir?

- Karıştırıcı (confounder): hem önerilen nedeni hem de sonucu etkiler (yanıltıcı bir ilişki yaratır). - Ara değişken (mediator): neden → sonuç yolunun ortasında yer alır (etkinin bir parçasıdır). - Çarpışıcı (collider): iki değişkenin neden olduğu bir şeydir; buna göre filtre uygularsanız sahte bir ilişki oluşturabilirsiniz. Yaygın hata “her şeye kontrol et” refleksidir; bu, yanlışlıkla ara değişkenleri veya çarpışıcıları kontrol ederek sonuçları yanlılaştırabilir.

Q: Karşıt durum (counterfactual) nedir ve ne zaman kullanışlıdır?

Karşıt durum (counterfactual) sorar: bu özel vaka için , başka bir şey yapsaydık ne olurdu? Kullanım alanları: - geri bildirim hakları: “Onaylanmak için neyi değiştirmem gerekir?” - adalet incelemeleri: “Eğer hassas bir özellik farklı olsaydı karar değişir miydi?” - hata ayıklama: “Bu tahmini tersine çevirecek en küçük değişiklik ne olurdu?” Olur, ancak bunun için bir nedensel modele ihtiyacınız vardır; aksi halde imkânsız senaryolar üretebilirsiniz.

Judea Pearl’in nedensel modellerinin ekiplerin yapay zekâ davranışını açıklamasına, hataları ayıklamasına ve korelasyonların ötesinde daha net ürün kararları almasına nasıl yardımcı olduğunu öğrenin.

Neden Nedensellik, Desen Bulmaktan Üstündür

Bir ekip panosunda “açık” görünen bir şey fark eder: daha fazla bildirim alan kullanıcılar daha sık geri dönüyor. Bu yüzden bildirim hacmini artırırlar. Bir hafta sonra tutunma düşer ve iptal şikayetleri artar. Ne oldu?

Orijinal desen gerçekti—ama yanıltıcıydı. En ilgili kullanıcılar doğal olarak daha fazla bildirim tetikler (ürünü daha fazla kullandıkları için) ve aynı zamanda daha sık geri dönerler. Bildirimler tutunmayı neden olmadı; etkileşim her ikisini de neden oluyordu. Ekip korelasyona göre hareket etti ve istemeden daha kötü bir deneyim yarattı.

“Nedensel düşünme” ne demektir (sade bir dille)

Nedensel düşünme, şu soruyu sorma alışkanlığıdır: ne neyi neden olur ve bunu nasıl bilebiliriz? “Bu iki şey birlikte mi hareket ediyor” ile yetinmek yerine şunları ayırmaya çalışırsınız:

Gözlemlediğiniz sinyaller (loglarda, metriklerde, grafiklerde gördükleriniz)
Çekebileceğiniz kollar (gerçekte değiştirebilecekleriniz)
Yan etkiler ve gizli etkiler (her ikisini de etkileyen diğer faktörler)

Bu veriye şüpheci bakmak değil—soru konusunda spesifik olmaktır. “Bildirimler ile tutunma korelasyonlu mu?” sorusu, “Daha fazla bildirim göndermek tutunmayı artırır mı?” sorusundan farklıdır. İkinci soru nedenseldir.

Bunun anında işe yaradığı yerler

Bu yazı desen bulmanın sıkça başarısız olduğu üç pratik alana odaklanıyor:

Yapay Zeka sistemleri: Bir model tahmin yaparken doğru nedenleri mi kullanıyor yoksa yalnızca kestirme yollara mı dayanıyor, bunu anlama.
Hata ayıklama: Metrikler gerilediğinde veya olaylar olduğunda, en yüksek rastlantıyı kovalamak yerine gerçek kök nedeni bulma.
Ürün kararları: Sadece yüksek performanslı kullanıcı segmentlerine “uygun” değişiklikler yapmak yerine sonuçları gerçekten hareket ettirecek değişiklikleri seçme.

Bu makaleden ne beklemelisiniz

Bu, nedensel çıkarımın matematiksel açıdan ağır bir turu değil. Değer almak için do-calculus notasyonunu öğrenmenize gerek yok. Amaç, ekibinizin kullanabileceği zihinsel modeller ve bir iş akışı seti sunmak:

daha iyi sorular formüle etmek,
karıştırma gibi yaygın tuzaklardan kaçınmak,
deney mi yoksa dikkatli gözlemsel akıl yürütme mi gerektiğine karar vermek.

Eğer verilerde “iyi görünüp” gerçekte işe yaramayan bir değişiklik göndermişseniz, nedensel düşünme eksik olan bağlantıdır.

Judea Pearl Kimdir ve Ne Değiştirdi?

Judea Pearl, bilgisayar bilimci ve bilim felsefecisidir; çalışmaları birçok ekip için veri, yapay zeka ve karar verme şekillerini yeniden şekillendirdi. Onun nedensel devriminden önce, bilgisayarda “veriden öğrenme” çoğunlukla istatistiksel ilişkiler üzerine kuruluydu: desenleri bulun, modelleri uydurun, ne olacağını tahmin edin. Bu yaklaşım güçlüdür—ama sorunuz cümlesinde "çünkü" kelimesi olduğunda genellikle başarısız olur.

Pearl’in ana değişimi, nedenselliği birinci sınıf bir kavram olarak ele almaktı; yalnızca korelasyonların üstüne eklenmiş bulanık bir sezgi değil. "X yüksek olduğunda Y de yüksek mi?" demek yerine, nedensel düşünme "Eğer X'i değiştirirsek Y değişir mi?" diye sorar. Bu fark küçük görünse de tahmin ile karar verme arasındaki ayrımı yaratır.

İlişkilendirmeden nedensel sorulara

İlişki "ne birlikte olur"u yanıtlar. Nedensellik ise "müdahale edersek ne olur"u cevaplamayı amaçlar. Bu, ürün ve mühendislikte önemlidir çünkü birçok gerçek karar müdahaledir: bir özelliği yayınlamak, sıralamayı değiştirmek, bir koruma eklemek, eğitim setini ayarlamak veya bir politikayı güncellemek.

Büyü yok: tartışılabilir varsayımlar

Pearl, nedenselliği bir modelleme seçimi ve açık varsayımlar olarak çerçevelendirerek daha uygulanabilir hale getirdi. Genel olarak veriden otomatik olarak nedenselliği “keşfetmezsiniz”; bir nedensel hikâye önerirsiniz (genellikle alan bilgisine dayanarak) ve sonra veriyi bunu test etmek, tahmin etmek ve düzeltmek için kullanırsınız.

Pearl’in popülerleştirdiği temel araçlar

Nedensel grafikler (DAG'lar): Varsayılan neden-sonuç ilişkilerini kodlayan basit diyagramlar.
Müdahaleler (“do”): Bir değişkeni gözlemlemek değil, aktif olarak ayarladığınızda ne değişeceğini düşünme.
Karşıt durumlar (counterfactuals): “Bu özel vaka için başka bir şey yapsaydık ne olurdu?”

Bu araçlar, ekiplerin desen bulmaktan net ve disiplinli bir şekilde nedensel soruları yanıtlamaya geçmeleri için ortak bir dil verdi.

Korelasyon vs Nedensellik: Gerçekte Sorduğunuz Soru

Korelasyon, iki şeyin birlikte hareket ettiği anlamına gelir: biri yükseldiğinde diğerinin de yükselme (ya da düşme) eğilimi vardır. Bu son derece kullanışlıdır—özellikle veri ağırlıklı ekiplerde—çünkü tahmin ve tespit için yardımcı olur.

Dondurma satışları sıcaklık yükseldiğinde artıyorsa, korele sinyal (sıcaklık) tahminleri iyileştirebilir. Ürün ve yapay zeka çalışmalarında korelasyonlar sıralama modellerini, anomalileri ve hızlı teşhisleri güçlendirir.

Sorun, korelasyonu farklı bir sorunun cevabı gibi kabul ettiğimizde başlar: Bir şeyi kasıtlı olarak değiştirirsek ne olur? İşte bu nedenselliktir.

“Eğer X'i değiştirirsek ne olur?” için neden korelasyon yetersizdir

Bir korele ilişki üçüncü bir faktör tarafından her iki değişkenin de etkilenmesiyle oluşabilir. X'i değiştirmek Y'yi değiştirmez—çünkü X, Y'nin hareket etmesinin nedeni olmayabilir.

Basit bir karıştırıcı örneği: pazarlama harcaması vs satışlar

Haftalık pazarlama harcaması ile haftalık satışları çizdiğinizi ve güçlü bir pozitif korelasyon gördüğünüzü varsayın. "Daha çok harcama daha çok satışa neden olur" demek cazip gelebilir.

Ama her ikisinin de tatiller sırasında arttığını farz edin. Mevsimsellik (bir karıştırıcı) hem talebi artırır hem de daha büyük bütçeleri tetikler. Tatil olmayan bir haftada harcamayı artırırsanız, satışlar pek yükselmeyebilir—çünkü alttaki talep yoktur.

Gerçekte nedensel bir soru sorduğunuzu gösteren işaretler

Kendinizi şu soruları sorarken buluyorsanız nedensel alandasınız:

“Eğer X'i artırırsak/azaltırsak, Y ne olur?”
“Bu özelliği yayınlamalı mıyız yoksa eski haliyle mi bırakmalıyız?”
“Hangi değişiklik churn'u azaltır, sadece tahmin etmez?”
“Bu kampanya çalıştı mı, yoksa satışlar zaten artıyor muydu?”
“Bir adımı kaldırmanın, uyarı eklemenin veya fiyatlandırmayı değiştirmenin etkisi ne olur?”

Fiilin değiştirmek, yayınlamak, kaldırmak veya azaltmak olduğu durumlarda korelasyon bir başlangıç ipucudur—karar kuralı değildir.

Ekip İletişimi için Nedensel Diyagramlar (DAG'lar)

Bir nedensel diyagram—genellikle DAG (Yönlendirilmiş Döngüsüz Grafik) olarak çizilir—ekibin varsayımlarını görünür kılmanın basit bir yoludur. “Model olmuş olabilir” veya “Belki UI” gibi belirsiz tartışmalar yerine hikâyeyi kağıda aktarırsınız.

Düğümler ve oklar: temel gramer

Düğümler ilgilendiğiniz değişkenlerdir: gönderilen pazarlama e-postası, kullanıcı niyeti, model skoru, satın alma gibi.
Yönlü oklar nedensel etkiyi gösterir: A'yı değiştirmenin B'yi değiştireceğini düşünüyorsanız A → B çizersiniz.

Amaç mükemmel gerçeği yakalamak değil; “sistemin nasıl çalıştığını düşündüğümüz” konusunda paylaşılan bir taslaktır.

Karıştırıcılar, aracılar ve çarpışıcılar (küçük bir örnekle)

Diyelim ki yeni bir onboarding eğitimi (T)'nin aktivasyonu (A) artırıp artırmadığını değerlendiriyorsunuz.

Karıştırıcı: kullanıcı motivasyonu (M) hem eğitimi tamamlamayı hem de aktivasyonu etkiler: M → T ve M → A. M'yi görmezden gelirseniz etkiyi motivasyona mal edersiniz.
Aracı (mediator): eğitim, ürün anlayışını (U) artırabilir ve bu da aktivasyonu yükseltir: T → U → A. U mekanizmanın bir parçasıdır.
Çarpışıcı: sadece destekle iletişime geçen (S) kullanıcıları analiz ediyorsanız, hem kafa karışıklığı hem motivasyon destek taleplerini artırır: U → S ← M. S üzerinde koşullamak U ile M arasında yanıltıcı bir bağlantı yaratabilir ve T'nin A üzerindeki etkisini çarpıtabilir.

“Her şeyi ayarlamak” neden geri tepebilir

Analitik refleks genellikle mevcut tüm değişkenleri kontrol etmektir. DAG terimleriyle bu, yanlışlıkla:

Aracıları kontrol etmek (ölçmek istediğiniz etkinin bir kısmını gizleyebilir), veya
Çarpışıcıları kontrol etmek (yeni bir yanlılık yaratabilir) anlamına gelebilir.

DAG ile değişkenleri bir sebeple kontrol edersiniz—genellikle karıştırıcı yollarını kapatmak için—varlar diye değil.

Toplantıda ilk grafiği nasıl çizersiniz

Bir beyaz tahta ve üç adımla başlayın:

Sonucu sağa yazın (örn. aktivasyon), önerilen nedeni sola koyun (örn. eğitim).
Sorun: “Her ikisini de ne daha olası kılıyor?” (karıştırıcılar) ve “Ortada ne var?” (aracılar).
Analizde neye göre koşulladığınızı işaretleyin (filtreler, kohortlar, uygunluk kuralları). Bunlar genellikle çarpışıcıları saklar.

Kaba bir DAG bile ürün, veri ve mühendisliği aynı nedensel soru etrafında hizalar.

Müdahaleler: “Gör” Değil “Yap” Düşünmek

Pearl’in nedensel düşüncesindeki büyük kayma, gözlemleme ile değiştirmeyi ayırmaktır.

Eğer bildirimleri etkinleştiren kullanıcıların daha iyi tutunduğunu gözlemlerseniz, bir desen öğrenmişsiniz demektir. Ama bildirimlerin tutunmaya neden olup olmadığını hâlâ bilmiyorsunuz; belki ilgili kullanıcılar sadece bildirimleri açmaya meyillidir.

Bir müdahale, bir değişkeni aktif olarak belirlemeniz ve sonra ne olduğunu gözlemlemeniz demektir. Ürün terimleriyle bu, “kullanıcıların X'i seçmesi” değil, “biz X'i gönderdik” demektir.

“Do” vs “See” (matematik olmadan)

Pearl bu farkı şöyle özetler:

See: “Bildirimlerin açık olduğunu fark ettik.”
Do: “Bildirimleri AÇTIK (veya varsayılan yaptık) ve şimdi etkisini ölçüyoruz.”

“Do” fikri, bir değişkenin değer almasının olağan nedenlerini kırdığınızın zihinsel bir notudur. Müdahale ettiğinizde bildirimler, ilgili kullanıcıların seçimi yüzünden değil sizin ayarlamanızla açık olur; amaç budur: müdahaleler nedenselliği izole etmeye yardımcı olur.

Müdahaleler ürün kararlarının gerçekte nasıl yapıldığını gösterir

Çoğu ürün işi birer müdahaledir:

Özellik lansmanları ve UI değişiklikleri
Sıralama veya öneri politikası ayarları
Fiyatlandırma ve paketleme güncellemeleri
Dolandırıcılık kuralları, moderasyon eşikleri veya kredi politikaları

Bu eylemler sonuçları değiştirmeyi hedefler; sadece tanımlamayı değil. Nedensel düşünme soruyu dürüst tutar: “Bunu yaparsak neyi değiştirir?”

Amaç: müdahaleler de varsayımlara ihtiyaç duyar

Bir müdahaleyi yorumlamak (veya iyi bir deney tasarlamak) için hangi şeylerin neyi etkilediğine dair varsayımlar—yani nedensel diyagram—gereklidir. Örneğin, mevsimsellik hem pazarlama harcamasını hem de kayıtları etkiliyorsa, mevsimselliği hesaba katmadan bir harcama değişikliği yapmak yine yanıltıcı olabilir. Müdahaleler güçlüdür ama alttaki nedensel hikâye en azından kabaca doğru olduğunda nedensel sorulara yanıt verir.

Karşıt Durumlar: Tek Bir Vaka İçin “Ya Olsaydı?” Sorusunu Yanıtlamak

Testi oluşturun, hikâyeyi değil

Bir nedensel hipotezi ölçülebilir bir varyanta dönüştürün, haftalarca süren kurulum gerektirmeden.

Ücretsiz Deneyin

Karşıt durum, belirli bir tür “ya olsaydı?” sorusudur: bu tam vaka için, farklı bir eylem yapsaydık ne olurdu? Bu "ortalama ne olur" değil—"bu kişi, bu bilet, bu işlem için ne olurdu?"

Takımların ilgilenme nedenleri: geri bildirim, adalet ve destek

Karşıt durumlar şu durumlarda çıkar:

Kullanıcı geri bildirimi: “Onaylanmak için neyi değiştirmem gerek?”
Adalet araştırmaları: “Bu adayın nitelikleri aynı olsa ama hassas bir özellik farklı olsaydı karar değişir miydi?”
Destek ve hata ayıklama: “Kullanıcı sistemin ‘mantıksız’ olduğunu söylüyor—hangi giriş değişikliği tahmini tersine çevirirdi?”

Bu sorular kullanıcı düzeyindedir ve ürün değişiklikleri, politikalar ve açıklamalar için yol gösterir.

Yapay zekâ örneği

Bir kredi modeli başvuru reddederse, korelasyona dayalı açıklama “Düşük tasarruf reddedilme ile korelasyonlu” diyebilir. Bir karşıt durum şöyle sorar:

Eğer başvuranın tasarrufları 3.000$ daha fazla olsaydı (başka her şey aynı kalsaydı), model onaylar mıydı?

Cevap “evet” ise eyleme geçirilebilir bir bilgi elde etmiş olursunuz: kararı tersine çevirecek makul bir değişiklik. Cevap “hayır” ise yanlış bir tavsiye vermekten kaçınırsınız; gerçek engel borç/gelir oranı veya istikrarsız istihdam olabilir.

Sınırlama: karşıt durumlar veride “hazır” değildir

Karşıt durumlar bir nedensel modele dayanır—değişkenlerin nasıl etkileştiğine dair bir hikâye—sadece veri setine değil. Ne değiştirmenin mümkün olduğunu, bunun neleri sonuçlandıracağını ve nelerin sabit kalacağını belirlemelisiniz. Nedensel yapı olmadan karşıt durumlar imkansız senaryolar üretebilir ve yanıltıcı öneriler doğurabilir.

Yapay Zeka Güvenilirliği ve Hata Ayıklama için Nedensel Düşünme

Bir ML modeli üretimde başarısız olduğunda kök nedeni nadiren “algoritma bozuldu” olur. Çoğunlukla sistemde neler değişti: toplanan veriler, etiket üretimi veya kullanıcı davranışları. Nedensel düşünme, tahminde bulunmayı bırakıp hangi değişikliğin neden bozduğunu izole etmeye yardımcı olur.

Ortak başarısızlık modları (ve neden metrikleri yanıltırlar)

Bazı tekrar eden sorunlar:

Yanıltıcı kestirmeler: model, eğitimde etiketle korele olan (ama gerçek sinyal olmayan) kolay bir vekili öğrenir (filigranlar, arka plan rengi, ifade kalıpları).
Veri kayması: veri üreten süreç değişir (yeni kullanıcı segmentleri, yeni UI, mevsimsellik), bu yüzden eğitimdeki ilişki artık geçerli olmaz.
Sızıntı (leakage): özellikler yanlışlıkla etiketin (veya etiketleme sürecinin) sonrasındaki bilgileri içerir, offline performansı şişirir.

Toplam panolarda korelasyon yüksek kalabildiği için bu durumlar “iyi” görünebilir; ama modelin doğru olma nedeni değişmiştir.

Bir kestirmeyi ortaya çıkaracak nedensel grafik

Basit bir DAG, hata ayıklamayı bir haritaya çevirir. Bu, şunu sormanızı sağlar: bu özellik etiketin bir nedeni mi, sonucu mu yoksa ölçüm şeklinin bir sonucu mu?

Örneğin, Etiketleme politikası → Özellik mühendisliği → Model girdileri ise boru hattınızı modelin altında yatan olgu yerine politikayı tahmin edecek şekilde kurmuş olabilirsiniz. Bir DAG bu yolu görünür kılar; böylece özelliği kaldırmak, enstrümantasyonu değiştirmek veya etiketi yeniden tanımlamak gibi yollarla bu yolu kapatabilirsiniz.

Hata ayıklama için müdahaleler ("X'i değiştirin ve Y'yi görün" düşünün)

Sadece tahminleri incelemek yerine kontrollü müdahaleler deneyin:

Hedefli veri düzenlemeleri: arka planları değiştirin, filigranları kaldırın, zaman damgalarını bozun—sonra çıkarımı yeniden çalıştırın.
Ablasyonlar: şüpheli vekil özellikleri çıkarın ve hatalardaki nedensel etkisini ölçün.
Karşıt dilimleri: cihaz türü veya yerel gibi tek bir faktörü sabit tutup diğerlerini sabitleyerek duyarlılığı test edin.

Kontrol listesi: performans düştüğünde sorulacak nedensel sorular

Bu duruma neden olmuş olabilecek yukarı akış değişikliği nedir (ürün, loglama, kullanıcı davranışı, etiketleme politikası)?
Hangi özellikler etiketin ya da etiketleme sürecinin sonucu olabilir (sızıntı riski)?
Hangi karıştırıcı hem özelliği hem sonucu açıklayabilir (örn. bölge hem dili hem dönüşümü etkiler)?
Şüpheli faktörü izole etmek için hangi müdahaleyi güvenle çalıştırabiliriz?
Kestirmeyi kaldırırsak, gerçek sinyal → tahmin arasındaki nedensel yol hâlâ var mı?

Açıklamalardan Nedensellere: AI “Açıklanabilirliği” Neyi Kaçırır

Varyantları anlık görüntülerle karşılaştırın

Riskli değişikliklerden önce bilinen iyi bir durum yakalayın ve sonuçları temizce karşılaştırın.

Anlık Görüntüleri Kullan

Birçok “açıklanabilirlik” aracı dar bir soruyu yanıtlar: Model bu skoru neden verdi? Genellikle bunu etkili girdileri vurgulayarak yaparlar (özellik önemi, saliency haritaları, SHAP değerleri). Bu faydalı olabilir—ama modelin içinde bulunduğu sistemi açıklamaz.

Bir tahmini açıklamak vs bir sistemi açıklamak

Bir tahmin açıklaması yerel ve betimleyicidir: “Bu kredi reddedildi çünkü gelir düşüktü ve kullanım yükü yüksekti.”

Bir sistem açıklaması ise nedenseldir ve operasyoneldir: “Doğrulanmış geliri (veya kullanımı) gerçek bir müdahale ile artırırsak, karar değişir mi ve sonuçlar düzelir mi?”

İlki modeli yorumlamaya yardımcı olur. İkincisi ne yapmanız gerektiğini söyler.

Nedensel modeller açıklamaların anlamını nasıl değiştirir

Nedensel düşünme açıklamaları müdahalelerle ilişkilendirir. Hangi değişkenlerin korelasyon gösterdiğini sormak yerine, hangi değişkenlerin gerçek kollar olduğunu ve bunların değiştirildiğinde hangi etkileri üreteceğini sorarsınız.

Bir nedensel model sizi şunları açıkça yapmaya zorlar:

Neye müdahale edilebileceğini (fiyatlandırma, mesajlaşma, eşikler, UI)
Nelerin sadece gözlemlendiğini (kullanıcı niyeti, ekonomik koşullar)
Nelerin karıştırılmış olduğunu (gizli bir faktörün hem girdiyi hem sonucu etkilemesi)

Bu önemlidir çünkü “önemli bir özellik” tahmin için faydalı ama eylem için tehlikeli bir vekil olabilir.

Korelasyona dayalı sonradan yapılmış açıklamaların riski

Sonradan yapılan açıklamalar ikna edici görünebilir ama tamamen korelasyonel kalabilir. Eğer “destek talepleri sayısı” churn'i güçlü şekilde tahmin ediyorsa, bir özellik önem grafiği ekibi destek erişimini zorlaştırmaya ve böylece ticket sayısını azaltmaya teşvik edebilir. Bu tür bir müdahale churn'i artırabilir, çünkü ticket'ler ürün sorunlarının semptomudur—neden değil.

Korelasyona dayalı açıklamalar ayrıca dağılım kaydığında kırılgandır: kullanıcı davranışı değişince aynı vurgulanan özelliklerin anlamı da değişebilir.

Nedensel açıklamaların değer kazandığı yerler

Kararlar sonuç ve hesap verebilirlik gerektirdiğinde nedensel açıklamalar özellikle değerlidir:

Denetimler: müdahaleler ve adalet duyarlı yollar açısından kararları gerekçelendirin.
Olay incelemeleri: bir şey kırıldığında kök nedenleri ilişkili sinyallerden ayırın.
QA ve izleme: dağıtmadan önce ve sürüklenme sonrası “ya olursa” değişikliklerini test edin.

Harekete geçmeniz gerektiğinde, açıklama bir nedensel omurgaya ihtiyaç duyar.

Deneyler, A/B Testleri ve Rastgeleleştiremiyorsanız Ne Yapmalı

A/B testi en basit ve en pratik haliyle nedensel çıkarımdır. Kullanıcıları rastgele A veya B'ye atadığınızda bir müdahale yapmış olursunuz: insanların seçtiği şeyi gözlemlemek yerine onlara ne gösterildiğini ayarlarsınız. Pearl’in terimleriyle, rastgeleleştirme “do(variant = B)”’yi gerçeğe dönüştürür—bu yüzden sonuç farkları değişikliğe bağlanabilir.

Rastgeleleştirmenin gücü

Rastgele atama, gizli kullanıcı özellikleri ile maruziyet arasındaki birçok bağlantıyı kırar. Güç kullanıcılar, yeni kullanıcılar, günün saati, cihaz türü—bu faktörler hâlâ vardır ama gruplar arasında (ortalama olarak) dengelenir. Bu denge, bir metrik farkını nedensel bir iddiaya dönüştürür.

Deneylerin zor olduğu durumlar

Temiz rastgele testler her zaman mümkün değildir:

Küçük örneklem: düşük trafik sonuçları gürültülü ve yavaş yapar.
Uzun vadeli etkiler: tutunma, güven ve churn aylar alabilir.
Etkileşim (interference): bir kullanıcının tedavisi diğerini etkiler (sosyal paylaşım, pazar dinamikleri).
Etik ve güvenlik: zararlı deneyler veya adaletsiz politikalar rastgele test edilemez.
Operasyonel kısıtlar: platform limitleri, yasal kurallar veya ortak bağımlılıklar.

Bu durumlarda yine de nedensel düşünebilirsiniz—ancak varsayımlarınızı ve belirsizliği açıkça belirtmelisiniz.

Yarı-deneysel alternatifler (yüksek seviyede)

Yaygın seçenekler arasında difference-in-differences (zaman içinde grup farklarını karşılaştırma), regression discontinuity (bir eşik kuralı kullanma), instrumental variables (maruziyeti doğrudan değiştiren ama sonucu doğrudan etkilemeyen doğal bir dürtü) ve matching/weighting (grupları daha karşılaştırılabilir kılma) vardır. Her yöntem rastgeleleştirmeyi varsayımlarla değiştirir; bir nedensel diyagram bu varsayımları netleştirmenize yardımcı olur.

“Başarı”yı önceden kaydedin

Bir testi (veya gözlemsel çalışmayı) başlatmadan önce birincil metriği, korumaları, hedef popülasyonu, süresini ve karar kuralını yazın. Ön kayıt yanlılığı ortadan kaldırmaz ama metrik avcılığını azaltır ve nedensel iddiaları daha güvenilir—ve ekip içinde tartışılması daha kolay—hale getirir.

Nedensel Soruları Ürün Kararlarına Dahil Etmek

Çoğu ürün tartışması şöyle duyar: “Y metrik Y değişti, Y çalıştı.” Nedensel düşünme bunu netleştirir: “Y değişikliğinin X'i hareket ettirmesine sebep oldu mu ve ne kadar?” Bu kayma panoları kanıt olmaktan çok başlangıç noktası yapar.

Üç yaygın karar, nedensel sorulara yeniden yazılmış

Fiyat değişikliği: “Fiyatı %10 artırmanın mevsimselliği sabit tutarak ücretli dönüşüm, churn ve destek talepleri üzerindeki etkisi nedir?”

Onboarding ayarı: “Onboarding'i 6 adımdan 4 adıma kısaltırsak, yeni kullanıcıların aktivasyonu ve 4. haftadaki tutunması ne olur?”

Öneri sıralama değişikliği: “Tazeliği öne çıkarırsak uzun vadeli memnuniyet (geri dönüşler, gizlemeler, abonelik iptalleri) üzerinde etkisi ne olur, sadece tıklara bakmayalım?”

Karıştırıcıların panolara nasıl sızdığı

Panolar genellikle “değişikliği kim aldı” ile “zaten iyi performans gösterecek olan kim”i karıştırır. Klasik örnek: yeni onboarding akışını yayınladınız ama ilk önce yeni uygulama sürümünü kullananlara gösterildi. Yeni sürümleri benimseyenler daha ilgili olabilir; grafik yükselişinin bir kısmı (veya tamamı) onboarding değil sürüm benimsemesi yüzünden olabilir.

Diğer sık karıştırıcılar:

Mevsimsellik ve kampanyalar (promosyon hem kayıtları hem dönüşümü artırır)
Kullanıcı karışımı değişimleri (bu ay daha fazla kurumsal lead)
Destek yükü (kesintiler ticket'ları artırır ve tutunmayı düşürür)

PRD'lere nedensel sorular ekleyin (ekibin hizalanması için)

Yararlı bir PRD bölümü gerçekten “Nedensel Sorular” başlıklı olabilir ve şunları içerebilir:

Birincil: “Ne değiştiriyoruz ve bunun neyi etkilemesi bekleniyor?”
Korumalar: “Bu işe yararsa ne kötüleşmemeli?”
Karıştırıcılar: “Aynı zamanda metriği hangi diğer şeyler hareket ettirebilir?”
Ölçüm planı: “Deney, tutma, kademeli açılma veya eşleştirilmiş karşılaştırma mı?”

Hızlı geliştirme döngüsü kullanıyorsanız (özellikle LLM destekli gelişimle), bu bölüm daha da önem kazanır: “hızlı yayınlayabiliriz”un “ne yaptığımızın etkisini bilmeden yayınladık”a dönüşmesini engeller. Koder.ai'da inşa eden ekipler genellikle bu nedensel soruları planlama moduna baştan entegre eder, ardından hızlıca feature-flag'li varyantlar uygular, snapshot/rollback ile sonuçlar şaşırttığında güvenli geri dönüş sağlar.

PM, veri, mühendislik ve destek arasında hizalama

PM karar ve başarı kriterlerini tanımlar. Veri ortakları bunu ölçülebilir nedensel tahminlere ve kontrolleri çevirir. Mühendislik değişikliğin kontrol edilebilir olmasını sağlar (feature flagler, temiz maruziyet loglama). Destek nitel sinyaller paylaşır—fiyat değişiklikleri genellikle “çalışıyor” gibi görünür ama sessizce iptalleri veya ticket hacmini artırabilir. Herkes nedensel soru üzerinde anlaştığında, gönderme öğrenme olur—sadece gönderme değil.

Pratik Bir İş Akışı: Ekip Araç Kutusuna Nedenselliği Ekleyin

PRD'nize nedensel sorular ekleyin

Planning Mode ile dağıtımdan önce müdahaleyi, metrikleri ve korumaları yazın.

Planlamaya Başla

Nedensel düşünme doktora seviyesinde bir uygulama gerektirmez. Bunu bir ekip alışkanlığı olarak görün: nedensel hikâyenizi yazın, test edin, sonra veri (ve mümkünse deneyler) ile doğrulayın veya düzeltin.

Sonuçlar hakkında tartışmadan önce ihtiyacınız olanlar

İlerlemek için önden dört girdi toplayın:

Bir grafik: kilit değişkenlerin hızlı nedensel diyagramı (DAG).
Varsayımlar: neyin neyi yönettiğine dair inançlarınız ve neyi görmezden geldiğinize dair seçimleriniz.
Veri kaynakları: her değişkenin nereden geldiği (loglar, CRM, anketler) ve bilinen boşluklar.
Doğrulama planı: varsayımları nasıl kontrol edeceğiniz (A/B testi, doğal deney, duyarlılık kontrolleri, uzman incelemesi).

Hafif bir süreç: taslağı çiz → eleştir → test et → yinele

Taslak: bir soruyu cevaplayacak en basit diyagramı çizin (örn. “Onboarding e-postaları hafta-4 tutunmasını artırır mı?”).
Eleştir: ekipçe gözden geçirin: analitik, PM, mühendislik ve kullanıcıya yakın birini dahil edin.
Varsayımları test edin: karıştırma, seçim etkileri ve "eksik oklar" için bakın. Mümkünse küçük bir deney tasarlayın.
Yineleyin: öğrendikçe diyagramı ve ölçüm planını güncelleyin.

Pratikte hız önemlidir: bir nedensel soruyu kontrollü bir değişikliğe çevirme hızınız ne kadar yüksekse, belirsiz desenler üzerinde tartışmak için harcadığınız zaman o kadar az olur. Bu yüzden ekipler Koder.ai gibi platformları kullanarak “hipotez + plan”dan çalışan, enstrümante edilmiş bir uygulamaya (web, backend veya mobil) günler içinde geçebiliyor—aynı zamanda kademeli açılışlar, dağıtımlar ve rollback ile titizliği koruyorlar.

Bir nedensel diyagram inceleme şablonu (kopyala/yapıştır)

Karar / müdahale: Hangi aksiyon alınabilir?
Sonuç: Ne değiştirmeyi amaçlıyoruz?
Ana nedensel yol: Müdahale sonucu nasıl etkiler?
Karıştırıcılar: Hem müdahaleyi hem sonucu ne etkiliyor?
Aracılar: Ortada ne var (bunları yanlışlıkla kontrol etmeyin)?
Çarpışıcılar / seçim filtreleri: Koşullama nerede sahte ilişkiler yaratabilir?
Ölçüm notları: Değişkenler nasıl gözlemleniyor; ne eksik veya gürültülü?
Önerilen kontrol: Deney? Yarı-deneysel yöntem? Duyarlılık analizi?

Eğer deneyler konusunda bir tazeleme isterseniz, /blog/ab-testing-basics'e bakın. Ürün metriklerinde “etkiyi taklit eden” yaygın tuzaklar için /blog/metrics-that-mislead'e bakın.

Temel Çıkarımlar ve Sonraki Adımlar

Nedensel düşünme, “ne birlikte hareket etme eğiliminde?” sorusundan “hareket edersek ne değişir?” sorusuna kayıştır. Bu kayma—Judea Pearl tarafından bilgisayar bilimi ve istatistikte popüler hale getirildi—ekiplerin gerçek dünyada müdahalelerle hayatta kalmayan kendinden emin hikâyelerden kaçınmasına yardımcı olur.

Ana çıkarımlar (4–6 satır)

Korelasyon bir ipucudur, cevap değildir.

Nedensel diyagramlar (DAG'lar) varsayımları görünür ve tartışılabilir kılar.

Müdahaleler (“do”) gözlemlerden (“see”) farklıdır.

Karşıt durumlar tek vakaları açıklamaya yardımcı olur: “bu bir şey farklı olsaydı ne olurdu?”

İyi nedensel çalışma belirsizliği ve alternatif açıklamaları belgelemelidir.

Bu hafta başlayın: küçük, pratik bir kontrol listesi

Bir toplantı (45 dakika): Bir yüksek öncelikli soruyu seçin (örn. “Bu özellik churn'u azaltır mı?”) ve bunu bir müdahale olarak yeniden yazın: “Eğer X yaparsak Y nasıl değişir?”
Bir diyagram (15–30 dakika): Beyaz tahta üzerinde basit bir DAG çizin: müdahale, sonuç ve 3–6 olası her iki tarafı etkileyen neden. Ölçebildiklerinizi ve eksikleri işaretleyin.
Bir test (bu sprint): En güçlü uygulanabilir kontrolü seçin—rastgeleleştirme mümkünse A/B testi, değilse dikkatli bir yarı-deneysel karşılaştırma. Hangi sonuç kararınızı değiştireceğini önceden belirleyin.

Şemsiye uyarısı: düzgün diyagramları gerçeğe karıştırmayın

Nedensellik dikkat ister: gizli karıştırıcılar, ölçüm hataları ve seçim etkileri sonuçları ters çevirebilir. Çözüm şeffaflıktır—varsayımları yazın, kullandığınız veriyi gösterin ve iddianızı çürütecek neyin olacağını not edin.

Daha derine inmek isterseniz /blog'daki ilgili yazılara göz atın ve nedensel yaklaşımları diğer analitik ve “açıklanabilirlik” yöntemleriyle karşılaştırarak her birinin nerede yardımcı olduğunu ve nerede yanıltıcı olabileceğini görün.

SSS

Ürün ve yapay zeka çalışmalarında korelasyon ile nedensellik arasındaki pratik fark nedir?

Korelasyon size tahmin veya tespit yapmada yardımcı olur (ör. “X yükseldiğinde Y genellikle yükselir”). Nedensellik ise bir karar sorusunu yanıtlar: “Eğer X'i kasıtlı olarak değiştirirsek, Y değişir mi?”

Korelasyonu tahminleme ve izleme için, nedensel düşünmeyi ise bir değişiklik göndereceğiniz, politika belirleyeceğiniz veya bütçe ayıracağınız zaman kullanın.

Takım daha fazla bildirim gönderince neden “daha fazla bildirim = daha yüksek tutunma” örneği başarısız oldu?

Çünkü korelasyon karıştırıcı tarafından yönlendiriliyor olabilir. Bildirim örneğinde, çok ilgili kullanıcılar hem daha fazla bildirim tetikler/asıldır hem de daha sık geri döner.

Herkese daha fazla bildirim gönderirseniz, deneyimi (bir müdahale) değiştirirsiniz ama temel etkileşimi değiştirmezsiniz—bu yüzden tutunma artmayabilir, hatta kötüleşebilir.

Causal diyagram (DAG) nedir ve bir takım neden bunu çizmelidir?

Bir DAG (Yönlendirilmiş Döngüsüz Grafik), şöyle bir diyagramdır:

düğümler ilgilendiğiniz değişkenlerdir
oklar “A, B'yi etkiler” anlamına gelir (A değiştirildiğinde B değişecekse)

Takımın neden hangi değişkenleri kontrol edeceği, hangilerini kontrol etmemesi gerektiği ve hangi deneyin soruyu gerçekten yanıtlayacağı konusunda varsayımları açık hale getirir.

Karıştırıcılar, aracı değişkenler ve çarpışıcılar nedir ve neden önemlidir?

Karıştırıcı (confounder): hem önerilen nedeni hem de sonucu etkiler (yanıltıcı bir ilişki yaratır).
Ara değişken (mediator): neden → sonuç yolunun ortasında yer alır (etkinin bir parçasıdır).
Çarpışıcı (collider): iki değişkenin neden olduğu bir şeydir; buna göre filtre uygularsanız sahte bir ilişki oluşturabilirsiniz.

Yaygın hata “her şeye kontrol et” refleksidir; bu, yanlışlıkla ara değişkenleri veya çarpışıcıları kontrol ederek sonuçları yanlılaştırabilir.

Matematik olmadan “do vs see” ne demektir?

“See” doğal olarak olanı gözlemlemektir (kullanıcılar tercih etti). “Do” ise bir değişkeni aktif olarak ayarlamaktır (özelliği yayınlamak, varsayılanı değiştirmek).

Önemli fikir: bir müdahale bir değişkenin alacağı değerin olağan sebeplerini kırar, bu yüzden gözlemlerden daha güvenilir şekilde nedensellik açığa çıkabilir.

Karşıt durum (counterfactual) nedir ve ne zaman kullanışlıdır?

Karşıt durum (counterfactual) sorar: bu özel vaka için, başka bir şey yapsaydık ne olurdu?

Kullanım alanları:

geri bildirim hakları: “Onaylanmak için neyi değiştirmem gerekir?”
adalet incelemeleri: “Eğer hassas bir özellik farklı olsaydı karar değişir miydi?”
hata ayıklama: “Bu tahmini tersine çevirecek en küçük değişiklik ne olurdu?”

Olur, ancak bunun için bir nedensel modele ihtiyacınız vardır; aksi halde imkânsız senaryolar üretebilirsiniz.

Bir ML modelinin üretimde performansı düşerse nedensel düşünme nasıl yardımcı olur?

Üretimde bir ML modeli başarısız olduğunda, sorun nadiren “algoritma bozuldu” olur. Genellikle sistemin bir yerinde veri, etiketleme ya da kullanıcı davranışı değişmiştir.

Nedensel düşünme sizi tahmin etmeyi bırakıp hangi değişikliğin bozulmaya neden olduğunu izole etmeye iter:

veri kayması
modelin öğrendiği uydurma kestirmeler
özellik sızıntısı

Hedefli müdahaleler (ablasyonlar, perturbasyonlar) deneyin; tesadüfi metrik hareketlerini kovalamayın.

Nedensellik olmadan model “açıklanabilirliği” neden yanıltıcı olabilir?

Açıklanabilirlik araçları genellikle dar bir soruyu cevaplar: “Model bu skoru neden verdi?” Önemli olabilir—ama modelin oturduğu sistemi açıklamaz.

Bir tahmin açıklaması yereldir ve betimleyicidir. Nedensel bir açıklama ise operasyoneldir: “Doğrulanmış geliri artırırsak (ve bunu gerçek bir müdahaleyle yaparsak) karar değişir mi ve sonuçlar düzelir mi?”

Önemli olan, hangi değişkenlerin gerçekten müdahale edilebilir kaldığını ve hangi özelliklerin sadece proxy (tahmin için yararlı, eylem için tehlikeli) olduğunu açıkça göstermektir.

Ne zaman A/B testi yapmalıyız ve rastgeleleştiremiyorsak ne yapmalıyız?

Rastgele atanmış A/B testleri mümkün olduğunda en güçlü yöntemdir: rastgelelik “do(variant = B)”’yi gerçek kılar ve grup farklarını değişikliğe bağlamayı güvenilir hale getirir.

Ancak her zaman rastgele test yapamazsınız:

düşük trafik
uzun vadeli etkiler
kullanıcılar arası müdahale
etik/safety kısıtları

Böyle durumlarda difference-in-differences, regression discontinuity, instrumental variables veya matching/weighting gibi yarı-deneysel yöntemlere başvurun—ancak varsayımları açıkça belirtin.

PRD'lere ve karar dokümanlarına nedensel düşünceyi nasıl dahil ederiz?

PRD'lere kısa bir bölüm ekleyin; bu analiz öncesi netlik sağlar:

Müdahale: tam olarak neyi değiştiriyoruz?
Sonuç + korumalar: ne iyileşmeli, ne kötüleşmemeli?
Karıştırıcılar: aynı zamanda metriği neler hareket ettirebilir?
Ölçüm planı: deney mi, kademeli açılma mı, yoksa karşılaştırmalı çalışma mı?

Bu, ekibi bir nedensel soruda hizalar ve sonradan dashboard hikâyesi anlatmayı engeller.