Regresyon Kavramı Nereden Geliyor?

0
72

Regresyon

Regresyon kavramı her ne kadar Türkçe’ye Bağlanım olarak çevrilmiş olsa da ekonometri/istatistik kitaplarında sıklıkla kullanılıyor. TDK’ya göre regression kelimesi Fransızca kökenli  olup “İki veya daha çok değişken arasında doğrusal bir ilişki olup olmadığının bulunması ve bu doğrusal ilişkinin bir doğrusal denklemle nasıl ifade edildiğinin gösterilmesi.” anlamına geliyor. Regresyon kelimesinin  Merriam -Webster Online İngilizce sözlüğe göre İngilizcesi Regression: Regressing yani gerileme kelimesinden gelmektedir. Gerilemeden kastedilen ise var olan iyi durumdan daha kötü bir duruma geçiş. Zenginken orta gelirli hale gelmek gibi de denebilir. Peki gerileme kelimesi ile ekonometride istatistikte en çok kullanılan Regresyon metodu arasında nasıl bir bağlantı var?

Askerde iken (Bedelli yaptım. Uzun dönem yapanlara saygılarımla) Nobel Ekonomi Ödüllü Daniel Kahneman’ın “Hızlı ve Yavaş Düşünme” kitabının birçok bölümünde  “Ortalamaya doğru gerileme” kavramı ile karşılaştım. Kavram konusunda hiçbir fikrim yoktu. Açıkçası araştırma yapabileceğim imkanım da yoktu. Not aldım. Askerden döndüğümde kitabın İngilizcesi’ni okuyarak anlamaya çalışırım dedim. Askerlik bitti. Normal hayata tekrar başladım derken Wuhan’da Yarasa sever arkadaş nedeniyle başlayan mevzu patlak verdi. Neyse Regresyon diyordum. Geçtiğimiz günlerde Twitter’da takip ettiğim Serkan Hoca’nın attığı twitsel (birbirine bağlı twitlerin oluşturduğu  twit dizisi) ile konu tekrar açıldı. Serkan Dolma hoca da Daniel Kahneman kitabı ve ek bir kitap ile kavramı güzelce açıklamış.

Modern İstatistik veya Ekonometri öncesi günlere gidiyoruz. Viktorya döneminin en önemli bilim insanlarından biri olan Sir Francis Galton, istemeden de olsa Regression kelimesinin de isim babası olacaktır. Özellikle pozitif bilimlere ilgisi olan ve tıp okuyan Galton’un ayrıca antropoloji, istatistik, psikometri, coğrafya, psikoloji gibi disiplinlere de ilgisi vardır. Evrim tartışmalarının yoğunlaştığı bir dönemde kendi sülalesini içine alan gözlemlerde bulunarak dehanın kalıtımsal olduğunu kanıtlamak ister. (kendi dehasının atalarından kalıtımla geçtiğini düşünür.)

Viktoria Dönemi: Deyim genel olarak Kraliçe Viktorya’nın hüküm sürmüş olduğu 1837 ve 1901 arasındaki zaman için kullanılır.

O günlerde günümüzde uyguladığımız şekliyle Onedio’da yaptığınız güvenilir testler… şaka şaka IQ testi, duygusal zeka testi veya biliş ile ilgili testler yok. Zeka ölçülemediği için daha antropometrik yani kol, bacak, kafatası genişliği gibi gözle görülen şeyleri ölçmek zorunda kalır. Kuzeni Charles Darwin önce ona bezelyeler üzerinde ölçüm yapmasını önerir. Galton daha sonra para bulur ve kendi laboratuvarını kurar.

Burada insanlar ve onların aile üyelerini ölçerek veriler toplamaya başlar. Bir çalışmada da babaların boylarını ve çocukların boylarını karşılaştırır. Kalıtım sonraki nesillerde boy uzunluğu üzerinde etkili ise uzun boylu babaların uzun boylu çocukları olacaktır hipotezini sınar.

Bir baba ve oğlu :)
Bir baba ve oğlu 🙂 (Fotoğraf Reddit’tem

Bu ilişkiyi anlamak üzerine [scatter plot] nokta dağılım grafiğini kullanır.

babalar ve oğullarına boylarına ait nokta dağılım grafiği
babalar ve oğullarına boylarına ait nokta dağılım grafiği

Babaları ortalamadan uzun boylu olan çocukların boylarının da ortalamadan uzun olmasını bekliyor. Galton’un beklediği gibi sonuçlar da ona benzer çıkıyor. Nokta grafiğinde serpilen veriler elips şeklini alıyor.

Galton'un çalışmasından
Galton’un çalışmasından

Nokta dağılım grafiğinde de gördüğünüz gibi her bir baba-oğul çiftini temsil eden noktaların I. ve III. bölgelerde toplanması da babanın boy ortalaması ve oğlun boy ortalaması arasında bir çeşit pozitif ilişkinin olduğunu gösteriyor.(Mesela  grafik üzerinde bir nokta Baba=175 cm oğul 180 cm anlamına geliyor)

Francis Galton bu çalışmada ayrıca bir şeyi daha farkediyor. Ortalamadan uzun olan babaların oğulları, bütün oğulların ortalamasından uzun olsa da genellikle babalarından kısa oluyor. Örnek verelim;

Yüz tane baba ve 100 tane oğlun bulunduğu bir grup insan düşünün. Bütün babaların ortalaması 165 cm olsun. Bütün oğulların ortalaması da 165 cm olsun. Bu grup içinde boyu ortalamadan uzun olan babaların mesela 190 cm olan babaların oğulları, yüz çocuğun ortalaması olan 165 cm’den yüksek ama 190 cm den de az oluyor. Yani babaların çok uzun olduğu durumlarda çocuklar babalarından kısa oluyor! Ortalamadan kısa olan babaların (150 cm diyelim) çocukları da 165 cm’den kısa olsa da babalarından uzun oluyor.
Grafikte siyah kesikli çizgi üzerinde olan kırmızı noktaların bazılarında baba uzun olsa da çocuklar babalarından kısa. Bunun tersini oğullar için de yapabilirsiniz.

Sir Francis Galton bu duruma “vasatlığa doğru gerileme” (English: Reversion/regression towards the mediocrity/mean) adını veriyor. Bir gerileme katsayısı bulmaya çalışıyor. TDK’ya göre vasat kelimesi orta anlamına geliyor. Uzun olan babaların oğulları kısa oluyor. Baba 190 cm iken oğulların boyu 165 cm ortalamaya geriliyor. Ayrıca kısa babaların oğulları da uzun oluyor. Baba 150 cm olsa da çocukları ortalamaya yani 165 cm’ye yaklaşıyor.

 

Serkan Dolma’nın Twitseli: https://twitter.com/TrDolma/status/1335495051510755329

Subscribe
Bildir
guest
0 Yorum
Inline Feedbacks
View all comments