Home Blog

Davranışsal Yaklaşımlarla Vergi Tahsilatını Arttırmak

0

Davranışsal Yaklaşımlarla Gecikmiş Vergi Tahsilatını Arttırmak

Davranışsal kamu politikası, davranış bilimlerinin araçlarının; irrasyonel davranan, çeşitli önyargı ve yanlılıklara sahip vatandaşları onların refahını arttırma adına kullanılması. Son kırk yılda artan sayıda çalışma insanların aslında ne kadar irrasyonel davrandıklarını gösterdi. Biz neoklasik iktisatın “homo economicus’u” olmaktan oldukça uzakmışız.

Geçtiğimiz kırk yılda gerçekleşen davranışsal devrim üçten fazla nobel ödülü ile kendini gösterdi. 2002 yılında deneysel iktisatçı Vernon Smith ve davranışsal iktisatçı Daniel Kahneman; 2017 yılında özellikle davranışsal kamu politikası uygulamaları ile Richard Thaler; 2019 yılında da Davranışsal Kalkınma politikaları çalışmaları ile Ester Duflo ve Abhijit Banerjee.

Davranışsal ve deneysel iktisadi gelişmeler hakkında kulağınıza su kaçırdığıma göre devam ediyorum. Makalenin devamında davranışsal kamu politikası hakkında güzel bir örneği kısaca anlatacağım. Örnek başta kamu politikaları olmak üzere hayatımızın içinde ufak değişimlerin bizleri nasıl rasyonelliğe yaklaştırdığını göstermesi adına oldukça güzel.

Davranışsal yaklaşımların hızlı gelişimi önümüzdeki yıllarda davranış üzerine çalışan iktisatçılar başta olmak üzere davranış bilimcilerin  kamuda ve özel sektörde yeni iş alanları açılacak. Herkes kod mu öğreniyor siz de deney yapmayı, insanların nasıl irrasyonel davrandığını ve onları nasıl değiştirebileceğinizi öğrenin!

Bundan 10-15 yıl önceye kadar Her Majesty’s Revenue and Customs ya da Türkçe’ye çevirecek olursak İngiltere Gelir ve Gümrük Idaresi (Gelir İdaresi) yıllardır vergisini zamanında ödemeyen geciktiren İngilizlere bir hatırlatma mektubu yolluyordu. Belki bilenleriniz vardır. Özellikle esnaf tanıdığı olanlar. Türkiye’de de PTT memuru vergi borcu olanlar için kapınıza gelir vergi ihbarnamesi bırakır. Yakın zamanda bunların sayısı azaldı. Artık sıklıkla e-haciz uygulanıyor. HRMC’nin yolladığı mektup basitçe aşağıdaki gibidir:

Sevgili Adam Smith,

Sana haber vermek için bu mektubu yolladık. Bu yıl ödemen gereken …… Sterlin tutarındaki vergini halen tahsil edemedik. Bizimle en kısa sürede iletime geçmelisin.

 

[Archer Street. Smithson’s Apartment. No:78 Londra]

İngiltere Gelir ve Gümrük İdaresi

2007 yılında ünlü sosyal psikolog Robert Cialdini’ye giden bir ekonomist Halpern davranışsal kavramları kamu politikalarına nasıl uygulayabileceklerine yönelik fikir alışverişinde bulundular. Cialdini HMRC”ye yardım ederek yukarıda paylaştığım sıkıcı mektubu tekrar yazdı.

HMRC de zaman içinde yeni yazılan mektupla beraber çeşitli deneyler yapmaya razı oldu. Bir devlet memuru da olan Phd öğrencisi Michael Hallswort’un liderliğinde çeşitli denemelere başladılar. İlk deney basit bir değişikliklten ibaretti.

Kontrol Grubu: Her zamanki şekli ile yukarıda yazılan mektup aynı şekilde postalandı.

Deney Grubu: Yeni mektuba sadece şu cümleyi eklediler.

“Şu ana kadar, bulunduğunuz kasaba/mahallede yaşayan her 10 kişiden 9’u vergisini ödedi.”

Ufak bir değişiklik sadece bir cümle eklendi. Vergisini ödeyenlerin oranı ise yüzde 35.8’den yüzde 37.8’e yükseldi. Yüzde 2 civarında büyük bir rakam görünmeyebilir. Şimdi de o yüzdeleri 100 milyar pound tahsili gecikmiş vergi ödemelerinde mektup sonrası toplanan verginin 35.8 milyardan 37.8 milyar pound’a artış şeklinde düşünün. iyi para.

İlk deneydeki başarı büyük olunca deneylerin sayısı arttırıldı. Bir deneyde kontrol grubuna ve ilk denemedeki değişik mektuba ek olarak dört tane daha eklendi.

  • Kontrol Grubu: Her zamanki şekli ile yukarıda yazılan mektup aynı şekilde postalandı.
  • Deney Grubu (Temel): “Şu ana kadar, bulunduğunuz kasaba/mahallede yaşayan her 10 kişiden 9’u vergisini ödedi.”
  • Ülke normu : “Şu ana kadar, İngiltere’deki her 10 kişiden 9’u vergisini zamanında ödedi.”
  • Azınlık normu : “Şu ana kadar, İngiltere’deki her 10 kişiden 9’u vergisini zamanında ödedi. Siz halihazırda vergisini halen ödememiş küçük bir azınlık içine dahilsiniz.”
  • Kazanımla Çerçevelenmiş Kamu Malı : “Vergi ödemeleri hepimizin SGK, okul, yol gibi temel kamu hizmetlerinden faydalanmamızı sağlar.”
  • Kayıpla Çerçevelenmiş Kamu Malı : “Vergiler ödememe hepimizin SGK, okul, yol gibi temel kamu hizmetlerini kaybetmemize neden olur.”

Bu farklı mektupların her biri İngiltere, Galler ve Kuzey İrlanda’da yaşayan 17.000 insana yollandı. Bütün yeni mektuplar kontrol grubunda yer alan yani eski/tek düze mektuptan daha yüksek tahsilat yapılmasını sağladı. Fakat tahsilatı en fazla arttıran mektup Azınlık normu oldu. Kendini vergisini halen ödememiş insanların arasında gören insanlar gecikmiş vergilerini ödemede daha istekli davranmışlar. 17.000 kişye yollanan mektup HMRC’nin 1.9 milyon pound fazladan vergi toplamasını sağlamış. Peki vergisini geç ödeyen 102.000 kişiye sadece azınlık normu’nu içeren mektup yollansaydı ne olurdu?HMRC yaklaşık 11. milyon pound daha fazla gelir elde edecekti.

Konsept Nedir? Deneyde
Kontrol Grubu Uygulama yapılan grubun karşılaştırıldığı dayanak grup HMRC’nin değiştirilmemiş mektubunu alanlar
Uygulama grubu veya grupları Bu grupta veya gruplarda yer alanalr ana gruptan farklı bir şekilde uygulama alırlar. Randomize Kontrollü denemelerde ise bir veya birden fazla muamele grubu bulunur. HMRC’nin deneyi içinde temel mektubun değiştirilmiş her hali bir muamele anlamına gelir.
Bağımsız değişken Ölçmek istediğiniz şeyi etkileyen değişken Her ankette değişen içerik.
Bağımlı değişken ilgilendiğiniz şeyin çıktı veya çıktıları mektubu alanların vergilerini zamanında ödeyip ödemediği. İsterseniz ödediyse ne kadarını ödediğini gösteren miktar.
Uygulamaların ortalama etkisi Uygulamaya tabi olan popülasyon üzerinde uygulamanın ortalama etkisi. Kontrol grubu ortalaması ile farkı. Uygulamanın ortalama etkisi = uygulama grubunun vergi ödeme oranları – kontrol grubunun vergi ödeme oranı. %35.1-%33.6 = %1.5 . Eklenen cümler ödenen vergi oranını yüzde 1.5 arttırdı.

 

Hallsworth, M., List, J. A., Metcalfe, R. D., & Vlaev, I. (2017). The behavioralist as tax collector: Using natural field experiments to enhance tax compliance. Journal of public economics148, 14-31.

Kötü Bir Fincan Çay: Modern İstatistiğin Doğuşu | Ronald Fisher

0

Modern İstatistiğin Doğuşu

Sıradan bir iş günü matematikçi Ronald Fisher, meslektaşına bir fincan çay ikram etmek ister. Bunu yaparken bir tartışma başlatmak gibi bir niyeti de yoktur. Daha doğrusu çay ikram etmek isterken modern bilimin gelişmesi için uğraşacağını bilemeyecektir.

Ronald Fisher,  1920’li yıllarda Londra’nın Kuzeyinde yer alan tarım araştırmaları istasyonunda çalışan, kısa boylu, yuvarlak çerçeveli gözlüklere sahip bir matematikçidir. Araştırma istasyonunda çalışan bilim insanlarının daha iyi deney tasarlayabilmeleri için işe alınmıştır. Fisher, istasyonda yaptığı işlerle başlarda çok da ilerleme de sağlamamıştır.

Fisher ve araştırmacılar her gün İngilizlerin meşhur çay molası için istasyonda saat dörtte mola verir. Bir öğleden sonra Fisher, algler ile ilgilenen istasyondan iş arkadaşı biyolog Muriel Bristol için her zamanki kıvamda bir fincan çay hazırlar. İngilizlerin beş çayı molası kadar sütlü çay içmeleri de meşhurdur. Fisher, Bristol’ün çayı sütlü olarak içtiğini bildiğinden önce biraz süt kaynatır sonra da süre çayı ekler.

Modern istatistiğin doğuşuna giden olay da tam burada patlak verir. Fisher, Bristol’e çayı ikram ettiğinde Bristol çayı geri çevirir.

-“Bu çayı içemem.” der.

Fisher'in gençken çekilmiş fotoğrafı
Fisher’in gençken çekilmiş fotoğrafı

-Fisher “Neden” diye sorar.

Kadın, “çünkü önce sütü bardağa boşalttın” diye cevap verir. Bristol, önce süt sonra çay dökülmeden hazırlanmış çayı hiçbir zaman içemediğini söyler. Bristol’ün içeceği sütlü çay için bardağa, önce çay dökülmeli daha süt sonra eklenmelidir.

Çay-önce / Süt-önce dökülmeli tartışması aslında çayın İngiltere’ye geldiği 1600’lı yıllara kadar geri giden bir tartışma. Çay yüzünden üzerinde dönen bu tartışma farklı kültürden insanlara saçma gibi görünse de her iki hazırlanış şeklinin kendi fanatikleri vardır. (En iyi turşu sirkeden mi limon suyundan mı yapılır tartışmasını hatırlayın) Fanatikler, birileri çayı “yanlış” şekilde yaparsa çılgına dönerlermiş. Hatta Londra’da bir gazetede şöyle bir yazı bile yazılmış: “İngiltere’de herhangi bir şey, yeni bir iç savaşa dönüşecekse, bu büyük ihtimalle çay yüzünden olacak.”

Fisher bilim insanı olarak bu konuda tartışmanın anlamsız olduğunu düşünür. Termodinamik açıdan sıcaklık ve göreceli oranlar (sütün çaya oranı) sabit kaldığı sürece A’yı B ile karıştırmak ya da B’yi A ile karıştırmak aynı şeydir. Kendinden emin bir şekilde Bristol’un yanlış düşündüğünü iddia eder:

-“Sıranın kesinlikle bir önemi yok.”

Bristol ise fikrinde ısrarcıdır:

– “Kesinlikle var” diyerek diretir. İddiasını ilerleterek her iki demleme arasındaki farkı da ayırt edebilirim der.

Muriel Bristol
Muriel Bristol

Fisher ‘e göre bu tabi ki mantıksızdır. Alay ederek: “Bu imkansız.” der.

O gün istasyonda olan üçüncü bir kişi kimyager William Roach araya girmese tartışma bir süre daha devam edecektir. Roach’ın olaya müdahale etmesinin bir nedeni de Bristol’a aşık olması olur. Zaten daha sonra da evlenirler. Roach, Bristol’ü savunmak ister. Fakat bir bilim insanı olarak ortada bir bilimsel açıklama olmadan da Bristol’ün haklı olduğu iddia edemez. Bir şey yapmalıyım der. Hem Bristol’e yardım etmeli hem de bunu bilimsel şekilde yapmalı. Kafasında hızlıca bir şeyler tasarlar.

“Hadi bir test yapalım.” der. Her iki demleme şeklinde de çay hazırlayalım. Bristol da tadına baksın. Bakalım hangisinin çay-önce, süt-önce şeklinde yapılıp yapılmadığını anlayacak mı?

Bristol ve Fisher de bu teklifi hemen kabul eder. Fisher’in deney tasarlama konusunda uzmanlığı olduğundan kusursuz bir deney tasarımı ister. Deneyi tasarlamaya başlar. Deney üzerine fikirler sunar. Fisher sekiz fincan çay yapılmasını ister.  Bu fincanlardan dördünde önce süt sonra çay koyulacak. Sonraki dördünde ise önce çay dökülecek sonra süt eklenecek. Sonraki adımda da fincanlar rastgele şekilde Bristol’un tadım tahminde bulunması için ona verilecek.

Bristol deneyi kabul eder. Roach ve Fisher ise çay demlemek için ortadan kaybolurlar. Kısa bir süre sonra ufak bir izleyici kitlesi ile beraber geri dönerler. Fincanların hangi sıra ile Bristol’e sunulduğunu daha sonra kimse hatırlamaz. Fakat deneyin sonucunu kimse unutamayacaktır.

Bristol, ilk fincandan yudum alır. Dudaklarını şapırdatır.  Tahminini açıklar:

Büyük ihtimalle “ilk önce çay” der..

İkinci bardağı eline alır ve yine yudumlar. “Önce süt.” der.

Bu olay altı defa daha tekrarlanır. Önce çay, önce süt, önce süt yine. Sekizinci fincana geldiklerinde Fisher bakakalır. Bristol, her fincanda çayın mı sütün mü önce döküldüğünü doğru tahmin etmişti. Bu nasıl mümkün olabilir. Deneyi de kendi tasarlamış, çayı da kendi pişirmiştir. Deney tasarımında sorun yoktur. Bristol’ün gizli bir gücü olduğunu da düşünmüyordur.

Bu deneyden yıllar sonra anlaşıldı ki kimyasal nedenlerden dolayı, çaya süt eklemekle süte çay eklemek aynı şeyler değilmiş. Tabi o zamanlar bunu kimse test etmemiştir. Sütün içinde bulunan yağ ve protein,  hidrofobiktir. Sudan kaçarlar. Sıcak su ile süt karıştırıldığında, yağ ve proteinler su yüzeyinde ufak kürecikler oluşturur. Sütü kaynamış sıcak çaya döktüğünüzde, sütün ilk dökülen damlaları bozulmakta ve izole kürecikler haline gelerek su yüzeyine çıkmaktadır. Sıcak su ile çevrelenen bu izole kürecikler haşlanmaktadır. kesilmiş sütün içindeki proteinler 160 Fahrenheit derecede şekil değiştirerek açığa çıkar. İçen kişiye yanmış karamel benzeri bir tat verir. Avrupa’nın birçok yerinden ultra yüksek derecede pastörize edilen sütün, Amerikalılar için tuhaf bir tada sahip olması da bu nedenledir. Tam aksi şekilde, süte çayı sonradan eklemek ise küreciklerin izole olmasını sağlar.  Yağ ve proteinlerin haşlanmasını önleyerek karamele benzer tadın dışarı çıkma ihtimalini oldukça azaltır.

Süt-önce veya çay-önce demleme ile yapılan çaylardan hangisinin tadının daha iyi olduğu kişinin damak zevkine göre değişir. Fakat Bristol’un bakış açısı doğrudur. Proteinl ve yağın kimyası, demleme ile elde edilen lezzetlerin farklılaşmasına neden olur.

Halkın önünde tezinin yanlış olduğu ortaya çıkan Fisher için Bristol’ün zaferi kendisi açısından bir parça küçük düşürücüdür. Fakat o deneyin önemi, daha sonra olanlarda gizlidir. Fisher, biraz alıngan kişilikli bir insandır. Acaba Bristol’ün şanslı olduğu için mi sekiz bardağın nasıl demlendiğini tam olarak tahmin etmiştir. Kendi kendine deneyi yanlış tasarlayıp tasalamadığını düşünüp durur. Matematik bilgisini kullanarak Bristol’ün şansı ile ilgili olasılık hesaplamaları yapar. Yaptığı hesaplamalara göre Bristol’ün sekiz fincanı da doğru tahmin etme olasılığı yetmişte birdir. Bu olasılık dahilinde Bristol farklılıkları doğru tahmin etmiş olabilir.

Deney hakkında düşünmeyi bırakmaz. Acaba bir noktada Bristol yanlış yapmış olabilir mi? Belki fincanların yerini değiştirmiş, yanlışlıkla tahminleri doğru çıkmıştır. Bu yüzden rakamları yeniden sınamış ve Bristol’ün bu tarzda hatalı durumlarda, tahminlerinin doğru olma  ihtimalinin yetmişte birden dörtte bire yükseldiğini bulmuştur. Başka bir deyişle, sekiz fincandan altısını doğru tahmin edebilmiş ise sekiz bardağın sekizini de doğru şekilde tahmin edebilecektir. Buna rağmen Bristol kabiliyeti konusunda kendinden daha az emin olmalıydı. Hatta Fisher, Bristol’ün tahminin güven aralığını bile hesaplayabilirdi.

Dahası, istatistiki olarak güvenilirlikten yoksunluk Fisher’a bir şeyler çağrıştırdı: kullandıkları örneklem çok küçüktü. Bu yüzden yeniden hesaplamalar yaptı. Deney açısından 12 fincan çayın, yani 6 fincan her iki şekilde de demlenmiş çayın daha iyi bir deneme olacağını buldu. Bir fincan çayı doğru tahmin etmek deney sonucu için daha az ağırlık taşıyacaktı. Bu yüzden tek bir bardak çay, çalışma sonucu oluşa dağılım grafiğinin basıklığını da çok artırmaz. Deneyin diğer varyasyonları ile ilgili fikirler de örneğin süt-önce, çay-önce fincanlar için rastgele rakamlar kullanmak ilerleyen aylarda  Fisher’in aklına gelemeye devam eden fikirlerden bir diğeridir.

Şimdi baktığımızda o gün yaşananlar vakit kaybı gibi görünebilir. Bütün bu olanlar sırasında Fisher’in patronu,  ona çay odasında deney yapması için para ödemiyordu. Fisher ise çay odasında yaşananlar hakkında düşünmeye devam ediyordu.

1920’li yıllarda bilimsel bir deney için standart bir yöntem yoktur. Deney sonuçları güvenilirlik açısından nadiren kontrol edilebiliyordu. bilimsel veri analizlerinin çoğu incelikten yoksun ve ilkeldi. Fisher daha iyi deneylerin tasarlanması için kiralanmıştı. Çay deneyi ise birçok şeyin farkına varmasını sağlamıştı. Çay odasında yaşananlar Fisher’in iyi bir deneyin nasıl tasarlanacağı ve istatistiksel analizlerin nasıl daha sağlıklı hale getirileceği konusunda fikirler üretmesine yardımcı olan bir olay olacaktır. Burada ürettiği fikirleri gerçek dünyada yapılan çalışmalarda özellikle hasat üretimi konusunda yapılan çalışmalara uygulayabilecekti.

Fisher, çalışmalarının meyvesi olarak ufuk açıcı iki tane kitap yayınladı. Araştırmacılar için İstatistiksel Yöntemler (Statistical Methods for Research Workers) ve Deneylerin Dizaynı (The Design of Experiments). Bu kitaplardan sonra da çalışmalarına devam eder. Dünya çapında halen kullanmaya devam ettiğimiz bazı temel kavramları çalışmalarına katar. Boş hipotez kavramı (null hypothesis), istatistiki anlamlılık (statistical significance) gibi kavramlar Fisher’in bilim dünyasına kattığı kavramlardan birkaçıdır. Dipnot olarak Fisher kitabında örnek olarak bütün ayrıntıları ile Muriel Bristol’un çay deneyini anlatmıştır.

Fisher’in entellektüel sezgisine rağmen bu özelliği onun sınıf, ırk ve sömürgecilik ile ilgili ön yargılarını etkilemedi. Fisher çok tanınmış bir “eugenist” (üst insan ırkı) savunucusu idi. Ömrünün sonuna kadar da bu inanca sahip olmaya devam etti. İkinci Dünya Savaşı sırasında Unesco tarafından düzenlenen ve ırkçılık/ kafatasçılık içeren Nazi bilimi ile mücadele etmeyi amaçlayan bilimsel koalisyonda da yer aldı. Buna rağmen bu projenin oldukça iyi niyetli ama yanlış hedeflenen bir plan olduğunu öne sürdü. Fisher’a göre bazı uluslar, doğuştan gelen özellikleri nedeniyle hem entellektüel hem de duygusal ilerleme açısından diğer insanlardan farklıdır.

Sabit fikirli, ırkçı düşüncelerinin Fisher’in ününe ve bilim camiasına mirası üzerine etkisi çok az olmuştur. Fisher’in çalışmaları, Charles Darwin’in Evrim Teorisi ve Gregory Mendel’in gen teorisinin birleşmesine yardımcı olduğundan biyoloji de efsane hale gelmiştir. Fakat Fisher’in bilime en büyük katkısı halen deney dizaynı üzerine yaptığı çalışmalardır. Onun bilimsel çalışmalar açısından devrim niteliğindeki imzalarının etkilerini her yerde görmeye devam etmekteyiz.

Bu makale Sam Kean tarafından yazılan “Ronald Fisher, a Bad Cup of Tea, and the Birth of Modern Statistics” makalesinin çevirisidir. Bire bir çeviri yapmak yerine makalenin özüne, kavramlarına dokunmadan daha iyi bir anlatım gözetilerek çeviri yapılmıştır.

İlk versiyon 9 Eylül 2019

Standart Sapma ve Varyans Nedir?

1

Varyans ve Standart Sapma Nedir?

Sınıfımızda 30 öğrencinin girdiği ve 30 soruluk bir sınav yapılmış olsun. Öğrencilerin sınav sonucu doğru sayıları birbirinden farklı. 3 doğru yapan da var 30 doğru yapan da var. Sınıfın doğru ortalamasına bakıyoruz 16.87 olmuş. (ortalama = tüm öğrencilerin doğru sayısının toplamı bölü öğrenci sayısı)

Sizce 16.87 doğru sınıfın genel başarısı açısından bize ne söylüyor? Sınıfın ortalama olarak konuları anladığını düşünebilir miyiz?

Soruyu şöyle sorayım bir arkadaşınız sınıfa geldi ve 100 üzerinden değerlendirilen klasik ECON101 final sınav ortalamasının 100 üzerinden 50 olduğunu söyledi.

Bu sınıf hakkında ne diyebiliriz?

Neden ortalama 50 oldu? Herkes sınavda 50 aldığı için mi ortalama 50 oldu?

Ya da sınıfın yarısı 100 yarısı 0 aldığı için mi ortalama 50 oldu?

Sınıf ortalaması tek başına size bu bilgiyi verir mi? Belki sınıfın yarısı 75 yarısı 25 aldı ve ortalama 50 çıktı! Ortalama değer bize sınav puanlarının sınıf içinde ne kadar değişkenlik gösterdiğini söylemez. Bunun için ortalamadan başka bir şey bulmamız lazım. Öyle bir endeks yaratalım ki ortalamadan ne kadar uzaklaşıldığı hakkında bize fikir verebilsin.

Herkesin değerinden ortalamayı çıkaralım, sonra da ortalamadan farkları toplayıp kişi sayısına bölelim. Bir çeşit “ortalamadan farkların” ortalama değerini bulalım.

Negatif ve pozitif sayıların birbirini götürmesi için ufak bir hile yapacağız. Ortalamadan Farkların karesini alarak hepsini pozitif hale getireceğiz.
Ortalamadan yüksek alanlar ve ortalamadan düşük alanlar birbirini götürdü. Ortalamalardan farkın toplamı kaç çıktı? Sıfır çıktı! Ortalamalardan farkların toplamı sıfır çıktığı için değişkenlik ölçüsü olarak olduğu gibi kullanamıyoruz.

Öğrenci Sınav Puanı Ort. Farklar Ort. Farkların Karesi Öğrenci Sınav Puanı Ort. Farklar Ort. Farkların Karesi
Öğr. 1 74 24 576 Öğr. 16 100 50 2500
Öğr. 2 42 -8 64 Öğr. 17 21 -29 841
Öğr. 3 67 17 289 Öğr. 18 21 -29 841
Öğr. 4 26 -24 576 Öğr. 19 68 18 324
Öğr. 5 68 18 324 Öğr. 20 40 -10 100
Öğr. 6 85 35 1225 Öğr. 21 19 -31 961
Öğr. 7 61 11 121 Öğr. 22 95 45 2025
Öğr. 8 48 -2 4 Öğr. 23 16 -34 1156
Öğr. 9 34 -16 256 Öğr. 24 13 -37 1369
Öğr. 10 65 15 225 Öğr. 25 28 -22 484
Öğr. 11 95 45 2025 Öğr. 26 6 -44 1936
Öğr. 12 59 9 81 Öğr. 27 88 38 1444
Öğr. 13 50 0 0 Öğr. 28 33 -17 289
Öğr. 14 44 -6 36 Öğr. 29 71 21 441
Öğr. 15 12 -38 1444 Öğr. 30 51 1 1

 

Ortalamadan farkların karesini aldık. Hepsi pozitif oldu.Şimdi ortalamadan farkların karelerini toplayıp öğrenci sayısına bölüp ortalama değişkenliği hesaplayalım.

Ortalamadan Farkların Karelerinin Toplamı 21958
Öğrenci Sayısı 30
Ortalama Değişkenlik: VARYANS 731.933333333333

 

Şimdi ortalamadan sapmaları açıklayabileceğimiz bir endeks değerimiz var. Öğrenci puanlarının sınıf ortalamasından 731.9 değişkenlik gösterdiğini bulduk. 731.9 değişkenlik. 731.9? 100 puan üzerinden 731 değişkenlik nasıl yani? 50+731.9 yani 831 puan alan mı var? tabi ki yok. Yanlış yapmadık.

Hatırlayalım negatif sayılardan kurtulmak için ortalamaların karesini almıştık. Karelerini aldığımız sayılar nedeniyle bulduğumuz ortalama değişkenlik değeri ile varyansı bulmuş olduk. Sınavın varyans değeri sınavın maksimum değerinden bile yüksek çıkabilir. Ortalamanın 50 olduğu sınavda 70 alan biri ortalamadan 20 puan farklı puan almıştır. Biz de  o yirminin karesini kullanarak hesaplama yaptık. Bulduğumuz değer 731 puan kare olarak okunabilir. varyans değeri doğru bir değer olsa da yorumlama yaparken sorun yaratır. Yorumlarken

Karesini aldığımız değerin şimdi de karekökünü alalım.

Ta Ta taammm. Standart sapmayı bulduk. 27.05 puan!

  • Varyans ve standart sapma arasında ölçüm birimi bakımından fark var.
  • Varyans: ölçtüğümüz şeylere ait birim ne ise (boy, kilo,not, yaş v.b.) onun karesi cinsinden bir değer. Örneğimizde puan kare diyebiliriz. 731 puan kar.
  • Standart sapma: ölçtüğümüz şeyin biriminden hesap yapabileceğimiz sonuç verir. Puan cinsinden ortalamadan değişkenlik miktarı.

Standart sapmanın yüksek veya düşük olmasını nasıl yorumlarız?

Standart sapma “iyi” veya “kötü” bir şey değildir. Standart sapma bir göstergedir. Baktığımız veri setindeki gözlemlerin nasıl bir aralıkta dağıldığı hakkında fikir verir. Duruma göre standart sapmanın yüksek olmasını veya düşük olmasını isteyebiliriz.

Bir matematik sınavını göz önünüze getirin. Hocanın kolay sorular sorduğu bir sınavda herkes yüksek ve ortalamaya yakın not alır. Sonuç olarak da standart sapma düşük çıkar. Öğrencilerin başarı düzeylerinin farklı olduğunu ve hocanın gerçekten başarılı öğrencilerin dersi geçmesini istediğini varsayalım. Soru zorluk seviyesine göre standart sapma da yüksek çıkacaktır. Standart sapmanın yüksek olması sınav sorularının “başarıyı ölçen” kaliteli sorulardan oluşturduğunu gösterir.

Varyans ve standart sapma bize verilerin dağılımı hakkında da bilgi verir. Ortalamanın

Soldaki grafikte standart sapma yüksek, sağdakinde standart sapma düşüktür.

 

leptokurtic ve platykurtic
leptokurtic ve platykurtic

Kendi veri setimize ger dönelim. Sınıf ortalamasının 50 olduğu veri setimizde standart sapmamız 27.52 çıkmıştı. Standart sapma 0 olsaydı veriler 50 etrafında leptokurtik şekilde yani dağılım grafiğine baktımızda veriler ortada birikirdi

Bizim örneğimizde standart sapma 27 gibi ir değer aldı. 100 üzerinden değerlendirdiğimizde oldukça yüksek. Yani platykurtik olma ihtimali fazla. Sınav puanı grafiğimizi beşer puan aralığında sıraladığımızda dağılımın nasıl olduğunu görüyoruz. Kısaca standart sapma yükseldikçe dağılım grafiği şişmanlar. Genişler. Standart sapma azaldıkça ise dikleşmeye leptokurtic olmaya başlar.

Regresyon Kavramı Nereden Geliyor?

0

Regresyon

Regresyon kavramı her ne kadar Türkçe’ye Bağlanım olarak çevrilmiş olsa da ekonometri/istatistik kitaplarında sıklıkla kullanılıyor. TDK’ya göre regression kelimesi Fransızca kökenli  olup “İki veya daha çok değişken arasında doğrusal bir ilişki olup olmadığının bulunması ve bu doğrusal ilişkinin bir doğrusal denklemle nasıl ifade edildiğinin gösterilmesi.” anlamına geliyor. Regresyon kelimesinin  Merriam -Webster Online İngilizce sözlüğe göre İngilizcesi Regression: Regressing yani gerileme kelimesinden gelmektedir. Gerilemeden kastedilen ise var olan iyi durumdan daha kötü bir duruma geçiş. Zenginken orta gelirli hale gelmek gibi de denebilir. Peki gerileme kelimesi ile ekonometride istatistikte en çok kullanılan Regresyon metodu arasında nasıl bir bağlantı var?

Askerde iken (Bedelli yaptım. Uzun dönem yapanlara saygılarımla) Nobel Ekonomi Ödüllü Daniel Kahneman’ın “Hızlı ve Yavaş Düşünme” kitabının birçok bölümünde  “Ortalamaya doğru gerileme” kavramı ile karşılaştım. Kavram konusunda hiçbir fikrim yoktu. Açıkçası araştırma yapabileceğim imkanım da yoktu. Not aldım. Askerden döndüğümde kitabın İngilizcesi’ni okuyarak anlamaya çalışırım dedim. Askerlik bitti. Normal hayata tekrar başladım derken Wuhan’da Yarasa sever arkadaş nedeniyle başlayan mevzu patlak verdi. Neyse Regresyon diyordum. Geçtiğimiz günlerde Twitter’da takip ettiğim Serkan Hoca’nın attığı twitsel (birbirine bağlı twitlerin oluşturduğu  twit dizisi) ile konu tekrar açıldı. Serkan Dolma hoca da Daniel Kahneman kitabı ve ek bir kitap ile kavramı güzelce açıklamış.

Modern İstatistik veya Ekonometri öncesi günlere gidiyoruz. Viktorya döneminin en önemli bilim insanlarından biri olan Sir Francis Galton, istemeden de olsa Regression kelimesinin de isim babası olacaktır. Özellikle pozitif bilimlere ilgisi olan ve tıp okuyan Galton’un ayrıca antropoloji, istatistik, psikometri, coğrafya, psikoloji gibi disiplinlere de ilgisi vardır. Evrim tartışmalarının yoğunlaştığı bir dönemde kendi sülalesini içine alan gözlemlerde bulunarak dehanın kalıtımsal olduğunu kanıtlamak ister. (kendi dehasının atalarından kalıtımla geçtiğini düşünür.)

Viktoria Dönemi: Deyim genel olarak Kraliçe Viktorya’nın hüküm sürmüş olduğu 1837 ve 1901 arasındaki zaman için kullanılır.

O günlerde günümüzde uyguladığımız şekliyle Onedio’da yaptığınız güvenilir testler… şaka şaka IQ testi, duygusal zeka testi veya biliş ile ilgili testler yok. Zeka ölçülemediği için daha antropometrik yani kol, bacak, kafatası genişliği gibi gözle görülen şeyleri ölçmek zorunda kalır. Kuzeni Charles Darwin önce ona bezelyeler üzerinde ölçüm yapmasını önerir. Galton daha sonra para bulur ve kendi laboratuvarını kurar.

Burada insanlar ve onların aile üyelerini ölçerek veriler toplamaya başlar. Bir çalışmada da babaların boylarını ve çocukların boylarını karşılaştırır. Kalıtım sonraki nesillerde boy uzunluğu üzerinde etkili ise uzun boylu babaların uzun boylu çocukları olacaktır hipotezini sınar.

Bir baba ve oğlu :)
Bir baba ve oğlu 🙂 (Fotoğraf Reddit’tem

Bu ilişkiyi anlamak üzerine [scatter plot] nokta dağılım grafiğini kullanır.

babalar ve oğullarına boylarına ait nokta dağılım grafiği
babalar ve oğullarına boylarına ait nokta dağılım grafiği

Babaları ortalamadan uzun boylu olan çocukların boylarının da ortalamadan uzun olmasını bekliyor. Galton’un beklediği gibi sonuçlar da ona benzer çıkıyor. Nokta grafiğinde serpilen veriler elips şeklini alıyor.

Galton'un çalışmasından
Galton’un çalışmasından

Nokta dağılım grafiğinde de gördüğünüz gibi her bir baba-oğul çiftini temsil eden noktaların I. ve III. bölgelerde toplanması da babanın boy ortalaması ve oğlun boy ortalaması arasında bir çeşit pozitif ilişkinin olduğunu gösteriyor.(Mesela  grafik üzerinde bir nokta Baba=175 cm oğul 180 cm anlamına geliyor)

Francis Galton bu çalışmada ayrıca bir şeyi daha farkediyor. Ortalamadan uzun olan babaların oğulları, bütün oğulların ortalamasından uzun olsa da genellikle babalarından kısa oluyor. Örnek verelim;

Yüz tane baba ve 100 tane oğlun bulunduğu bir grup insan düşünün. Bütün babaların ortalaması 165 cm olsun. Bütün oğulların ortalaması da 165 cm olsun. Bu grup içinde boyu ortalamadan uzun olan babaların mesela 190 cm olan babaların oğulları, yüz çocuğun ortalaması olan 165 cm’den yüksek ama 190 cm den de az oluyor. Yani babaların çok uzun olduğu durumlarda çocuklar babalarından kısa oluyor! Ortalamadan kısa olan babaların (150 cm diyelim) çocukları da 165 cm’den kısa olsa da babalarından uzun oluyor.
Grafikte siyah kesikli çizgi üzerinde olan kırmızı noktaların bazılarında baba uzun olsa da çocuklar babalarından kısa. Bunun tersini oğullar için de yapabilirsiniz.

Sir Francis Galton bu duruma “vasatlığa doğru gerileme” (English: Reversion/regression towards the mediocrity/mean) adını veriyor. Bir gerileme katsayısı bulmaya çalışıyor. TDK’ya göre vasat kelimesi orta anlamına geliyor. Uzun olan babaların oğulları kısa oluyor. Baba 190 cm iken oğulların boyu 165 cm ortalamaya geriliyor. Ayrıca kısa babaların oğulları da uzun oluyor. Baba 150 cm olsa da çocukları ortalamaya yani 165 cm’ye yaklaşıyor.

 

Serkan Dolma’nın Twitseli: https://twitter.com/TrDolma/status/1335495051510755329