Standart Sapma ve Varyans Nedir?

1
55

Varyans ve Standart Sapma Nedir?

Sınıfımızda 30 öğrencinin girdiği ve 30 soruluk bir sınav yapılmış olsun. Öğrencilerin sınav sonucu doğru sayıları birbirinden farklı. 3 doğru yapan da var 30 doğru yapan da var. Sınıfın doğru ortalamasına bakıyoruz 16.87 olmuş. (ortalama = tüm öğrencilerin doğru sayısının toplamı bölü öğrenci sayısı)

Sizce 16.87 doğru sınıfın genel başarısı açısından bize ne söylüyor? Sınıfın ortalama olarak konuları anladığını düşünebilir miyiz?

Soruyu şöyle sorayım bir arkadaşınız sınıfa geldi ve 100 üzerinden değerlendirilen klasik ECON101 final sınav ortalamasının 100 üzerinden 50 olduğunu söyledi.

Bu sınıf hakkında ne diyebiliriz?

Neden ortalama 50 oldu? Herkes sınavda 50 aldığı için mi ortalama 50 oldu?

Ya da sınıfın yarısı 100 yarısı 0 aldığı için mi ortalama 50 oldu?

Sınıf ortalaması tek başına size bu bilgiyi verir mi? Belki sınıfın yarısı 75 yarısı 25 aldı ve ortalama 50 çıktı! Ortalama değer bize sınav puanlarının sınıf içinde ne kadar değişkenlik gösterdiğini söylemez. Bunun için ortalamadan başka bir şey bulmamız lazım. Öyle bir endeks yaratalım ki ortalamadan ne kadar uzaklaşıldığı hakkında bize fikir verebilsin.

Herkesin değerinden ortalamayı çıkaralım, sonra da ortalamadan farkları toplayıp kişi sayısına bölelim. Bir çeşit “ortalamadan farkların” ortalama değerini bulalım.

Negatif ve pozitif sayıların birbirini götürmesi için ufak bir hile yapacağız. Ortalamadan Farkların karesini alarak hepsini pozitif hale getireceğiz.
Ortalamadan yüksek alanlar ve ortalamadan düşük alanlar birbirini götürdü. Ortalamalardan farkın toplamı kaç çıktı? Sıfır çıktı! Ortalamalardan farkların toplamı sıfır çıktığı için değişkenlik ölçüsü olarak olduğu gibi kullanamıyoruz.

Öğrenci Sınav Puanı Ort. Farklar Ort. Farkların Karesi Öğrenci Sınav Puanı Ort. Farklar Ort. Farkların Karesi
Öğr. 1 74 24 576 Öğr. 16 100 50 2500
Öğr. 2 42 -8 64 Öğr. 17 21 -29 841
Öğr. 3 67 17 289 Öğr. 18 21 -29 841
Öğr. 4 26 -24 576 Öğr. 19 68 18 324
Öğr. 5 68 18 324 Öğr. 20 40 -10 100
Öğr. 6 85 35 1225 Öğr. 21 19 -31 961
Öğr. 7 61 11 121 Öğr. 22 95 45 2025
Öğr. 8 48 -2 4 Öğr. 23 16 -34 1156
Öğr. 9 34 -16 256 Öğr. 24 13 -37 1369
Öğr. 10 65 15 225 Öğr. 25 28 -22 484
Öğr. 11 95 45 2025 Öğr. 26 6 -44 1936
Öğr. 12 59 9 81 Öğr. 27 88 38 1444
Öğr. 13 50 0 0 Öğr. 28 33 -17 289
Öğr. 14 44 -6 36 Öğr. 29 71 21 441
Öğr. 15 12 -38 1444 Öğr. 30 51 1 1

 

Ortalamadan farkların karesini aldık. Hepsi pozitif oldu.Şimdi ortalamadan farkların karelerini toplayıp öğrenci sayısına bölüp ortalama değişkenliği hesaplayalım.

Ortalamadan Farkların Karelerinin Toplamı 21958
Öğrenci Sayısı 30
Ortalama Değişkenlik: VARYANS 731.933333333333

 

Şimdi ortalamadan sapmaları açıklayabileceğimiz bir endeks değerimiz var. Öğrenci puanlarının sınıf ortalamasından 731.9 değişkenlik gösterdiğini bulduk. 731.9 değişkenlik. 731.9? 100 puan üzerinden 731 değişkenlik nasıl yani? 50+731.9 yani 831 puan alan mı var? tabi ki yok. Yanlış yapmadık.

Hatırlayalım negatif sayılardan kurtulmak için ortalamaların karesini almıştık. Karelerini aldığımız sayılar nedeniyle bulduğumuz ortalama değişkenlik değeri ile varyansı bulmuş olduk. Sınavın varyans değeri sınavın maksimum değerinden bile yüksek çıkabilir. Ortalamanın 50 olduğu sınavda 70 alan biri ortalamadan 20 puan farklı puan almıştır. Biz de  o yirminin karesini kullanarak hesaplama yaptık. Bulduğumuz değer 731 puan kare olarak okunabilir. varyans değeri doğru bir değer olsa da yorumlama yaparken sorun yaratır. Yorumlarken

Karesini aldığımız değerin şimdi de karekökünü alalım.

Ta Ta taammm. Standart sapmayı bulduk. 27.05 puan!

  • Varyans ve standart sapma arasında ölçüm birimi bakımından fark var.
  • Varyans: ölçtüğümüz şeylere ait birim ne ise (boy, kilo,not, yaş v.b.) onun karesi cinsinden bir değer. Örneğimizde puan kare diyebiliriz. 731 puan kar.
  • Standart sapma: ölçtüğümüz şeyin biriminden hesap yapabileceğimiz sonuç verir. Puan cinsinden ortalamadan değişkenlik miktarı.

Standart sapmanın yüksek veya düşük olmasını nasıl yorumlarız?

Standart sapma “iyi” veya “kötü” bir şey değildir. Standart sapma bir göstergedir. Baktığımız veri setindeki gözlemlerin nasıl bir aralıkta dağıldığı hakkında fikir verir. Duruma göre standart sapmanın yüksek olmasını veya düşük olmasını isteyebiliriz.

Bir matematik sınavını göz önünüze getirin. Hocanın kolay sorular sorduğu bir sınavda herkes yüksek ve ortalamaya yakın not alır. Sonuç olarak da standart sapma düşük çıkar. Öğrencilerin başarı düzeylerinin farklı olduğunu ve hocanın gerçekten başarılı öğrencilerin dersi geçmesini istediğini varsayalım. Soru zorluk seviyesine göre standart sapma da yüksek çıkacaktır. Standart sapmanın yüksek olması sınav sorularının “başarıyı ölçen” kaliteli sorulardan oluşturduğunu gösterir.

Varyans ve standart sapma bize verilerin dağılımı hakkında da bilgi verir. Ortalamanın

Soldaki grafikte standart sapma yüksek, sağdakinde standart sapma düşüktür.

 

leptokurtic ve platykurtic
leptokurtic ve platykurtic

Kendi veri setimize ger dönelim. Sınıf ortalamasının 50 olduğu veri setimizde standart sapmamız 27.52 çıkmıştı. Standart sapma 0 olsaydı veriler 50 etrafında leptokurtik şekilde yani dağılım grafiğine baktımızda veriler ortada birikirdi

Bizim örneğimizde standart sapma 27 gibi ir değer aldı. 100 üzerinden değerlendirdiğimizde oldukça yüksek. Yani platykurtik olma ihtimali fazla. Sınav puanı grafiğimizi beşer puan aralığında sıraladığımızda dağılımın nasıl olduğunu görüyoruz. Kısaca standart sapma yükseldikçe dağılım grafiği şişmanlar. Genişler. Standart sapma azaldıkça ise dikleşmeye leptokurtic olmaya başlar.

Subscribe
Notify of
guest
1 Yorum
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Mehmet

Çok güzel ve temiz bi şekilde açıklamışsınız teşekkürler.