Standart Sapma ve Varyans Nedir?

8
219

Varyans ve Standart Sapma Nedir?

Sınıfımızda 30 öğrencinin girdiği ve 30 sorudan oluşan bir sınav yapılmış olsun. Öğrencilerin sınav sonucunda yaptıkları doğru soru sayıları aşağıda görebileceğiniz üzere birbirinden farklı. Sınavda 3 doğru yapan da var 30 doğru yapan da var. Sınıfın (doğru cevap) ortalamasına bakıyoruz 16.87 olmuş. (ortalama = tüm öğrencilerin doğru sayısının toplamı bölü öğrenci sayısı)

Sizce ortalama 16.87 doğru cevap sayısı, sınıfın genel başarısı açısından bize ne söylüyor? Ortalama olarak / genel olarak sınıfın sınavda sorulan konuları anladığını düşünebilir miyiz?

Örneğimizi ilerletelim; Bir arkadaşınız sınıfa geldi. 100 üzerinden değerlendirilen İktisada Giriş – ECON101 final sınavında sınıfın not ortalamasının 100 üzerinden 50 olduğunu söyledi. Sınıf ortalaması 0 ile 100’üm tam ortasında. Bu sınıfın başarısı, sınavın zorluk derecesi hakkında ne diyebiliriz?

Sınıf Ortalaması neden 50 oldu? Herkes sınavda 50 aldığı için olabilir mi?

Belki de sınıfın yarısı 100 yarısı 0 aldığı ortalama 50 olmuş olabilir mi? 

Belki de sınıfın yarısı 75, yarısı 25 aldı. Sonuç olarak ortalama 50 çıktı! Sınıf ortalaması tek başına size bu bilgileri kesin olarak veremez!

Ortalama, bize sınav puanlarının sınıf içinde ne kadar değişkenlik gösterdiğini söylemez. Bunun için ortalamadan başka bir şey bulmak gerekiyor. Öyle bir endeks yaratalım ki ortalamadan ne kadar uzaklaşıldığı, değişkenlik olduğu hakkında bize fikir versin.

Burada biraz daha matematiksel işlem yapacağız;

Önce herkesin sınav puanından, sınıfın ortalamasını çıkaralım. Her öğrenci için ayrı ayrı ortalamadan farkı bulduk. Sonra da bulduğumuz ortalamadan farkları toplayıp, kişi sayısına bölelim. Bir çeşit “ortalamadan farkların” ortalama değerini bulalım.

Kimi öğrenci ortalamadan -24 uzaklaşmış kimi öğrenci ortalamadan +45 uzaklaşmış. Bütün bu negatif ve pozitif sayıları topladığımızda ortalamadan farkların toplamı kaç oldu? Kocaman bir sıfır! Sıfırı öğrenci sayısına bölsek yine sıfır. Demek ki ortalamalardan farkların toplamını topladığımızda, toplam her zaman sıfır çıktığı için değişkenlik ölçüsü olarak olduğu gibi kullanamıyoruz.

Burada ufak bir hileye başvuracağız. Negatif ve pozitif sayıların, birbirini götürmemesi için ufak bir hile yapacağız. Teker teker elde ettiğimiz Ortalamadan Farkların Karesini Alarak hepsini pozitif hale getireceğiz.

Öğrenci Sınav Puanı Ort. Farklar Ort. Farkların Karesi Öğrenci Sınav Puanı Ort. Farklar Ort. Farkların Karesi
Öğr. 1 74 24 576 Öğr. 16 100 50 2500
Öğr. 2 42 -8 64 Öğr. 17 21 -29 841
Öğr. 3 67 17 289 Öğr. 18 21 -29 841
Öğr. 4 26 -24 576 Öğr. 19 68 18 324
Öğr. 5 68 18 324 Öğr. 20 40 -10 100
Öğr. 6 85 35 1225 Öğr. 21 19 -31 961
Öğr. 7 61 11 121 Öğr. 22 95 45 2025
Öğr. 8 48 -2 4 Öğr. 23 16 -34 1156
Öğr. 9 34 -16 256 Öğr. 24 13 -37 1369
Öğr. 10 65 15 225 Öğr. 25 28 -22 484
Öğr. 11 95 45 2025 Öğr. 26 6 -44 1936
Öğr. 12 59 9 81 Öğr. 27 88 38 1444
Öğr. 13 50 0 0 Öğr. 28 33 -17 289
Öğr. 14 44 -6 36 Öğr. 29 71 21 441
Öğr. 15 12 -38 1444 Öğr. 30 51 1 1

 

Teker teker Ortalamadan farkların karesini aldık. Negatif bir şey kalmadı. Hepsi pozitif oldu.

Artık ortalamadan farkların karelerini toplayıp, öğrenci sayısına bölerek “ortalamadan farkların” ortalama değerini ya da “ortalama değişkenliği” hesaplayalım.

Ortalamadan Farkların Karelerinin Toplamı 21958
Öğrenci Sayısı 30
  21958 / 30
Ortalama Değişkenlik: VARYANS 731.933333333333

 

Artık ortalamadan sapmaları,farklılıkları açıklayabileceğimiz endeks değerimiz var.

Öğrencilerin genel olarak sınav puanlarının, sınıf ortalamasından 731.9 değişkenlik gösterdiğini bulduk. 731.9 değişkenlik. 731.9?

Nasıl yani 100 puan üzerinden 731 değişkenlik mi? Sınavda 50+731.9 yani 831 puan alan mı var? Tabi ki yok. Yanlış yapmadık.

Hatırlayalım negatif ve pozitif sayıların birbirini götürmemesi için ortalamaladan farkların karesini almıştık. Karelerini aldığımız sayıların sayesinde bulduğumuz ortalama değişkenlik değeri bize varyans yani ortalama değişkenlik değerini vermiş oldu.Sınavın varyans değeri,  sınavın maksimum değerinden bile yüksek çıkabilir.

Örneğin ortalamanın 50 olduğu bir sınavda 70 alan bir öğrenci, ortalamadan 20 puan farklı puan almıştır. Biz de o farkın yani 20’nin karesini kullanarak hesaplama yaptık. Kare alma işlemi sonucunda değişkenlik değerini elde ettiğimiz için bulduğumuz değer 731 puan kare olarak okunabilir. Varyans değeri “ortalama değişkenlik değerini” gösteren doğru bir değer olsa da sınav puanı üzerine konuşurken sınav puanın karesi cinsinden yorumlama yapmaya çalışmak kafaları karıştırır. “Sınıfın ortalama değişkenliği 850’dir” derseniz anlaşılması güçtür.

Bunun için bir işlem yapıp karesini aldığımız değerler sonucu elde ettiğimiz varyans değerini eski haline döndüreceğiz. Karekökünü alacağız!

Ta Ta taammm. Ortalamadan değişkenliğin yani varyansın karekökü bize standart sapmayı verdi! 27.05 puan!

  • Varyans ve standart sapma arasında ölçüm birimi bakımından fark var.
  • Varyans: ölçtüğümüz şeylere ait birim ne ise (boy, kilo,not, yaş v.b.) onun karesi cinsinden bir değerdir. Bizim örneğimizde puan kare diyebiliriz. 731 puan kare ortalamadan değişkenlik.
  • Standart sapma: ölçtüğümüz şeyin biriminden hesap yapabileceğimiz bir değer. Bizim örneğimizde 27.05 puan cinsinden ortalamadan değişkenlik. 27.05 puan kadar standarttan sapma da diyebiliriz

Standart sapmanın yüksek veya düşük olmasını nasıl yorumlarız?

Standart sapma kendi başına “iyi” veya “kötü” bir şey değildir. Standart sapma bir değişkenlik göstergesidir. Elimizdeki gözlemlerin, belirli bir aralıkta nasıl dağıldığı hakkında fikir verir. Yeri gelir standart sapmanın yüksek olmasını ya da düşük olmasını isteyebiliriz.

Örneğin bir matematik sınavının sonuçları üzerinden yorum yapalım. Hocanın tüm öğrencilerin dersten geçmesini istediği için çok çok kolay sorular sorduğu, başarısız bir öğrencinin bile yüksek aldığı bir sınavda hem ortalama yüksek çıkar hem de standart sapma düşük çıkar. Şöyle ki sınav çok kolay olduğu için herkes yüksek alır. Herkes yüksek aldığı için sınavın ortalaması yüksek olur. Herkes yüksek ve ortalamaya yakın bir not aldığı için de standart sapma düşük çıkar.

Sadece çalışan öğrencilerin dersi geçtiğinden emin olmak isteyen bir hoca için peki durum nedir? Böyle bir sınavda ortalama 50 olsa da standart sapma yüksek çıkacaktır. Çalışan öğrenciler yüksek puan alır, çalışmayanlar düşük puan alır. Ortalama 50 olur. Fakat standart sapma yüksek çıkar. Standart sapmanın yüksek olması sınav sorularının “başarıyı ölçen” kaliteli sorulardan oluşturduğunu göstermiştir.

Verilerin Dağılımına Bakarak Standart Sapmayı Teşhis Etme

Varyans ve standart sapma bize verilerin dağılımı hakkında da bilgi verir demiştik. Grafikler üzerinden de standart sapma ve varyans hakkında yorum yapabiliriz. Aşağıdaki grafikte sol tarafta bulunan histogram (platykurtic dağılım) standart sapmanın yüksek olduğunu, sağ taraftaki (leptokurtic dağılım) ise düşük olduğunu göstermektedir.

Soldaki grafikte standart sapma yüksek, sağdakinde standart sapma düşüktür.

 

leptokurtic ve platykurtic
leptokurtic ve platykurtic

Kendi veri setimize geri dönelim. Sınıf ortalamasının 50 olduğu veri setimizde, standart sapmamız 27.02 çıkmıştı. Standart sapma 10 olsaydı, veriler 50 etrafında leptokurtik şekilde toplanırdı. Dağılım grafiğine baktığımızda gözlemler ortada birikirdi.

Bizim örneğimizde standart sapma 27 gibi bir değer aldı. 100 üzerinden değerlendirdiğimizde oldukça yüksek. Yani platykurtik olma ihtimali fazladır

Aşağıdaki histogramda Sınav puanı grafiğimizi beşer puan aralığında sıraladığımızda dağılımın nasıl olduğunu görüyoruz. Kısaca standart sapma yükseldikçe dağılım grafiği şişmanlar. Genişler. Standart sapma azaldıkça ise dikleşmeye leptokurtic olmaya başlar.

Subscribe
Bildir
guest
8 Yorum
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
Mehmet

Çok güzel ve temiz bi şekilde açıklamışsınız teşekkürler.

tuba

bunca sene sonra ilk defa varyansı anladım çok teşekkür ederim

arzu

cok teşekkür ediyorum emekleriniz ve bu sade güzel paylaşımınız için.

Güneş

Çok açıklayıcı, teşekkürler.

Hümeyra

Bu kadar açıklayıcı ve kolaylaştıran yazınız için teşekkürler 💯❤️