Tanımlayıcı istatistikler verilerin özetlenmesi Flashcards
(12 cards)
• Tanımlayıcı istatistikler
– Değişkenlere ilişkin frekans (sıklık) dağılımlarının elde edilmesi (özet tabloların oluşturulması),
– Değişkenlere ilişkin grafiklerin çizilmesi,
– Değişkenlere ilişkin tanımlayıcı ölçülerin elde edilmesi konularını içerir.
• Tanımlayıcı istatistikler değişkenleri tek bir değerle tanımlamakta/özetlemekte kullanılır.
FREKANS (SIKLIK) TABLOSU
- Veri setlerini oluşturan değişkenler için tek tek frekans tabloları oluşturularak değişkenlerin yapısı (gözlemlerin hangi kategorilerde ya da sınıflarda yoğunlaştığı vb) hakkında daha kolay bilgi elde edilebilir.
- Kan grubu değişkeninin A, B, AB ve 0 olmak üzere dört sınıfı/kategorisi vardır.
- -Frekanslar birim sayısı olarak yazılır.
- -Eklemeli frekans bir önceki birim frekans değeriyle toplanıp o birime yazılır ve böyle devam eder.
- -Göreceli frekans 0.xy şeklinde yazılır ve 100 ile çarpılarak yüzdesel olarak elde edilir.
- -Eklemeli görecel frekansta da mantık eklemeli frekanstaki gibidir.
Nitel verilerin grafiksel sunumunda;
***Sütun (Çubuk) Grafik
• Bir değişkenin kategorilerine ilişkin sıklık ya da yüzdelerin birbirinden ayrı çubuklarla gösterildiği grafik türüdür. Sütun grafiklerde genellikle; – Yatay eksende (x ekseni); incelenen değişkene ilişkin kategoriler, – Dikey eksende (y ekseni); kategorilere ilişkin sayı ya da yüzde değerleri yer alır. Sütun grafiklerde y ekseninde sıklıkların ya da yüzdelerin kullanılması grafiğin şeklini değiştirmez, değişen şey sadece birimdir.
***Pasta Grafik • Pasta grafiği, ilgili nitel değişkene ilişkin kategorilerin bir dairenin parçaları olarak sunulduğu grafik türüdür. • Pasta grafik üzerinde frekanslar veya yüzde değerler verilebilir.
Nicel Veriler için Frekans Tablosu
Kaç sınıf yapılacağı yaklaşık olarak hesaplamak için Sınıf sayısı = 1 + 3,322 . log10N formülü kullanılabilir. Buradan da sınıf genişliği hesaplanabilir
Sınıf genişliği(c)= X1-X2/sınıf sayısı
X1-en büyük
X2-en küçük birim
𝐒ı𝐧ı𝐟 𝐃𝐞ğ𝐞𝐫𝐢:Bir sınıfın sınıf değeri alt ve üst sınırlarının toplamının ortalamasına eşittir.
Sınıflandırma İşleminde Dikkate Alınacak Kurallar
- Sınıflandırma sonucunda, verideki bütün değerler sınıflara dağıtılabilmeli ve hiçbir değer sınıflama dışında kalmamalıdır.
- Sınıflama yaparken sınıflar birbirinin içine girmemelidir.
- Her gözlem sadece bir sınıfta yer almalıdır.
- Sınıf aralıklarının birbirine eşit olacak şekilde düzenlenmesi, istatistiksel çözümlemede kolaylık sağlar.
Nicel verilerin grafiksel sunumunda;
***Histogram
• Her sınıftaki frekansları ya da yüzdeleri gösteren çubukların birbirine bitişik olarak çizildiği ve sayısal veriler için yaygın olarak kullanılan grafik türüdür.
• Sütun grafikte olduğu gibi, genellikle, incelenen değişkenin sınıfları x, sıklık ya da yüzdeleri y ekseninde yer alır.
• x ekseninde sınıfların alt üst sınırları yer alabileceği gibi bu sınıfları temsilen sınıf değeri de yer alabilir
***Kutu-çizgi grafikleri, dağılımın şekli/yapısı ile değişkendeki aşırı gözlemleri gösteren grafiklerdir. • Kutu-çizgi grafikleri, bir sayısal değişkenin – 25., 50. ve 75. yüzdelikleri (Ç1, Ç2, Ç3) – En küçük değer (EKD) – En büyük değer (EBD) dikkate alınarak çizilir.
– Değişkende aşırı değerler varsa bu gözlemler genellikle “∘” ile, çok aşırı değerler ise “∗” ile dikey çubuğun alt ve üst uçlarında belirtilir.
– Kutu-çizgi grafiğinde kutunun alt ve üst kenarlarından (Ç1’den ve Ç3’den); 1,5× Ç3−Ç1 ile 3×Ç3−Ç1 arası uzakta yer alan gözlemler aşırı değer olarak nitelendirilir ve istatistiksel yazılımlarda genellikle “∘” ile gösterilirler.
– Kutunun alt ve üst kenarlarından üç kutu boyu [3× Ç3−Ç1 ] ve daha fazla uzak olan gözlemler ise çok aşırı değer olarak nitelendirilirler ve grafik üzerinde “∗” ile belirtilirler.
• Kutu-çizgi grafiğinin en önemli özelliği dağılımın şeklini tanımlayabilmesidir.
– İncelenen dağılım tek tepeli simetrik ise kutu tam ortada, ortanca da kutunun tam ortasında yer alır.
– Pozitif çarpık dağılımlarda kutu küçük değerlere doğru yönelirken ortanca da kutunun alt kenarına yaklaşır.
– Negatif çarpık dağılımlarda ise kutu büyük değerlere doğru yönelirken ortanca kutunun üst sınırına doğru yaklaşır.
TANIMLAYICI İSTATİSTİKLER
• Tanımlayıcı ölçüler, değişkenleri tek bir değerle tanımlamakta/özetlemekte kullanılırlar.
– Konum Ölçüleri
– Merkezi Eğilim Ölçüleri
– Değişim Ölçüleri
KONUM ÖLÇÜLERİ
***Yüzdelikler bir veride, altında ve üstünde belirli oranda ölçümler bulunan bir noktanın değerini belirtir. • Veriyi 100 eşit parçaya bölen 99 değere; yüze bölenler veya yüzdelikler denir. • Yüzdelikleri hesaplamak için veriler küçükten büyüğe (ya da büyükten küçüğe) doğru sıraya dizilir. • Yüzdelikler genellikle Y harfinin altına ilgili yüzdelik değerinin yazılması ile gösterilirler: Y4, Y10, Y25, Y30, Y90, Y97, vb. • Örneğin bir veride 22. yüzdelik 39 kg ise: – Veride 39 kg’ın altında ya da 39 kg’a eşit ve altında olanların oranının %22, 39 kg’ın üstünde ya da 39 kg’a eşit ve üstünde olanların oranının %78 olduğu anlaşılır.
***Çeyrekler • Veriyi 4 eşit parçaya bölen 3 değere; dörde bölenler veya çeyrekler denir. • Çeyrekler, yüzdeliklerin özel bir durumudur.
– 25. yüzdelik (%25. değer) veya 1. çeyrek (Ç1) veya Y25
– 50. yüzdelik (%50. değer) veya 2. çeyrek (Ç2) veya ORTANCA veya Y50
– 75. yüzdelik (%75. değer) veya 3. çeyrek (Ç3) veya Y75
MERKEZİ EĞİLİM ÖLÇÜLERİ
– Sayı yığınlarının kolayca anlaşılması için sayı yığınlarının en fazla yığıldığı bölgeyi tarif eden tipik değerlerin verilmesi gerekir. – Bu değerler dağılışın merkezini gösterdikleri için merkezi eğilim ölçüleri olarak da bilinir.
• Değişken türüne, dağılımın yapısına, amaçlarının farklı olmasına göre merkezi temsil edecek ölçüler farklılık gösterir ve duruma göre bunlardan veriyi daha iyi tanımlayacak olan ölçünün (bazen birden fazla ölçünün) kullanılması gerekir.
– Aritmetik Ortalama
• Aritmetik ortalama verideki tüm değerleri dikkate alır.
• Birçok istatistiksel hesaplamada sıklıkla kullanılır.
• Verideki aşırı değerlerden etkilenir.
• Popülasyon için 𝜇, örneklem için 𝑥 ile gösterilir
**Sınıflanmış Verilerde Aritmetik Ortalama k: Sınıf sayısı, fi: i. sınıfın frekansı, Xi: i. sınıfın sınıf değer
– Ortanca (Medyan)
• Bir verideki büyüklük sırasına konmuş değerleri iki eşit parçaya bölen değerdir. Dolayısıyla, gözlemlerin %50’si ortancaya eşit ya da onun altında, %50’si de ortancaya eşit ya da onun üzerindedir.
• Ortanca aynı zamanda 50. yüzdeliğe/2. çeyrek değere (Ç2) karşılık gelmektedir.
• Ortanca, aşırı gözlemlerin bulunduğu ve de özellikle dağılımın çarpık olduğu durumlarda kullanılan bir ortalama ölçüsüdür.
• Ortanca verinin orta noktası hakkında bilgi verir.
• Aşırı değerlerden etkilenmez.
• Ortanca, aritmetik ortalamaya göre daha zayıf bir ortalama ölçüsüdür; çünkü aritmetik ortalama tüm gözlemler dikkate alınarak hesaplanırken, ortanca en çok iki gözlem tarafından elde edilir.
• Veri sınıflanmamış olduğunda – Veriler küçükten büyüğe doğru sıraya dizilir. – Gözlem sayısı tek sayılı bir değer ise ortanca; ((n + 1)/2)’inci gözlem değeridir. – Gözlem sayısı çift sayılı bir değer ise ortanca; (n / 2)’inci ile (n + 2)/2’inci gözlem değerlerinin toplanıp 2’ye bölünmesi ile elde edilir.
*sınıflandırılmış verilerden ortanca hesaplamak için önce ortanca sınıfının bulunması gerekir. Bunun için ….den az eklemeli frekans bulunur ve bu kullanılarak (n+1)/2’inci gözlemin düştüğü sınıf ortanca sınıfı olarak tanımlanır.
ortanca= L+ (n/2-fi öncesi)/Fi. c
ORTANCA (MEDYANIN) VARYANSI= 1.57 s2/n Ortancanın varyansı ortalamanınkinden daha büyüktür. Dolayısı ile güvenirliği daha azdır. Bu nedenle mecbur kalmadıkça aritmetik ortalama yerine ortanca kullanılmaz.
– Tepe Değeri (Mod)
• Veride en fazla tekrarlanan değer ya da özelliktir.
• Tepe değeri hem nitel hem de nicel veriler için kullanılabilen bir ölçüdür. • Bir dağılımda birden çok tepe değeri olabilir.
• Tepe değeri, aritmetik ortalama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür.
•Sınıflandırılmış verilerde= L+ d1/(d1+d2).c
•Tepe değerinin (mod) kullanışlı olabilmesi için gözlem sayısının çok fazla olması gerekir.
•Bazı durumlarda dağılışın birden fazla tepe değeri olabilir, yani dağılış çok modlu olabilir. Bu durumlarda örneklemin farklı grupların bir araya gelmesinden oluştuğu anlamı çıkar.
– Geometrik Ortalama
• Geometrik ortalama, geometrik artış gösteren verilerde kullanılır. Birbirinin katları şeklinde artan veriler (2 4 8 16 32 64 … ) geometrik diziye sahiptir.
• Nüfus çoğalması, bakteri üremesi gibi geometrik dizilerde birim zamandaki artışı bulmak için GO kullanılır
*n kök içi tüm n’lerin çarpımı
• Geometrik ortalama aşırı değerlerden aritmetik ortalamadan daha az etkilenir.
• AO ≥GO ilişkisi vardır. Bütün Xİ’ler eşitse AO=GO olur.
• Bazı değerler sıfır veya negatifse GO hesaplanamaz.
•Başlangıçta A kadar birey varsa, bu bireyler birim zamanda r kadar bir hızla artıyorsa, n birim zaman sonra sayıları B kadar olmuş ise
•B= A.(1+r)n olur.
•Ortalama artış (r) buradan hesaplanır.
– Harmonik Ortalama
• Harmonik ortalama daha çok ortalama hızı bulmakta kullanılır.
• Harmonik ortalamada tüm gözlemlerin sıfırdan büyük olması gerekir.
*n/(1/X1 + 1/X2)
– Tartılı Ortalama
* ildeki hastanelerin acili servislerine gelen hastaların ortalama yaşı nedir ? Sorusunun cevabını bulmak için tartılı ortalama bulunur; ti x Xi / t(toplam)
***• Aritmetik ortalama, geometrik ortalama ve harmonik ortalama arasında; AO≥GO≥HO ilişkisi vardır.
• Dağılım negatif çarpık ise; AO ≤ Ortanca ≤ Tepe Değeri • Dağılım simetrik ise; AO = Ortanca = Tepe Değeri • *Dağılım pozitif çarpık ise; Tepe Değeri≤ Ortanca ≤ AO
KESİKLİ VERİLERİN FREKANS TABLOSUNDAN HESAPLAMALAR
Sayılarak elde edilen verilerin çoğunda sıklık tablosu hazırlanırken sınıf değerleri doğrudan alındığı için yeniden bu tip tablolarda sınıf değeri hesaplamak gerekmez.
Ortanca sınıfının değeri (Xi) doğrudan ortanca olarak alınır.
•En yüksek sıklığa sahip sınıf mod sınıfı olduğundan bu sınıfa ait değer doğrudan mod değeri olarak alınır.
ARİTMETİK ORTALAMA, ORTANCA, TEPE DEĞERİN KULLANIMI
Ortanca aritmetik ortalama kadar aşırı düşük veya aşırı yüksek değerlerden etkilenmez. Herhangi bir hastalık geçirmiş kişinin kaç yıl yaşayacağını hesaplamak için ortanca kullanılır. Uç değerler olduğundan ortanca daha iyi temsil eder. Aritmetik ortalama uç değerlerden etkilenir.
•Sıklık (frekans) tabloların alt ve üst sınırları açık uçlu ise bu sınıfların sınıf değerleri hesaplanamayacağı için Aritmetik ortalama hesaplanamaz ama ortanca hesaplanabilir.
• Sıralamalı ölçümlü özelliklerde merkezi eğilim ölçüsü olarak ortancanın kullanılması uygundur.
• Bütün değerlerin elde edilmesinin uzun zaman aldığı bazı durumlarda ortanca kullanımı uygundur. Örneğin öğrenme davranışının incelendiği bir araştırmada bazı bireyler çok geç öğrenebilir, ortalama için bunu beklemek gerekir, ortanca için bunu beklemeye gerek kalmaz.
ORTANCA KULLANMANIN SAKINCALARI NEDİR? •Ortancanın standart hatası aritmetik ortalamadan daha büyüktür.
•Ortanca üzerinde cebirsel işlemler yapılamaz.
*Farklı alt grupların ortancaları biliniyorsa bu gruplar birleştiğinde elde edilen birleşik grubun ortancası nedir sorusu hesaplama ile bulunamaz.
TEPE DEĞERİ
•Aşırı uç değerlerde etkilenmez.
•Örnekte alt gruplar olup olmadığını görmek için frekans eğrisinin modlarının incelenmesi gerekir.
•Ortalamanı hesaplanmasının zor olduğu durumlarda mod kullanılabilir.
•Adlandırma (nominal) ölçekli değişkenlerde mod kullanımı uygundur
•Modun güvenirliliği azdır. Yani örnekten elde edilen mod popülasyon modundan çok farklı olabilir.
•Ortancada olduğu gibi mod üzerinde de cebirsel işlemler yapılamaz.
•Bazen verilerin ortalaması, ortancası olduğu halde modu olmayabilir. Bütün değerler farklı ise mod yoktur. Çarpık dağılışlarda genelde: Ortalama, ortanca ve mod arasında (Ortalama – Mod)= 3* ( Ortalama – Ortanca)
DEĞİŞİM (YAYGINLIK) ÖLÇÜLERİ -bilgi
- Bir değişkendeki/verideki değerlerin birbirine veya ortalamaya göre farklılığını (değişkenliğini) tanımlayan ölçülerdir.
- Bir değişkendeki değerlerin birbirine veya ortalama değere olan uzaklıkları farklılıklar gösterir. Bu farklılıklar yaygınlık/değişkenlik kavramını oluşturur.
- Bir ana kütleyi (popülasyonu) tanıtmak için, veya başka ana kütlelerle karşılaştırabilmek için merkezi ölçülerin yanında dağılışın genişliğini, değişkenliğin büyüklüğünü gösteren değişkenliğin ölçüsü bir tipik değerin verilmesi gerekmektedir. Dağılış veya değişimleri ifade için kullanılan bu ölçümlere dağılış veya değişim ölçüleri denir.
- Varyans ve değişim katsayısı dışında bütün değişim ölçülerinin birimi incelenen değişkenin birimiyle aynıdır. • Genel anlamda, değişim ölçüleri büyüdükçe değişkenlik artarken değişim ölçüleri küçüldükçe değişkenlik azalır.
- Değişim ölçülerinin alabileceği en küçük değer 0 olup bu durumda değişkenlikten söz edilemez.
Değişim (yaygınlık) Ölçüleri
***• Değişim Genişliği (Dağılım Aralığı)-R = En Büy. Değ- EKD
• En basit değişim ölçüsüdür.
• Değişim genişliği verideki diğer değerlerden oldukça farklı değerler olan aşırı değerlerden etkilenmesi ve sadece iki gözlem dikkate alınarak hesaplanması nedeniyle kaba bir değişkenlik ölçüsüdür.
• Değişim genişliği veya buna dayanan ölçütler (IQR, SIQR) aslında çok kullanılan ölçülerdir.
• Diyabetli bir hastanın en küçük ve en yüksek kan glikoz değerleri yada ateşli bir hastanın en düşük ve en yüksek ateş derecesi nedir… ile ilgilenilirken.
• Özellikle sıralı ölçekteki verilerin tanıtıcı istatistikleri verilirken bunlardan yararlanılır.
• Değişim genişliğinde sadece iki aşırı uç değer kullanıldığı için istikrarlı bir ölçü değildir, bilgi kaybı çoktur, çünkü verinin büyük bir kısmı kullanılmamaktadır. • Diğer bir sakıncası değişim genişliği örnek büyüklüğüne çok bağlıdır. Örnek büyüdükçe aşırı değerleri kapsama olasılığı artar.
***• Çeyrek Ayrılış (Çeyrekler Arası Dağılım Aralığı)-IQR
• Verilerin kesikli ya da sürekli sayısal veri türünde olduğu durumlarda eğer dağılımlar çarpıksa (dolayısıyla merkezi eğilim ölçüsü olarak ortanca kullanılıyorsa)
• Ya da veri sıralı bir veri (1., 2., …, 8., … gibi) ise değişim ölçüsü olarak çeyrek ayrılıştan sıklıkla yararlanılır.
• Özellikle araştırıcıların uçtaki değerlerden çok ortadaki değerlerle ilgilendiği durumlarda kullanılır.
• 1. ve 3. çeyrekliklerin farkı alınarak elde edilir.
• Çeyrek Ayrılış= 3. Çeyrek- 1.Çeyrek IQR = Q3 −Q1
***• Yarı Çeyrek Ayrılış (Çeyrek Sapma)
• 1. ve 3. çeyreklikler arasındaki mesafenin yarısıdır
• Bu çeyrekliklerle ortanca arasındaki mesafenin ortalama bir ölçüsü olup bir değişim ölçüsü olarak kullanılabilir.
Yarı Çeyrek Ayrılış= (3. Çey- 1.Çey)/2 SIQR =Q3 −Q12
- Ortalama Mutlak Sapma
- Ortalama mutlak sapma (ayrılış) tüm veriyi kullandığı için değişim genişliğinden daha güçlü bir istatistiktir.
- Ancak bunun sakıncası da, üzerinde cebirsel işlemlerin yapılmasının zorluğudur.
- Yani iki grubun n’leri ve ortalama mutlak sapmaları verilse, bunlar birleştirildiğinde birleşik örneğin ortalama mutlak sapmasını hesaplayın dendiğinde bu bulunamaz.
- Değişim ölçüsünün hesaplanışında verilerin tümü kullanılmadığında, bu şekilde hesaplanan ölçüler daha ileri düzeydeki istatistiksel hesaplamalarda pek kullanılmazlar.
- Bu nedenle, verilerin tümünü kullanan ve istatistiksel açıdan daha güçlü değişim ölçülerine ihtiyaç vardır.
• Varyans
• Bir veride bazı değerler aritmetik ortalamaya yakın bazı değerler uzaktır. Bir verideki bir değerin aritmetik ortalamaya olan uzaklığına (gözlem değeri ile aritmetik ortalama arasındaki farka) sapma (deviation) denir.
• Bu bağlamda verideki yaygınlığı belirlemenin bir yolu; dağılımdaki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalamasının bulunmasıdır.
• Ancak aritmetik ortalamanın özelliği nedeniyle, aritmetik ortalamaya olan uzaklıklarının toplamı her zaman sıfır çıkar.
• Bu nedenle, aritmetik ortalamaya olan uzaklıkların karelerinin ortalaması hesaplanır. Bulunan değer, ortalamadan olan uzaklıkların (sapmaların) bir ölçüsü olarak tanımlanır ve varyans olarak bilinir.
• Popülasyon varyansı σ2, örneklem varyansı S2 ile gösterilir.
• Varyansın birimi ham veri ile aynı olmayıp kareseldir.
** verilerin ao farkının kareleri toplamı / n-1 veya tüm verilerin karesi - (verilerin toplamının karesi / n) / n-1
** sınıflanmış verilerde varyans hesaplaması= fi .si’lerin tek tek karelerinin toplamı - (fi.si lerin toplamının karesi / n) / n-1
- Standart Sapma
- Varyans, ortalamaya göre olan uzaklıkların karelerinin ortalamasını verdiği ve birimi de karesel olduğu için uygulamada daha çok karekökü kullanılır.
- Varyansın kareköküne standart sapma denir.
- Verideki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalama bir göstergesi olarak tanımlanır.
- Standart sapmanın birimi incelenen değişkenin birimi ile aynıdır.
- Standart sapmanın alacağı en küçük değer diğer değişim ölçüleri gibi 0’dır.
- Popülasyon için σ, örneklem için S ile gösterilir.
- ‘bu değişkendeki değerler, değişkenin aritmetik ortalaması etrafında, ortalama ±x birimlik değişkenliğe /yaygınlığa sahiptir’ yorumu yapılır.
- Verideki tüm değerleri dikkate almakla birlikte, standart sapmanın tek tepeli simetrik dağılımlarda (merkezi eğilim ölçüsü olarak aritmetik ortalamanın kullanıldığı dağılımlarda) değişim ölçüsü olarak kullanılması önerilmektedir.
- Tek tepeli simetrik dağılımlar ortalama ve standart sapması ile birlikte tanımlandığı için uygulamada bu tür dağılımlar kısaca 𝐗 ±𝐒 gösterimi ile özetlenir.
- Standart sapma bazı matematik-istatistiksel özellikleri nedeniyle temel ve ileri istatistiksel hesaplamalarda çok sık kullanılan ölçülerden biridir.
- Aritmetik ortalama ± 3(S) değerlerinin dışında kalan gözlemler sıklıkla aşırı gözlem olarak nitelendirilebilmektedir.
- Normal dağılımda(tek tepeli çarpık olmayan) gözlemlerin %68,27’si ortalamanın ± 1 standart sapma, gözlemlerin %95,45’i ± 2 standart sapma, %99,7’si ± 3 standart sapma sağında ve solunda(iç kısmında) yer alır.
- Çarpık dağılımlarda bu tip bir ilişkiden bahsetmek söz konusu değildir. Bu nedenle çarpık dağılımlarda güven sınırından bahsetmek anlamsız olur.
• Standart Hata
• Türk basketbol oyuncularının boy uzunluğu değerlerinin popülasyonda normal veya normale yakın bir dağılım gösterdiğini varsayalım.
• Bu popülasyondan gözlem sayısı (n) aynı olan olası tüm örneklemleri çekip bu örneklemlerin ortalamalarını bulalım.
• Örneklem ortalamalarının oluşturduğu bu dağılıma ortalamanın örneklem dağılışı adı verilir. • Ortalamalara ilişkin bu dağılış normal dağılım gösterir ve ortalaması popülasyon ortalamasına (𝜇) eşittir.
• Ortalamanın örneklem dağılışının standart sapmasına (ortalamaların 𝜇’ye ne kadar yakın olduğunun bir göstergesi) standart hata adı verilir. İlgili istatistiğin popülasyon parametresine ne kadar yakın olduğu konusunda bilgi verir.
***sigma x = sigma / kök n = kök (varyans/n)= z
—güven sınırı = x - mu / (sigma / kök n)
Dağılış simetrik ise ana kütle ortalamasına (mü) ait güven sınırı hesaplanabilir.
x-z(a/2) x standart hata _< mü _< x+ z(a/2) x standart hata (alt üst güven sınırları bulunur)
Bulduğumuz güven sınırının gerçek ortalamayı (mü) kapsadığını %95 güvenle söyleyebiliriz.
• Standart hata yardımıyla, ilgili istatistik için; –Güven aralıkları hesaplanabilmekte, –Çeşitli hipotez testleri uygulanabilmektedir.
- Değişim (Varyasyon) Katsayısı
- Standart sapma bir değişkenin değişkenliğini gösteren ölçülerden biridir, ancak standart sapmanın büyüklüğüne bakarak bir değişkenin değişkenliği konusunda yargıya varmak güçtür.
- Örneğin bir değişkenin standart sapması 6,3 ise bu değerin büyük, küçük ya da normal bir sapma olduğu konusunda bir yargıya varılamaz.
- Çünkü ortalamalar arttıkça genellikle değişkenlik de artma eğilimindedir ve bu süreçte ortalamaların dikkate alınması gerekir.
- Örneğin, iki (veya daha fazla) sınıftaki öğrencilerin aynı derse ilişkin başarı puanları ortalamaları eşit ise standart sapması küçük olan sınıfın başarı puanlarının daha homojen olduğu söylenilir, ancak değişkenliğin büyüklüğü konusunda bir şey söylenemeyecektir.
- Bu gibi nedenlerle, değişkenliği ortalama etrafında yüzde değişim ile ifade etmek iyi bir yaklaşım olacaktır.
- Bu amaçla değişim katsayısından sıklıkla yararlanılır.
- Değişim katsayısı (DK) standart sapmanın ortalamaya göre standartlaştırılması olup, standart sapmanın ortalama etrafında yüzde kaçlık bir değişim gösterdiği konusunda bilgi verir.
- DK=(Standart sapma/Aritmetik ortalama) x 100
- Merkezi eğilim ölçüsü olarak ortancanın kullanıldığı veriler için değişim katsayısı aşağıdaki gibi hesaplanır; DK = Sx ×100 DK = Yarı Çeyrek Ayrılış(ç3-ç1 /2)/ ortanca (ç2)
- Değişim katsayısı değişkenin ölçüm biriminden bağımsızdır ve % ile gösterilir.
- DK, ölçü biriminden bağımsız olması nedeniyle ortalamaları farklı olan değişkenlerin değişkenliğini karşılaştırmanın yanı sıra farklı ölçü birimlerine sahip değişkenlerin yaygınlıklarını karşılaştırmak amacıyla da kullanılır.
- DK’nın %0’a yaklaşması değişkenliğin azaldığını gösterirken, DK’nın %25’in üzerinde olması incelenen değişkenin oldukça değişken olduğunu gösterir.
- A ve B gibi iki farklı popülasyondaki değişkenliği karşılaştırmak istersek doğrudan standart sapma veya standart hatalarına bakmak yanıltıcı olabilir.
- Ana kütlelerin ortalamaları büyüklük olarak birbirinden çok farklı ise (fillerin ağırlığımı daha değişkendir, farelerin ağırlığımı ?) standart sapma değerlerini ölçü biriminden bağımsız hale getirmek gerekir. Bunun için Değişim(varyasyon) kullanılır.
- İki özellik farklı birimlerle ölçülüyorsa, örneğin üzerlerinde deneme yapılan farelerin kan şekeri mi daha değişkendir yoksa vücut ağırlıkları mı sorusu ile karşılaşılsa bunun için varyasyon katsayılarına bakmak gerekir.