İKİ BAĞIMSIZ GRUP KARŞILAŞTIRMASI Flashcards
(10 cards)
Parametrik ve Parametrik Olmayan Hipotez Testleri
- İstatistiksel yöntemlerin bir bölümü, örneklemlerin çekildiği popülasyon dağılımının bilindiği varsayımına dayalıdır. Popülasyon dağılımının bilindiği varsayımına dayalı hipotez testlerine parametrik hipotez testleri denir . Örneğin iki ortalama arasındaki farkın önemlilik testinde ve varyans analizinde gözlemlerin normal dağılım gösteren evrenden çekildiği ve varyansların da benzer olduğu varsayılır .
- Popülasyon dağılımları konusunda herhangi bir bilginin ya da varsayımın bulunmadığı hipotez testlerine parametrik olmayan ( non - parametric ) hipotez testleri adı verilir .
- İncelenen grupların normal dağılıp dağılmaması, varyansların homojen olup olmaması, verilerin nitel ya da nicel (sürekli - kesikli sayısal) veri türünde olması, gruplardaki gözlem (denek) sayısı, kullanılacak testin parametrik veya non - parametrik olacağının belirlenmesi için gerekli etkenlerdir . Bu kısıtlayıcılar dikkate alınarak seçilecek parametrik veya non-parametrik hipotez testi, grupların bağımlı ya da bağımsız olmasına göre değişiklik gösterir .
- Bağımlı gruplar : Bir gözlem (denek) üzerinde birden çok ölçüm yapıldığında gruplar bağımlı olur . Aynı bireylerin iki ya da daha fazla ölçüm aracıyla ölçüldüğü bir çalışmada gruplar bağımlıdır . Benzer şekilde, iki ya da daha fazla ölçücünün bir özelliği aynı düzeyde ölçüp ölçmediğinin incelendiği bir çalışmada da gruplar bağımlı olur .
- Bağımsız gruplar : Bir grupta bulunan bir birey (gözlem) diğer grup ya da gruplarda yer almıyorsa karşılaştırılacak gruplar bağımsızdır .
Parametrik Hipotez Testleri
• Parametrik hipotez testlerinde, test istatistikleri hesaplanırken ilgili formüllerde, gözlenen verilere ilişkin popülasyon değerlerinin (parametrelerin) veya bunların kestiricileri olan ortalama ( x ) , oran ( p ) , standart sapma S gibi ölçüler kullanılır .
• Parametrik tek örneklem testlerindeki tek varsayım, örneklemin çekildiği popülasyonun normal dağılım göstermesidir .
• İki ve k gruba ilişkin parametrik hipotez testlerinde (Student - t testi, tek yönlü varyans analizi, vb) iki varsayım vardır ;
– Örneklem( ler )in çekildiği popülasyon( lar ) ın normal dağılım göstermesi,
– Popülasyon varyanslarının homojen olması .
• Bu varsayımlar, ilgili değişken( ler )in popülasyon dağılımı konusunda herhangi bir bilgi yoksa, üzerinde çalışılan örneklem( ler )in incelenmesi yardımıyla sınanır
• Normal dağılım varsayımının sağlanmadığı durumlarda parametrik testleri uygulayabilmek için örneklemlerdeki gözlem sayılarının 30 ya da 30 ’un üzerinde olması istenir .
• Normal dağılım varsayımının sağlandığı ancak varyansların homojen olmadığı durumlar için geliştirilmiş parametrik testler olmakla birlikte bu testlerin parametrik olmayan karşılıklarının kullanılması bir seçenektir .
Parametrik Olmayan Hipotez Testleri
- Parametrik olmayan hipotez testlerinde, test istatistiklerinin hesaplanmasında gözlenen veriler yardımıyla elde edilen sıra sayıları/sıra numaraları (rank) ya da işaretler ya da gözlenen - beklenen sıklık sayıları, vb . sıklıkla kullanılır .
- Parametrik olmayan hipotez testlerinde popülasyon dağılımları konusunda herhangi bir varsayım yoktur .
Varyansların Homojenlik Testi
• Uygulamada sık karşılaşılan hipotez testleri daha çok dağılımların merkezi eğilim ölçüleri (ortalama, ortanca, oran) üzerine kuruludur .
• Bazı hipotez testleri dağılımların yaygınlığının homojenliği (benzerliği) varsayımını gerektirmekte, dolayısıyla yaygınlıkların benzerliğinin belirlenmesi yalnızca bu amaç çerçevesinde ele alınmaktadır .
• Dağılımların yaygınlıklarının test edilmesine yönelik en bilinen testler varyanslar üzerine kuruludur .
• İki ya da daha fazla grubun varyanslarının (dolayısıyla standart sapmalarının) homojenliğini test etmek için değişik test yöntemleri vardır . Bunlardan bazıları :
– Levene Testi
– Cochran C Testi
– Bartlett Testi, vb .
• Bu test yöntemleri daha çok kuramsal F dağılışına dayalıdır . ( Bartlett testinde ki - kare dağılımından yararlanılır) .
• Test yaklaşımlarının en basiti, büyük varyansın küçük varyansa bölünmesi ile elde edilen F Hesap istatistiğinin F Tablo değeri ile karşılaştırılması temeline dayanan yaklaşımdır . Bu yaklaşım, ikiden fazla gruba ilişkin varyansların homojenliğinin test edilmesinde de sadece en büyük ve en küçük varyansı dikkate aldığı için iki örneklem testleri kapsamında düşünülür .
• Uygulamada göz ardı edilmekle birlikte varyansların homojenlik testinin en önemli varsayımı, evren (popülasyon) dağılımlarının normal dağılım göstermesidir .
1. Hipotezlerin belirlenmesi
H0 : Varyanslar homojendir ( σ 2 1 = σ 2 2 = ⋯ = σ 2 k ) H1 : En az iki grubun varyansı homojen değildir(σ2𝑖≠σ2𝑗) 2. Önem düzeyinin belirlenmesi (a)
3. Test istatistiğinin hesaplanması
F Hesap = 𝑆 2 𝐸𝑛 𝑏ü𝑦ü𝑘 / 𝑆 2 𝐸𝑛 𝑘üçü𝑘
4. İstatistiksel karar
𝑛1 − 1 : en büyük varyanslı grubun serbestlik derecesi
𝑛2 − 1 : en küçük varyanslı grubun serbestlik derecesi
- Varyansların homojenliğini test etmek için kullanılan testlerden bir diğeri de LEVENE testidir .
- Bu amaçla, veriler bir istatistiksel yazılıma aktarılır .
- Levene test istatistiğine ilişkin 𝑝 değeri, 𝛼 = 0,05 olarak alındığında, p<0,05 olarak bulunursa varyansların homojen olmadığı söylenir .
F Dağılışı ve Kullanım Yerleri
- F dağılımı istatistiksel çözümlemede çok kullanılan kuramsal dağılımlardan biridir . Örneğin bağımlı ve bağımsız grup ortalamalarının karşılaştırılmasında kullanılan tek, iki ve daha fazla etkenli/yönlü varyans analizleri F dağılımı yardımıyla yapılır .
- Örneklemden elde edilen F Hesap değeri, örneklemden elde edilen iki varyans kestiriminin birbirine oranlanması ile elde edilir ve belli varsayımlar altında bu oran kuramsal F dağılışına uyar .
- Varyans kestirimleri farklı testler için farklı şekilde hesaplanır . Örneğin iki varyansın homojen olup olmadığının test edilmesinde büyük varyans küçük varyansa bölünerek bir F Hesap değeri elde edilirken, grup ortalamalarının farklı olup olmadığının test edilmesinde kullanılan iki varyans kestirimi farklı bir yaklaşımla elde edilir ve F Hesap değeri bu varyans kestirimlerinin oranlanması ile bulunur .
- Varyanslar pozitif olduğundan, F Hesap istatistiğinin değeri 0 ’dan, büyük pozitif sayılara kadar değişir .
- Kuramsal F dağılımı kritik değerleri tabloları farklı alfa düzeyleri ve iki adet serbestlik derecesi (yukarıdan aşağıya ve soldan sağa)dikkate alınarak hazırlanmıştır .
- Test sürecinde hesapla bulunan F istatistiği [ F Hesap ( 𝑠𝑑 1 , 𝑠𝑑 2 , 𝛼 ) ], kuramsal F tablosu istatistiği [ F Tablo ( 𝑠𝑑 1 , 𝑠𝑑 2 , 𝛼 ) ] ile karşılaştırılır .
POPÜLASYON ORTALAMASI ÖNEMLİLİK TESTİ
• İncelenen değişkene ilişkin örneklem ortalamasının, ortalaması μ0 olan bir popülasyondan çekilip çekilmediğinin veya belirli bir popülasyona ait olup olmadığının test edilmesidir .
• Bu tür bir çalışmada ;
– İncelenecek tek bir örneklem grubu vardır .
– Veriler sürekli sayısal veri türünde olmalıdır .
– Popülasyondan çekilen tek grup olduğu için varyansların homojenliği varsayımı bu test için gerekli değildir .
– Popülasyon normal dağılmalıdır . Popülasyon dağılımı konusunda bir bilgi yok ise normal dağılıma uygunluk, incelenen örneklem yardımıyla belirlenir .
• Ortalamaların örneklem dağılışı, popülasyon normal ise gözlem sayısından bağımsız olarak normal dağılım gösteriyor, gözlem sayısı yeterince büyükken (n > 30 ) ise, popülasyon dağılımının şeklinden bağımsız olarak normale yaklaşır .
• Bu testte bu bilgiden yararlanılır ve elde edilen gözlem sayısına göre t ya da standart normal z dağılımı yardımıyla test işlemleri yapılabilir .
Test Süreci;
1. Hipotezlerin belirlenmesi
H0 : μ = μ 0
H1 : μ ≠ μ 0 veya H 1 : μ < μ 0 veya H 1 : μ > μ 0
2. Önem düzeyinin belirlenmesi Örneğin 𝛼 = 0 , 05 olarak önceden belirlenir .
3. Test istatistiğinin hesaplanması
– Popülasyon normal dağıldığında ve popülasyon standart sapması bilindiğinde z istatistiğinden yararlanılır .
𝑧 = (𝑥 − 𝜇) / (𝜎/𝑛)
– Popülasyon normal dağıldığında ve popülasyon standart sapması bilinmediğinde ve de gözlem sayısı yeterli (n > 30 ) olduğunda z istatistiği kullanılır .
𝑧 = (𝑥 − 𝜇) / (𝑆/𝑛)
– Popülasyon normal dağıldığında ve popülasyon standart sapması bilinmediğinde ve de gözlem sayısı az (n < 30 ) olduğunda t istatistiği [(n – 1 ) serbestlik dereceli t dağılımı] kullanılır .
𝑡 = (𝑥 − 𝜇) / (𝑆/𝑛)
• Uygulamada daha çok t istatistiğinden yararlanılır ; çünkü çoğu zaman popülasyon standart sapması bilinmez ve gözlem sayısı da çok fazla değildir . Hatta gözlem sayısı 100 ve altında olduğu durumlarda bile genellikle t istatistiğinden yararlanılır .
– Popülasyon normal dağılmıyor veya popülasyonun dağılımı hakkında bir bilgi yok ve de n < 30 ise bu testin parametrik olmayan karşılığını kullanmak daha sağlam bir test istatistiği elde edilmesini sağlayacaktır .
4. İstatistiksel karar
– Z ve T test sonuçları ve kritik tablo değerlerine göre değerlendirme yapılır. Ayrıca p ve a değeri karşılaştırmasına göre de hipotez red veya onay alır.
Popülasyon Ortalaması için Güven Sınırları
• Popülasyonun standart sapması σ biliniyor olduğunda, örneklem ortalaması 𝑥 kullanarak bilinmeyen popülasyon ortalaması μ ’yü α yanılma düzeyiyle tahmin edebiliriz .
𝑥 − 𝑧(𝛼/2) x (σ/kökn) ≤ 𝜇 ≤ 𝑥 + 𝑧(𝛼/2) x (σ/kökn)
• Popülasyon standart sapması σ bilinmediğinde ise ;
𝑥 − 𝑡( 𝑠𝑑 ; 𝛼/2 ) x (S/kökn) ≤ 𝜇 ≤ 𝑥 + 𝑡( 𝑠𝑑 𝛼/2) x (S/kökn)
İKİ 0RTALAMA ARASINDAKİ FARKIN ( mü 1 - mü 2 ) TESTİ
• İki ortalama arasındaki farkın testi yapılırken, kullanılacak test istatistikleri popülasyon varyansının bilinmesi ve örnek büyüklüğü dikkate alınarak aşağıdaki şekilde bir sınıflama yapılabilir :
Gözlemler normal dağılış gösteriyorsa, ve :
1 . Populasyon varyansları ( sigma kareler ) biliniyor veya populasyon varyansları bilinmiyor ancak ; örnekler büyükse (n >_ 30 ) Z testi uygulanır.
2 . Populasyon varyansları bilinmiyor fakat homojen kabul edilebiliyorsa ( sigma kareler eşit ), Student t testi
3 . Populasyon varyansları bilinmiyor fakat homojen kabul edilemiyorsa ( sigma kareler eşit değil ), welch testi
Populasyon varyansları biliniyorsa Z - test istatistiği )
• Zhesap = (X1-X2) - (mü’ler farkı) / kök (Sig kare1/n1 + sigkare2/n2)
+++ ortalama farkının güven sınırı (%95)= x1-x2 +_ Z(a/2) x kök (Sig kare1/n1 + sigkare2/n2)
??Varyanslar Bilinmiyorsa Örneklem Tahminleri Kullanılır
STUDENT – t TESTİ
• İki gruba ait varyanslar bilinmiyor fakat homojense bu durumda Student t - testi kullanılır .
• H0 hipotezi yapılan test sonucunda kabul edildiğinde ( varyanslar homojen ise) t test istatistiği kullanılır .
• Varsayımları :
– Karşılaştırılacak birbirinden bağımsız iki grup vardır ve incelenen özellik (bağımlı değişken) sürekli sayısal veri türündedir .
– Her iki grubun popülasyon dağılımları normal dağılım göstermelidir .
– İki grubun popülasyon varyansları homojen olmalıdır
- Hipotezlerin belirlenmesi
- Test istatistiğinin hesaplanması
𝑡 = (𝑥1 − 𝑥2) − (𝜇 1 − 𝜇2) / kök (𝑆kare0/n1 + skare0/n2)
Ortak varyans ( pooled variance ) S2o = (𝑛1− 1) Skare1 + (𝑛2− 1) Skare2 / 𝑛 1 + 𝑛 2 − 2 - Önem düzeyinin belirlenmesi
- İstatistiksel karar
– t Hesap istatistiği, ( 𝑛 1 + 𝑛 2 − 2 ) serbestlik dereceli t Tablo istatistiği ile karşılaştırılır .
– t Hesap ≥ t Tablo ise, iki ortalama arasında fark yoktur şeklinde kurulan H 0 hipotezi reddedilir ve gruplar arasında fark olduğu söylenir .
Ortalama Farkının Güven Aralığı
X1-X2 +_ t (tablo). S (s0kare/n1 + s0kare/n2)
WELCH TESTİ
• Varyansların homojenliği varsayımı sağlanmadığında kullanılır
***Student - t testinin parametrik olmayan karşılığıdır . kuk
• Welch veya Satterthwaite testi, yaklaşık t dağılışı gösterir . Bu test istatistiğine ait cetvel değeri yeni bir serbestlik derecesi (v) hesaplanarak elde edilebilir .
• w 1 = Skare1 / n 1 ve w 2 = Skare2 / n 2 denirse , yaklaşık serbestlik derecesi (v) aşağıdaki şekilde hesaplanır ;
v= (w1 + w2)kare / (w1kare/n1 -1 + w2kare/n2 -1)
• Dolayısıyla t’ ~ t (v, a/ 2 ) dağılışı gösterir. t cetvelinden v serbestlik dereceli a / 2 olasılıklı değer bulunur ve hesaplanan değerle karşılaştırılır .
• t‘ ’ne ait cetvel değerinin bir başka hesaplanış şekli ise şöyledir : t-cetvelinden (n 1 - 1) sd için t1 değeri ve (n2-1) sd için t2 değeri okunur, aşağıdaki formül yardımı ile doğrudan karşılaştırılacak değer bulunur . Bu t’ cetvel değeri,
tüssü (cetvel)= t1.w1 + t2.w2 / w1+w2