20.09.2019

Chi kvadrat bo'yicha taqsimlanishni tekshirish. Statistikaning klassik usullari: chi-kvadrat testi


Ushbu mezondan foydalanish nazariy o'lchovlar o'rtasidagi nomuvofiqlikning bunday o'lchovidan (statistik ma'lumotlardan) foydalanishga asoslangan. F(x) va empirik taqsimot F* P (x) , bu taqsimot qonuniga taxminan bo'ysunadi ch 2 . Gipoteza H 0 Ushbu statistik ma'lumotlarning taqsimlanishini tahlil qilish orqali taqsimotlarning izchilligi tekshiriladi. Mezonni qo'llash statistik qatorni qurishni talab qiladi.

Shunday qilib, namuna raqamlar soni bilan statistik qator bilan ifodalansin M. Kuzatilgan zarba tezligi i- chi daraja n i. Nazariy taqsimot qonuniga muvofiq, xitlar kutilgan chastotasi i-chi raqam F i. Kuzatilgan va kutilgan chastota o'rtasidagi farq qiymat bo'ladi ( n iF i). O'rtasidagi tafovutning umumiy darajasini topish F(x) va F* P (x) statistik qatorning barcha raqamlari uchun kvadratik farqlarning vaznli yig'indisini hisoblash kerak

ch qiymati 2 cheksiz kattalashtirish bilan n ch 2 - taqsimotga ega (asimptotik tarzda ch 2 sifatida taqsimlangan). Bu taqsimot erkinlik darajalari soniga bog'liq k, ya'ni. ifodadagi atamalarning mustaqil qiymatlari soni (3.7). Erkinlik darajalari soni songa teng y namunaga o'rnatilgan chiziqli bog'lanishlar soni minus. Bitta ulanish har qanday chastotani qolgan chastotalar to'plamidan hisoblash mumkinligi sababli mavjud M-1 raqam. Bundan tashqari, agar taqsimlash parametrlari oldindan ma'lum bo'lmasa, unda taqsimotning namunaga mos kelishi sababli yana bir cheklov mavjud. Agar namuna aniqlasa S taqsimlash parametrlari, keyin erkinlik darajalari soni bo'ladi k= MS–1.

Gipotezani qabul qilish sohasi H 0 ch sharti bilan aniqlanadi 2 < χ 2 (k; a) , bu erda ch 2 (k; a) muhimlik darajasi bilan ch2-tarqatishning kritik nuqtasidir a. Birinchi turdagi xatolik ehtimoli a, II turdagi xatolik ehtimolini aniq belgilash mumkin emas, chunki taqsimotlarni mos kelmaslikning cheksiz ko'p turli xil usullari mavjud. Sinovning kuchi raqamlar soniga va namuna hajmiga bog'liq. Mezon uchun tavsiya etiladi n> 200, arizaga ruxsat beriladi n>40, aynan shunday sharoitlarda mezon izchil bo'ladi (qoida tariqasida, u noto'g'ri nol gipotezani rad etadi).

Mezonlarni tekshirish algoritmi

1. Gistogrammani teng ehtimolli usulda tuzing.

2. Gistogramma shakli bo'yicha gipotezani o'rtaga qo'ying

H 0: f(x) = f 0 (x),

H 1: f(x) ¹ f 0 (x),

qayerda f 0 (x) gipotetik taqsimot qonunining ehtimollik zichligi (masalan, bir xil, eksponensial, normal).

Izoh. Agar namunadagi barcha raqamlar ijobiy bo'lsa, eksponensial taqsimot qonunining gipotezasi ilgari surilishi mumkin.

3. Formuladan foydalanib mezon qiymatini hisoblang

,

qayerda
urish chastotasi i-inchi interval;

p i- tasodifiy o'zgaruvchiga tegishning nazariy ehtimoli i- th oraliq gipoteza sharti bilan H 0 to'g'ri.

Hisoblash uchun formulalar p i ko'rsatkichli bo'lsa, mos ravishda bir xil va normal qonunlar tengdir.

Eksponensial qonun

. (3.8)

Qayerda A 1 = 0, B m = +¥.

yagona qonun

oddiy qonun

. (3.10)

Qayerda A 1 = -¥, B M = +¥.

Izohlar. Barcha ehtimolliklarni hisoblab chiqqandan so'ng p i nazorat nisbati qanoatlantirilganligini tekshiring

F funksiyasi( X) g'alati. F(+¥) = 1.

4. Ilovaning "Chi-kvadrat" jadvalidan qiymat tanlanadi
, bu erda a - berilgan muhimlik darajasi (a = 0,05 yoki a = 0,01) va k- formula bilan aniqlangan erkinlik darajalari soni

k = M - 1 - S.

Bu yerda S- tanlangan gipoteza bog'liq bo'lgan parametrlar soni H 0 taqsimlash qonuni. Qiymatlar S yagona qonun uchun 2, ko'rsatkich uchun - 1, normal uchun - 2.

5. Agar
, keyin gipoteza H 0 rad etiladi. Aks holda, uni rad etish uchun hech qanday sabab yo'q: 1 ehtimol bilan - b bu to'g'ri va ehtimol bilan - b bu noto'g'ri, lekin b qiymati noma'lum.

Misol 3 . 1. c 2 mezonidan foydalanib, tasodifiy miqdorning taqsimlanish qonuni haqidagi gipotezani ilgari suring va tekshiring. X, 1.2-misolda berilgan variatsiya qatori, interval jadvallari va taqsimot gistogrammalari. Muhimlik darajasi a 0,05 ga teng.

Yechim . Gistogrammalarning turiga asoslanib, biz tasodifiy o'zgaruvchini taxmin qilamiz X Oddiy qonun bo'yicha taqsimlanadi:

H 0: f(x) = N(m, s);

H 1: f(x) ¹ N(m, s).

Mezon qiymati quyidagi formula bo'yicha hisoblanadi:

(3.11)

Yuqorida ta'kidlanganidek, gipotezani sinab ko'rishda teng ehtimolli gistogrammadan foydalanish afzalroqdir. Ushbu holatda

Nazariy ehtimollar p i(3.10) formula bo'yicha hisoblaymiz. Shu bilan birga, biz buni taxmin qilamiz

p 1 = 0,5(F((-4,5245+1,7)/1,98)-F((-¥+1,7)/1,98)) = 0,5(F(-1,427) -F(-¥)) =

0,5(-0,845+1) = 0,078.

p 2 = 0,5(F((-3,8865+1,7)/1,98)-F((-4,5245+1,7)/1,98)) =

0,5(F(-1,104)+0,845) = 0,5(-0,729+0,845) = 0,058.

p 3 = 0,094; p 4 = 0,135; p 5 = 0,118; p 6 = 0,097; p 7 = 0,073; p 8 = 0,059; p 9 = 0,174;

p 10 \u003d 0,5 (F ((+ ¥ + 1,7) / 1,98) - F ((0,6932 + 1,7) / 1,98)) \u003d 0,114.

Shundan so'ng biz nazorat munosabatlarining bajarilishini tekshiramiz

100 × (0,0062 + 0,0304 + 0,0004 + 0,0091 + 0,0028 + 0,0001 + 0,0100 +

0,0285 + 0,0315 + 0,0017) = 100 × 0,1207 = 12,07.

Shundan so'ng, "Chi - kvadrat" jadvalidan biz kritik qiymatni tanlaymiz

.

Chunki
keyin gipoteza H 0 qabul qilinadi (rad etish uchun sabab yo'q).

Ushbu mezondan foydalanish nazariy o'lchovlar o'rtasidagi nomuvofiqlikning bunday o'lchovidan (statistik ma'lumotlardan) foydalanishga asoslangan. F(x) va empirik taqsimot F* n (x), bu taqsimot qonuniga taxminan bo'ysunadi ch 2 . Gipoteza H 0 Ushbu statistik ma'lumotlarning taqsimlanishini tahlil qilish orqali taqsimotlarning izchilligi tekshiriladi. Mezonni qo'llash statistik qatorni qurishni talab qiladi.

Shunday qilib, namuna raqamlar soni bilan statistik qator bilan ifodalansin M. Kuzatilgan zarba tezligi men- chi daraja n i. Nazariy taqsimot qonuniga muvofiq, xitlar kutilgan chastotasi i-chi raqam F i. Kuzatilgan va kutilgan chastota o'rtasidagi farq qiymat bo'ladi ( n iF i). O'rtasidagi tafovutning umumiy darajasini topish F(x) va F* n (x) statistik qatorning barcha raqamlari uchun kvadratik farqlarning vaznli yig'indisini hisoblash kerak

ch qiymati 2 cheksiz kattalashtirish bilan n ch 2 - taqsimotga ega (asimptotik tarzda ch 2 sifatida taqsimlangan). Bu taqsimot erkinlik darajalari soniga bog'liq k, ya'ni. ifodadagi atamalarning mustaqil qiymatlari soni (3.7). Erkinlik darajalari soni songa teng y namunaga o'rnatilgan chiziqli bog'lanishlar soni minus. Bitta ulanish har qanday chastotani qolgan chastotalar to'plamidan hisoblash mumkinligi sababli mavjud M-1 raqam. Bundan tashqari, agar taqsimlash parametrlari oldindan ma'lum bo'lmasa, unda taqsimotning namunaga mos kelishi sababli yana bir cheklov mavjud. Agar namuna aniqlasa S taqsimlash parametrlari, keyin erkinlik darajalari soni bo'ladi k=M –S–1.

Gipotezani qabul qilish sohasi H 0 ch sharti bilan aniqlanadi 2 < χ 2(k;a), bu erda ch 2(k;a) muhimlik darajasi bilan ch2-tarqatishning kritik nuqtasidir a. Birinchi turdagi xatolik ehtimoli a, II turdagi xatolik ehtimolini aniq belgilash mumkin emas, chunki taqsimotlarni mos kelmaslikning cheksiz ko'p turli xil usullari mavjud. Sinovning kuchi raqamlar soniga va namuna hajmiga bog'liq. Mezon uchun tavsiya etiladi n> 200, arizaga ruxsat beriladi n>40, aynan shunday sharoitlarda mezon izchil bo'ladi (qoida tariqasida, u noto'g'ri nol gipotezani rad etadi).

Mezonlarni tekshirish algoritmi

1. Gistogrammani teng ehtimolli usulda tuzing.

2. Gistogramma shakli bo'yicha gipotezani o'rtaga qo'ying

H 0: f(x) = f 0(x),

H 1: f(x) f 0(x),

qayerda f 0(x) gipotetik taqsimot qonunining ehtimollik zichligi (masalan, bir xil, eksponensial, normal).

Izoh. Agar namunadagi barcha raqamlar ijobiy bo'lsa, eksponensial taqsimot qonunining gipotezasi ilgari surilishi mumkin.


3. Formuladan foydalanib mezon qiymatini hisoblang

,

urish chastotasi qayerda i-inchi interval;

pi- tasodifiy o'zgaruvchiga tegishning nazariy ehtimoli i- th oraliq gipoteza sharti bilan H 0 to'g'ri.

Hisoblash uchun formulalar pi ko'rsatkichli bo'lsa, mos ravishda bir xil va normal qonunlar tengdir.

Eksponensial qonun

. (3.8)

Qayerda A 1 = 0, bm= +.

yagona qonun

oddiy qonun

. (3.10)

Qayerda A 1 = -, BM = +.

Izohlar. Barcha ehtimolliklarni hisoblab chiqqandan so'ng pi nazorat nisbati qanoatlantirilganligini tekshiring

F funksiyasi( X) g'alati. F(+) = 1.

4. Ilovaning “Chi-kvadrati” jadvalidan qiymat tanlanadi, bu yerda berilgan ahamiyat darajasi (= 0,05 yoki = 0,01) va k- formula bilan aniqlangan erkinlik darajalari soni

k= M- 1 - S.

Bu yerda S- tanlangan gipoteza bog'liq bo'lgan parametrlar soni H 0 taqsimlash qonuni. Qiymatlar S yagona qonun uchun 2, ko'rsatkich uchun - 1, normal uchun - 2.

5. Agar , u holda gipoteza H 0 rad etiladi. Aks holda, uni rad etish uchun hech qanday sabab yo'q: 1 ehtimol bilan bu to'g'ri, ehtimol bilan u noto'g'ri, lekin qiymati noma'lum.

Misol 3 . 1. 2-mezondan foydalanib, tasodifiy miqdorning taqsimlanish qonuni haqidagi gipotezani ilgari suring va sinab ko'ring. X, 1.2-misolda berilgan variatsiya qatori, interval jadvallari va taqsimot gistogrammalari. Muhimlik darajasi 0,05.

Yechim . Gistogrammalarning turiga asoslanib, biz tasodifiy o'zgaruvchini taxmin qilamiz X Oddiy qonun bo'yicha taqsimlanadi:

H 0: f(x) = N(m,);

H 1: f(x) N(m,).

Mezonning qiymati formula bo'yicha hisoblanadi.

Kriteriya tavsifi

Kriteriyalar bo'yicha topshiriqlar

Pearsonning chi-kvadrat testi

Ma'ruza materiallari

Mavzu 6. Xususiyatning tarqalishidagi farqlarni ochish

Pirson mezoni: mezonning maqsadi, tavsifi, qamrovi, hisoblash algoritmi.

Miqdoriy o'lchov natijalarini taqqoslash uchun Kolmogorov-Smirnov mezoni: mezonning maqsadi, tavsifi, ko'lami, hisoblash algoritmi.

Ushbu mavzuni o'rganishda ikkala mezon ham parametrik emasligini, ular chastotalar bilan ishlashini hisobga olish kerak. Ko'rib chiqilgan mezonlar bo'yicha qaror qabul qilish qoidalariga alohida e'tibor bering: bu qoidalar qarama-qarshi bo'lishi mumkin. Mezonlarni qo'llashda cheklovlarni diqqat bilan o'rganing.

Ma'ruza materialini o'rganib bo'lgach, nazorat savollariga javob bering, javoblarni konspektga yozing.

Pearson chi-kvadrat testi bir nechta muammolarni, shu jumladan taqsimotlarni solishtirishni hal qilishi mumkin.

ch 2 mezoni ikki maqsadda qo'llaniladi;

1) moslashtirish uchun empirik bilan xususiyatlar taqsimoti nazariy - bir xil, oddiy yoki boshqacha;

2) moslashtirish uchun ikki, uch yoki undan ortiq empirik bir xil xususiyatdagi taqsimotlar, ya'ni ularning bir xilligini tekshirish;

3) tasodifiy hodisalar tizimidagi stoxastik (ehtimollik) mustaqillikni baholash va hokazo.

ch 2 mezoni xususiyatning turli qiymatlari empirik va nazariy taqsimotlarda bir xil chastotada yoki ikki yoki undan ortiq empirik taqsimotlarda paydo bo'ladimi degan savolga javob beradi.

Usulning afzalligi shundaki, u nomlar shkalasidan boshlab istalgan masshtabda taqdim etilgan xususiyatlarning taqsimlanishini solishtirish imkonini beradi. Muqobil taqsimotning eng oddiy holatida ("ha - yo'q", "ruxsat etilgan nikoh - nikohga ruxsat bermadi", "muammoni hal qildi - muammoni hal qilmadi" va boshqalar), biz allaqachon ch 2 mezonini qo'llashimiz mumkin.

1. Namuna hajmi etarlicha katta bo'lishi kerak: N>30. N uchun<30 критерий χ 2 дает весьма приближенные значения. Точность крите­рия повышается при больших N.

2. Har bir jadval katakchasi uchun nazariy chastota 5 dan kam bo'lmasligi kerak: f ≥ 5 . Bu shuni anglatadiki, agar raqamlar soni oldindan aniqlangan bo'lsa va uni o'zgartirib bo'lmasa, biz ch 2 ni qo'llashimiz mumkin emas. , kuzatuvlarning ma'lum bir minimal sonini to'plamasdan. Agar, masalan, biz ishonchli telefon xizmatiga qo'ng'iroqlar chastotasi haftaning 7 kunida notekis taqsimlanganligi haqidagi taxminlarimizni sinab ko'rmoqchi bo'lsak, unda bizga 5-7 = 35 qo'ng'iroq kerak bo'ladi. Shunday qilib, raqamlar soni bo'lsa (k) oldindan berilgan, bu holatda bo'lgani kabi, kuzatishlarning minimal soni (N min) formula bilan aniqlanadi: .



3. Tanlangan raqamlar butun taqsimotni "chiqib olishi" kerak, ya'ni xususiyat o'zgaruvchanligining butun diapazonini qamrab oladi. Bunday holda, raqamlarga guruhlash barcha solishtirilgan taqsimotlarda bir xil bo'lishi kerak.

4. Faqat 2 ta qiymatni qabul qiluvchi xususiyatlar taqsimotini solishtirishda “uzluksizlik uchun tuzatish” qilish kerak. Tuzatish amalga oshirilganda, ch 2 qiymati kamayadi (davomiylik uchun tuzatish bilan misolga qarang).

5. Darajalar o'zaro bog'liq bo'lmagan bo'lishi kerak: agar kuzatuv bitta darajaga berilgan bo'lsa, u holda uni boshqa darajaga berish mumkin emas. Raqamlar bo'yicha kuzatuvlar yig'indisi har doim kuzatuvlarning umumiy soniga teng bo'lishi kerak.

ch 2 mezonini hisoblash algoritmi

1. Quyidagi turdagi xususiyat qiymatlarining o'zaro tasodifiyligi jadvalini tuzing (aslida, bu qo'shma xususiyat qiymatlarining paydo bo'lish chastotalari ko'rsatilgan ikki o'lchovli o'zgaruvchanlik seriyasidir) - 19-jadval. shartli chastotalarni o'z ichiga oladi, biz ularni umumiy shaklda f ij deb belgilaymiz. Masalan, xususiyatning gradatsiyalar soni X 3 ga teng (k=3), xususiyatning gradatsiyalar soni da 4 (m=4); keyin i 1 dan k gacha o'zgaradi va j 1 dan m gacha o'zgaradi.

19-jadval

x i y j x 1 x 2 x 3
1 f 11 f 21 f 31 f–1
2 da f 12 f 22 f 32 f–2
3 f 13 f 23 f 33 f–3
4 da f 14 f 24 f 34 f–4
f 1– f 2– f 3– N

2. Bundan tashqari, hisob-kitoblarning qulayligi uchun biz o'zaro konjugatsiyaning asl jadvalini quyidagi shakldagi jadvalga aylantiramiz (20-jadval), shartli chastotali ustunlarni bir-birining ostiga qo'yamiz: ).

20-jadval

x i da j f ij f ij * f ij – f ij * (f ij – f ij *) 2 (f ij – f ij *) 2 / f ij *
1 2 3 4 5 6 7
x 1 1 f 11 f11*
x 1 2 da f 12 f12*
x 1 3 f 13 f 13*
x 1 4 da f 14 f14*
x 2 1 f 21 f21*
x 2 2 da f 22 f22*
x 2 3 f 23 f23*
x 2 4 da f 24 f24*
x 3 1 f 31 f 31 *
x 3 2 da f 32 f 32 *
x 3 3 f 33 f 33 *
x 3 4 da f 34 f 34*
∑=………….

3. Har bir empirik chastotaning yoniga quyidagi formula bo'yicha hisoblangan nazariy chastotani (4-ustun) yozing (tegishli chiziq uchun oxirgi chastota mos keladigan ustun uchun umumiy chastotaga ko'paytiriladi va umumiy songa bo'linadi. kuzatishlar):

5. Erkinlik darajalari sonini formula orqali aniqlang: v=(k-1)(m-1) , qayerda k- ishora bitlari soni X, m - belgining raqamlari soni da.

Agar n=1 bo'lsa, "uzluksizlik" ni to'g'rilang va uni 5a ustuniga yozing.

Uzluksizlik uchun tuzatish shartli va nazariy chastota o'rtasidagi farqdan yana 0,5 ayiriladi. Keyin jadvalimizdagi ustun sarlavhalari quyidagicha ko'rinadi (21-jadval):

21-jadval

X da f ij f ij * f ij – f ij * f ij – f ij * – 0,5 (f ij – f ij * – 0,5) 2 (f ij – f ij * – 0,5) 2 / f ij *
1 2 3 4 5 5a 6 7

6. Olingan farqlarni kvadratga aylantiring va ularni 6-ustunga qo'ying.

7. Olingan kvadratik farqlarni nazariy chastotaga ajrating va natijalarni 7-ustunga yozing.

8. 7-ustun qiymatlarini yig'ing. Olingan miqdor ch 2 emp sifatida belgilanadi.

9. Qaror qabul qilish qoidasi:

Mezonning hisoblangan qiymatini kritik (yoki jadvalli) qiymat bilan solishtirish kerak. Kritik qiymat ch 2 Pearson mezonining kritik qiymatlari jadvaliga muvofiq erkinlik darajalari soniga bog'liq (1.6-ilovaga qarang).

Agar ch 2 calc ≥ ch 2 jadval bo'lsa, u holda taqsimotlar orasidagi tafovutlar statistik ahamiyatga ega yoki belgilar doimiy ravishda o'zgaradi yoki belgilar orasidagi bog'liqlik statistik ahamiyatga ega.

Agar ch 2 hisoblansa< χ 2 табл, то расхождения между рас­пределениями статистически недостоверны, или признаки изменяются несогласованно, или связи между признаками нет.

1. Taqqoslanadigan ko'rsatkichlarni o'lchash kerak nominal shkala(masalan, bemorning jinsi - erkak yoki ayol) yoki ichida tartibli(masalan, arterial gipertenziya darajasi, 0 dan 3 gacha qiymatlarni qabul qilish).

2. Ushbu usul nafaqat to'rtta maydonli jadvallarni tahlil qilish imkonini beradi, agar omil ham, natija ham ikkilik o'zgaruvchilar bo'lsa, ya'ni ular faqat ikkita mumkin bo'lgan qiymatga ega (masalan, erkak yoki ayol, mavjudligi yoki yo'qligi). tarixdagi ma'lum bir kasallik ...). Pirsonning chi-kvadrat testi omil va (yoki) natija uch yoki undan ortiq qiymatlarni qabul qilganda, ko'p maydonli jadvallarni tahlil qilishda ham qo'llanilishi mumkin.

3. Mos keladigan guruhlar mustaqil bo'lishi kerak, ya'ni kuzatuvdan oldingi va keyingi kuzatuvlarni solishtirishda chi-kvadrat testidan foydalanmaslik kerak. McNemar testi(ikki bog'liq populyatsiyani solishtirganda) yoki hisoblangan Q-testi Cochran(uch yoki undan ortiq guruhlarni solishtirganda).

4. To'rt maydonli jadvallarni tahlil qilishda kutilgan qiymatlar hujayralarning har birida kamida 10 bo'lishi kerak. Agar kamida bitta katakda kutilgan hodisa 5 dan 9 gacha bo'lgan qiymatga ega bo'lsa, chi-kvadrat testini hisoblash kerak. Yates tuzatish bilan. Agar kamida bitta hujayrada kutilgan hodisa 5 dan kam bo'lsa, unda tahlildan foydalanish kerak Fisherning aniq testi.

5. Ko'p maydonli jadvallarni tahlil qilganda, kutilayotgan kuzatishlar soni 20% dan ortiq kataklarda 5 dan kam qiymatlarni qabul qilmasligi kerak.

Xi-kvadrat testini hisoblash uchun quyidagilar kerak:

1. Kuzatuvlarning kutilgan sonini hisoblang tasodifiy jadvalning katakchalarining har biri uchun (aloqa yo'qligi haqidagi nol gipotezaning to'g'riligiga qarab) qatorlar va ustunlar yig'indilarini ko'paytirish, so'ngra olingan mahsulotni kuzatishlar umumiy soniga bo'lish orqali. Kutilayotgan qiymatlar jadvalining umumiy ko'rinishi quyida keltirilgan:

Chiqish (1) Chiqish yo'q (0) Jami
Xavf omili mavjud (1) (A+B)*(A+C) / (A+B+C+D) (A+B)*(B+D)/ (A+B+C+D) A+B
Xavf omili yo'q (0) (C+D)*(A+C)/ (A+B+C+D) (C+D)*(B+D)/ (A+B+C+D) C+D
Jami A+C B+D A+B+C+D

2. ch 2 mezonining qiymatini topamiz quyidagi formula bo'yicha:

qayerda i- qator raqami (1 dan r gacha), j- ustun raqami (1 dan c gacha), O ij ij hujayradagi kuzatuvlarning haqiqiy soni, E ij ij katakdagi kuzatuvlarning kutilayotgan soni.

Agar kutilayotgan hodisa soni kamida bitta katakda 10 dan kam bo'lsa, to'rtta maydonli jadvallarni tahlil qilishda, Yates tuzatish bilan chi-kvadrat testi. Ushbu tuzatish I turdagi xatolik ehtimolini kamaytiradi, ya'ni farqlar mavjud bo'lmagan joyda aniqlanadi. Yates tuzatishi har bir hujayradagi kuzatuvlarning haqiqiy va kutilgan soni o'rtasidagi farqning mutlaq qiymatidan 0,5 ni olib tashlashdir, bu esa chi-kvadrat testi qiymatining pasayishiga olib keladi.

Yates tuzatishi bilan ch 2 mezonini hisoblash formulasi quyidagicha:

3. Erkinlik darajalari sonini aniqlang formula bo'yicha: f = (r - 1) × (c - 1). Shunga ko'ra, 2 qatorli (r = 2) va 2 ustunli (c = 2) to'rt maydonli jadval uchun erkinlik darajalari soni f 2x2 = (2 - 1)*(2 - 1) = 1 ga teng.

4. ch 2 mezonining qiymatini kritik qiymat bilan solishtiramiz f erkinlik darajalari soni bilan (jadvalga muvofiq).

Ushbu algoritm to'rt maydonli va ko'p maydonli jadvallar uchun ham amal qiladi.

Pearsonning chi-kvadrat testining qiymatini qanday izohlash mumkin?

Agar ch 2 mezonining olingan qiymati kritik qiymatdan katta bo'lsa, biz o'rganilayotgan xavf omili va tegishli ahamiyatga ega bo'lgan natija o'rtasida statistik bog'liqlik bor degan xulosaga kelamiz.

Pearson chi-kvadrat testini hisoblash misoli

Yuqoridagi jadval bo'yicha chekish omilining arterial gipertenziya bilan kasallanishiga ta'sirining statistik ahamiyatini aniqlaylik:

1. Har bir katak uchun kutilgan qiymatlarni hisoblang:

2. Pirsonning xi-kvadrat testining qiymatini toping:

ch 2 \u003d (40-33,6) 2 / 33,6 + (30-36,4) 2 / 36,4 + (32-38,4) 2 / 38,4 + (48-41,6) 2 / 41,6 \u003d 4,396.

3. Erkinlik darajalari soni f = (2-1)*(2-1) = 1. Jadvaldan Pirson chi-kvadrat testining kritik qiymatini toping, u muhimlik darajasida p=0,05 va erkinlik darajalari soni 1, 3,841.

4. Chi-kvadrat testining olingan qiymatini kritik bilan solishtiramiz: 4,396 > 3,841, shuning uchun arterial gipertenziya bilan kasallanishning chekish mavjudligiga bog'liqligi statistik ahamiyatga ega. Bu munosabatlarning ahamiyatlilik darajasi p ga to'g'ri keladi<0.05.

Erkinlik darajalari soni, f p=0,05 da ch 2 p=0,01 da ch 2
3.841 6.635
5.991 9.21
7.815 11.345
9.488 13.277
11.07 15.086
12.592 16.812
14.067 18.475
15.507 20.09
16.919 21.666
18.307 23.209
19.675 24.725
21.026 26.217
22.362 27.688
23.685 29.141
24.996 30.578
26.296
27.587 33.409
28.869 34.805
30.144 36.191
31.41 37.566

Xi-kvadrat testini o'tkazishda kutilmagan holatlar jadvalining ikkita o'zgaruvchisining o'zaro mustaqilligi tekshiriladi va shu sababli ikkala o'zgaruvchining bog'liqligi bilvosita aniqlanadi. Agar hujayralardagi kuzatilgan chastotalar (f 0) kutilgan chastotalarga (fe) mos kelsa, ikkita o'zgaruvchi o'zaro mustaqil deyiladi.

SPSS bilan chi-kvadrat testini o'tkazish uchun quyidagi amallarni bajaring:

  • Menyudan buyruqlarni tanlang Tahlil qiling(Tahlil) > Ta'riflovchi statistika(Tavsifiy statistika) › Oʻzaro jadvallar…(Favqulodda vaziyatlar jadvallari)
  • tugmasi qayta o'rnatish(Qayta tiklash) mumkin bo'lgan sozlamalarni o'chiring.
  • O'zgaruvchan jinsni qatorlar ro'yxatiga va o'zgaruvchan psixikani ustunlar ro'yxatiga o'tkazing.
  • Tugmasini bosing Hujayralar…(hujayralar). Muloqot oynasida standart belgilash katagiga qo'shimcha ravishda belgilang Kuzatilgan, koʻproq belgilash katakchalari kutilgan va standartlashtirilgan. Tugma bilan tanlovingizni tasdiqlang Davom eting.
  • Tugmasini bosing Statistika…(Statistika).

Yuqorida tavsiflangan dialog oynasi ochiladi. O'zaro jadvallar: Statistikalar.

  • Belgilash katagi Chi-kvadrat(Chi-kvadrat). Tugmasini bosing Davom eting, va asosiy dialog oynasida - to OK.

Siz quyidagi favqulodda vaziyatlar jadvalini olasiz.

Jins * Ruhiy holat. Favqulodda vaziyatlar jadvali.

Ruhiy holat Jami
Juda beqaror beqaror barqaror Juda barqaror
Qavat ayollik Hisoblash 16 18 9 1 44
Kutilayotgan raqam 7.9 16.6 17.0 2.5 44.0
Std. Qoldiq 2.9 0.3 -1.9 -0.9
Erkak Hisoblash 3 22 32 5 62
Kutilayotgan raqam 11.1 23.4 24.0 3.5 62.0
Std. Qoldiq -2.4 -0.3 1.6 0.8
Jami Hisoblash 19 40 41 6 106
Kutilayotgan raqam 19.0 40.0 41.0 6.0 106.0

Bundan tashqari, chi-kvadrat testining natijalari tomoshabin oynasida ko'rsatiladi:

Chi-kvadrat testlari

  • a. 2 ta katak (25,0%) kutilgan raqam 5 dan kam. Minimal kutilgan raqam 2,49

Xi-kvadrat testini hisoblash uchun uch xil yondashuv qo'llaniladi: Pearson formulasi, ehtimollikni sozlash va Mantel-Haenszel testi. Agar o'zaro faoliyat jadvalda to'rtta maydon bo'lsa va kutilgan ehtimollik 5 dan kam bo'lsa, Fisherning aniq testi qo'shimcha ravishda amalga oshiriladi.

Pearsonning chi-kvadrat testi

Xi-kvadrat testini hisoblash uchun odatda Pearson formulasi qo'llaniladi:

Bu erda favqulodda vaziyatlar jadvalining barcha maydonlari bo'yicha standartlashtirilgan qoldiqlarning kvadratlari yig'indisi hisoblanadi. Shu sababli, standartlashtirilgan qoldiqlari yuqori bo'lgan maydonlar chi-kvadrat qiymatiga ko'proq hissa qo'shadi va shuning uchun mazmunli natijaga erishadi. 8.7.2-bo'limda keltirilgan qoidaga ko'ra, standartlashtirilgan qoldiq 2 yoki undan ko'p kuzatilgan va kutilayotgan chastotalar o'rtasidagi sezilarli tafovutni ko'rsatadi.

Biz ko'rib chiqayotgan misolda Pearson formulasi chi-kvadrat testining eng muhim qiymatini beradi (p<0.001). Если рассмотреть стандартизованные остатки в отдельных полях таблицы сопряженности, то на основе вышеприведенного правила можно сделать вывод, что эта значимость в основном определяется полями, в которых переменная psyche имеет значение "крайне неустойчивое". У женщин это значение сильно повышено, а у мужчин - понижено.

Chi-kvadrat testining to'g'riligi ikkita shart bilan belgilanadi: birinchidan, kutilgan chastotalar< 5 должны встречаться не более чем в 20% полей таблицы; во-вторых, суммы по строкам и столбцам всегда должны быть больше нуля.

Biroq, ko'rib chiqilayotgan misolda bu shart to'liq qondirilmaydi. Chi-kvadrat test jadvalidan keyingi eslatma ko'rsatadiki, maydonlarning 25% 5 dan kamroq kutilgan chastotaga ega. Biroq, ruxsat etilgan 20% chegarasi biroz oshib ketganligi sababli, bu maydonlar juda kichik standartlashtirilgan qoldiq tufayli. , chi-kvadrat testi qiymatiga juda kichik nisbatda hissa qo'shadi. kvadrat, bu buzilish ahamiyatsiz deb hisoblanishi mumkin.

ehtimollikka moslashtirilgan chi-kvadrat testi

Xi-kvadrat testini hisoblash uchun Pearson formulasiga alternativa ehtimollikni sozlashdir:

Katta namuna hajmi bilan Pearson formulasi va tuzatilgan formula juda yaqin natijalar beradi. Bizning misolimizda, ehtimollik bilan moslashtirilgan chi-kvadrat testi 23,688 ni tashkil qiladi.

Mantel-Haensel testi

Bundan tashqari, belgi ostida favqulodda vaziyatlar jadvalida chiziqli chiziqli("chiziqli-chiziqli") Mantel-Haenszel testining qiymati (20.391) ko'rsatiladi. Mantel-Haenszel chi-kvadrat testining ushbu shakli o'zaro faoliyat jadvalning satrlari va ustunlari orasidagi chiziqli munosabatlarning yana bir o'lchovidir. U Pearson korrelyatsiya koeffitsientining kuzatishlar sonining minus bittaga ko'paytmasi sifatida aniqlanadi:

Shu tarzda olingan mezon bir erkinlik darajasiga ega. Mantel-Haenszel usuli har doim muloqot oynasi ochilganda ishlatiladi O'zaro jadvallar: Statistikalar tekshirildi Chi-kvadrat. Biroq, nominal shkala bilan bog'liq ma'lumotlar uchun bu mezon qo'llanilmaydi.