20.09.2019

Dispersijos paieškos pavyzdys. Atsitiktinio dydžio dispersija. Mėginio standartinis nuokrypis


Sklaidaatsitiktinis kintamasis yra duotosios sklaidos matas atsitiktinis kintamasis, tai yra, ji nukrypimai nuo matematinio lūkesčio. Statistikoje žymėjimas (sigma kvadratas) dažnai naudojamas dispersijai žymėti. Sklaidos kvadratinė šaknis, lygia, vadinama standartinis nuokrypis arba standartinis užtepimas. Standartinis nuokrypis matuojamas tais pačiais vienetais kaip ir pats atsitiktinis dydis, o dispersija – šio vieneto kvadratais.

Nors labai patogu naudoti tik vieną reikšmę (pvz., vidurkį arba režimą ir medianą), norint įvertinti visą imtį, šis metodas gali lengvai sukelti netikslumus. Tokios situacijos priežastis slypi ne pačiame kiekyje, o tame, kad vienas dydis niekaip neatspindi duomenų reikšmių sklaidos.

Pavyzdžiui, pavyzdyje:

vidurkis yra 5.

Tačiau pačioje imtyje nėra nė vieno elemento, kurio reikšmė būtų 5. Gali reikėti žinoti, kiek kiekvienas imties elementas yra artimas jo vidurkiui. Arba, kitaip tariant, reikia žinoti reikšmių dispersiją. Žinodami, kiek pasikeitė duomenys, galite geriau interpretuoti reiškia, mediana ir mada... Mėginių verčių kitimo greitis nustatomas apskaičiuojant jų dispersiją ir standartinį nuokrypį.



Dispersija ir dispersijos kvadratinė šaknis, vadinama standartiniu nuokrypiu, apibūdina vidutinį nuokrypį nuo imties vidurkio. Tarp šių dviejų dydžių svarbiausias yra standartinis nuokrypis... Šią vertę galima įsivaizduoti kaip vidutinį atstumą, kurį elementai yra nuo vidurinio imties elemento.

Dispersiją sunku prasmingai interpretuoti. Tačiau šios vertės kvadratinė šaknis yra standartinis nuokrypis ir yra gerai interpretuojama.

Standartinis nuokrypis apskaičiuojamas pirmiausia nustatant dispersiją, o po to apskaičiuojant dispersijos kvadratinę šaknį.

Pavyzdžiui, paveikslėlyje parodytam duomenų masyvui bus gautos šios reikšmės:

1 paveikslas

Čia skirtumų kvadratų vidurkis yra 717,43. Norint gauti standartinį nuokrypį, belieka paimti to skaičiaus kvadratinę šaknį.

Rezultatas yra maždaug 26,78.

Reikia atsiminti, kad standartinis nuokrypis interpretuojamas kaip vidutinis elementų atstumas nuo imties vidurkio.

Standartinis nuokrypis matuoja, kaip gerai vidurkis apibūdina visą imtį.

Tarkime, kad esate kompiuterio surinkimo skyriaus vadovas. Ketvirčio ataskaitoje teigiama, kad per pastarąjį ketvirtį buvo 2500 kompiuterių. Ar tai gerai ar blogai? Ataskaitoje prašėte (arba ataskaitoje jau yra šis stulpelis) parodyti standartinį šių duomenų nuokrypį. Standartinio nuokrypio skaičius, pavyzdžiui, yra 2000. Jums, kaip skyriaus vedėjui, tampa aišku, kad gamybos linija reikalauja geresnio valdymo (per dideli surenkamų kompiuterių skaičiaus nuokrypiai).

Prisiminkite, kad kai standartinis nuokrypis yra didelis, duomenys yra plačiai išsibarstę apie vidurkį, o kai standartinis nuokrypis mažas, jie grupuojami arti vidurkio.

Keturios statistinės funkcijos VAR (), VAR (), STDEV () ir STDEV () - skirtos apskaičiuoti skaičių dispersiją ir standartinį nuokrypį langelių intervale. Prieš apskaičiuodami duomenų rinkinio dispersiją ir standartinį nuokrypį, turite nustatyti, ar duomenys yra populiacija, ar visumos pavyzdys. Jei imtis yra iš bendrosios visumos, reikia naudoti VARP () ir STDEVP () funkcijas, o bendrosios visumos atveju – VARP () ir STDEVP () funkcijas:

Bendra populiacija Funkcija

VARP ()

STANDOLONP ()
Pavyzdys

DISP ()

STDEV ()

Dispersija (taip pat ir standartinis nuokrypis), kaip pažymėjome, rodo, kiek į duomenų rinkinį įtrauktos reikšmės yra išsklaidytos aplink aritmetinį vidurkį.

Maža dispersijos arba standartinio nuokrypio reikšmė rodo, kad visi duomenys yra sutelkti aplink aritmetinį vidurkį, o didelė šių reikšmių reikšmė rodo, kad duomenys yra išsklaidyti plačiame verčių diapazone.

Dispersiją gana sunku prasmingai interpretuoti (ką reiškia maža reikšmė, didelė reikšmė?). Spektaklis 3 užduotys leidžia vizualiai grafike parodyti duomenų rinkinio dispersijos reikšmę.

Užduotys

· 1 pratimas.

· 2.1. Pateikite sąvokas: dispersija ir standartinis nuokrypis; simbolinis jų žymėjimas apdorojant statistinius duomenis.

· 2.2. Sudarykite darbalapį pagal 1 paveikslą ir atlikite reikiamus skaičiavimus.

· 2.3. Pateikite pagrindines skaičiavimuose naudojamas formules

· 2.4. Paaiškinkite visas žymes (,,)

· 2.5. Paaiškinkite dispersijos ir standartinio nuokrypio praktinę reikšmę.

2 užduotis.

1.1. Pateikite sąvokas: bendroji visuma ir imtis; matematinis lūkestis ir jų simbolinio žymėjimo aritmetinis vidurkis apdorojant statistinius duomenis.

1.2. Pagal 2 paveikslą sudarykite darbalapį ir atlikite skaičiavimus.

1.3. Pateikite pagrindines skaičiavimuose naudotas formules (bendrai visumai ir imčiai).

2 paveikslas

1.4. Paaiškinkite, kodėl pavyzdžiuose galima gauti tokias aritmetines vidurkio reikšmes kaip 46,43 ir 48,78 (žr. failo priedą). Daryti išvadas.

3 užduotis.

Yra du pavyzdžiai su skirtingais duomenų rinkiniais, tačiau jų vidurkis bus toks pat:

3 pav

3.1. Sudarykite darbalapį pagal 3 paveikslą ir atlikite reikiamus skaičiavimus.

3.2. Pateikite pagrindines skaičiavimo formules.

3.3. Sudarykite grafikus pagal 4 ir 5 paveikslus.

3.4. Paaiškinkite susidariusias priklausomybes.

3.5. Atlikite panašius šių dviejų pavyzdžių skaičiavimus.

Originalus pavyzdys 11119999

Pasirinkite antrojo imties reikšmes taip, kad antrojo imties aritmetinis vidurkis būtų toks pat, pavyzdžiui:

Antrojo pavyzdžio vertes pasirinkite patys. Projektiniai skaičiavimai ir grafikai kaip 3, 4, 5 pav. Parodykite pagrindines formules, kurios buvo naudojamos atliekant skaičiavimus.

Padarykite atitinkamas išvadas.

Visos užduotys turi būti surašytos ataskaitos forma su visais reikalingais paveikslėliais, grafikais, formulėmis ir trumpais paaiškinimais.

Pastaba: grafikų sudarymas turi būti paaiškintas paveikslėliais ir trumpais paaiškinimais.

Tikimybių teorija yra speciali matematikos šaka, kurią studijuoja tik universiteto studentai. Ar jums patinka skaičiavimai ir formulės? Ar nebijote galimybės susipažinti su normaliuoju skirstiniu, ansamblio entropija, matematiniais lūkesčiais ir diskretiškojo atsitiktinio dydžio dispersija? Tada ši tema jums bus labai įdomi. Susipažinkime su kai kuriomis svarbiausiomis pagrindinėmis šios mokslo šakos sąvokomis.

Prisiminkime pagrindus

Net jei prisimenate paprasčiausias tikimybių teorijos sąvokas, nepamirškite pirmųjų straipsnio pastraipų. Faktas yra tas, kad be aiškaus pagrindinių dalykų supratimo negalėsite dirbti su toliau aptartomis formulėmis.

Taigi, atsitinka koks nors atsitiktinis įvykis, eksperimentas. Dėl atliktų veiksmų galime sulaukti kelių baigčių – vieni dažnesni, kiti rečiau. Įvykio tikimybė – tai faktiškai gautų vieno tipo baigčių skaičiaus ir bendro galimų baigčių skaičiaus santykis. Tik žinodami klasikinį šios sąvokos apibrėžimą, galite pradėti tyrinėti nuolatinių atsitiktinių dydžių matematinius lūkesčius ir dispersiją.

Vidutinis

Dar mokykloje, matematikos pamokose, pradėjai dirbti su aritmetiniu vidurkiu. Ši sąvoka yra plačiai naudojama tikimybių teorijoje, todėl jos negalima ignoruoti. Šiuo metu mums svarbiausia, kad su tuo susidursime atsitiktinio dydžio matematinio lūkesčio ir dispersijos formulėse.

Turime skaičių seką ir norime rasti aritmetinį vidurkį. Viskas, ko iš mūsų reikalaujama, yra susumuoti viską, kas turima, ir padalyti iš sekos elementų skaičiaus. Tarkime, kad turime skaičius nuo 1 iki 9. Elementų suma bus 45, o šią reikšmę padalinsime iš 9. Atsakymas: - 5.

Sklaida

Moksliniu požiūriu dispersija yra gautų požymio verčių nuokrypių nuo aritmetinio vidurkio vidutinis kvadratas. Vienas žymimas didžiąja lotyniška raide D. Ko reikia norint ją apskaičiuoti? Kiekvienam sekos elementui apskaičiuokite skirtumą tarp turimo skaičiaus ir aritmetinio vidurkio ir jį kvadratu. Bus lygiai tiek daug vertybių, kiek gali būti renginio, kurį svarstome, rezultatų. Toliau apibendriname viską, ką gavome, ir padaliname iš sekos elementų skaičiaus. Jei turime penkis galimus rezultatus, dalijame iš penkių.

Dispersija taip pat turi savybių, kurias reikia atsiminti, kad būtų galima pritaikyti sprendžiant problemas. Pavyzdžiui, kai atsitiktinis dydis padidinamas X kartų, dispersija padidinama X kartų kvadratu (t. y. X * X). Jis niekada nėra mažesnis už nulį ir nepriklauso nuo reikšmių poslinkio vienoda reikšme aukštyn ar žemyn. Be to, nepriklausomiems testams sumos dispersija yra lygi dispersijų sumai.

Dabar neabejotinai turime apsvarstyti diskrečiųjų atsitiktinių dydžių ir matematinių lūkesčių dispersijos pavyzdžius.

Tarkime, kad atlikome 21 eksperimentą ir gavome 7 skirtingus rezultatus. Kiekvieną iš jų stebėjome atitinkamai 1,2,2,3,4,4 ir 5 kartus. Kas yra dispersija?

Pirmiausia apskaičiuokime aritmetinį vidurkį: elementų suma, žinoma, lygi 21. Padalinkite ją iš 7 ir gaukite 3. Dabar iš kiekvieno pradinės sekos skaičiaus atimkite 3, padėkite kiekvieną reikšmę kvadratu ir pridėkite rezultatus kartu. Išeis 12. Dabar mums belieka skaičių padalyti iš elementų skaičiaus, ir, atrodytų, viskas. Bet yra laimikis! Tai aptarkime.

Priklausomybė nuo eksperimentų skaičiaus

Pasirodo, skaičiuojant dispersiją, vardiklis gali būti vienas iš dviejų skaičių: arba N, arba N-1. Čia N yra atliktų eksperimentų skaičius arba sekos elementų skaičius (kurie iš esmės yra vienodi). nuo ko tai priklauso?

Jei testų skaičius matuojamas šimtais, tai turėtume įvesti vardiklį N. Jei vienetais, tai N-1. Mokslininkai nusprendė nubrėžti ribą gana simboliškai: šiandien ji eina ties skaičiumi 30. Jei atlikome mažiau nei 30 eksperimentų, tada sumą padalinsime iš N-1, o jei daugiau, tai iš N.

Užduotis

Grįžkime prie mūsų dispersijos ir lūkesčių problemos sprendimo pavyzdžio. Gavome tarpinį skaičių 12, kurį reikėjo padalyti iš N arba N-1. Kadangi atlikome 21 eksperimentą, tai yra mažiau nei 30, pasirinksime antrąjį variantą. Taigi atsakymas yra toks: dispersija yra 12/2 = 2.

Tikėtina vertė

Pereikime prie antrosios koncepcijos, kurią būtinai turime apsvarstyti šiame straipsnyje. Tikėtina vertė yra visų galimų rezultatų suma, padauginta iš atitinkamų tikimybių. Svarbu suprasti, kad gauta reikšmė, kaip ir dispersijos skaičiavimo rezultatas, visai problemai gaunamas tik vieną kartą, nesvarbu, kiek rezultatų joje būtų atsižvelgta.

Matematinės lūkesčių formulė gana paprasta: paimame rezultatą, padauginame iš jo tikimybės, pridedame tą patį antrą, trečią rezultatą ir tt Viskas, kas susiję su šia sąvoka, yra nesunkiai apskaičiuojama. Pavyzdžiui, lūkesčių suma yra lygi sumos lūkesčiai. Tas pats pasakytina ir apie kūrinį. Ne kiekviena tikimybės teorijos reikšmė leidžia atlikti tokias paprastas operacijas su savimi. Paimkime problemą ir apskaičiuokime dviejų sąvokų, kurias iš karto nagrinėjome, reikšmę. Be to, mus blaškė teorija – laikas praktikuotis.

Dar vienas pavyzdys

Atlikome 50 bandymų ir gavome 10 skirtingų rezultatų – skaičių nuo 0 iki 9 – skirtingu procentais. Tai yra atitinkamai: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Prisiminkite, kad norint gauti tikimybes, reikia padalyti reikšmes procentais iš 100. Taigi gauname 0,02; 0,1 ir kt. Pateiksime atsitiktinio dydžio dispersijos ir matematinio lūkesčio uždavinio sprendimo pavyzdį.

Aritmetinį vidurkį apskaičiuojame pagal formulę, kurią prisimename iš pradinės mokyklos: 50/10 = 5.

Dabar paverskime tikimybes į rezultatų skaičių „gabalais“, kad būtų lengviau skaičiuoti. Gauname 1, 5, 2, 7, 1, 9, 3, 8, 5 ir 9. Iš kiekvienos gautos reikšmės atimkite aritmetinį vidurkį, po kurio kiekvieną gautą rezultatą padėkite kvadratu. Pažiūrėkite, kaip tai padaryti naudojant pirmąjį elementą kaip pavyzdį: 1 - 5 = (-4). Kitas: (-4) * (-4) = 16. Su likusiomis reikšmėmis šias operacijas atlikite patys. Jei viską padarėte teisingai, tada viską sudėjus gausite 90.

Tęskime dispersijos ir vidurkio skaičiavimą, 90 padalydami iš N. Kodėl pasirenkame N, o ne N-1? Teisingai, nes atliktų eksperimentų skaičius viršija 30. Taigi: 90/10 = 9. Gavome dispersiją. Jei gausite kitą numerį, nenusiminkite. Labiausiai tikėtina, kad skaičiavimuose padarėte dažną klaidą. Dar kartą patikrinkite, ką parašėte, ir tikrai viskas atsistos į savo vietas.

Galiausiai prisiminkime matematinio lūkesčio formulę. Visų skaičiavimų nepateiksime, parašysime tik atsakymą, su kuriuo galėsite pasitikrinti atlikę visas reikalingas procedūras. Tikimasi 5.48 val. Prisiminkime tik, kaip atlikti operacijas, naudodamiesi pirmųjų elementų pavyzdžiu: 0 * 0,02 + 1 * 0,1 ... ir pan. Kaip matote, mes tiesiog padauginame rezultato vertę iš jo tikimybės.

Nukrypimas

Kita sąvoka, glaudžiai susijusi su dispersija ir matematiniais lūkesčiais, yra standartinis nuokrypis. Jis žymimas arba lotyniškomis raidėmis sd, arba graikiškomis mažosiomis raidėmis „sigma“. Ši koncepcija parodo, kiek vidutiniškai reikšmės nukrypsta nuo pagrindinės funkcijos. Norėdami sužinoti jo reikšmę, turite apskaičiuoti dispersijos kvadratinę šaknį.

Jei nubraižote normalųjį skirstinį ir norite tiesiogiai jame matyti standartinį nuokrypį, tai galima padaryti keliais etapais. Paimkite pusę vaizdo į kairę arba į dešinę nuo režimo (centrinė reikšmė), nubrėžkite statmeną horizontaliai ašiai, kad gautų formų plotai būtų lygūs. Atkarpos tarp skirstinio vidurio ir gautos projekcijos į horizontaliąją ašį reikšmė parodys standartinį nuokrypį.

Programinė įranga

Kaip matyti iš formulių aprašymų ir pateiktų pavyzdžių, dispersijos ir matematinės lūkesčių skaičiavimas aritmetiniu požiūriu nėra pati paprasčiausia procedūra. Kad nebūtų gaištas laikas, prasminga naudoti aukštosiose mokyklose naudojamą programą – ji vadinasi „R“. Jame yra funkcijų, leidžiančių apskaičiuoti daugelio sąvokų reikšmes iš statistikos ir tikimybių teorijos.

Pavyzdžiui, jūs apibrėžiate reikšmių vektorių. Tai daroma taip: vektorius<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Pagaliau

Sklaida ir matematinis lūkestis – be kurių sunku ką nors apskaičiuoti ateityje. Pagrindiniame paskaitų kurse universitetuose jos svarstomos jau pirmaisiais dalyko studijų mėnesiais. Būtent dėl ​​šių paprastų sąvokų nesuvokimo ir nesugebėjimo jų apskaičiuoti daugelis studentų iš karto pradeda atsilikti nuo programos, o vėliau sesijoje gauna prastus pažymius, o tai atima stipendijas.

Praktikuokite bent vieną savaitę, pusvalandį per dieną, spręsdami užduotis, panašias į pateiktas šiame straipsnyje. Tada atlikdami bet kurį tikimybių teorijos testą, susidorosite su pavyzdžiais be pašalinių patarimų ir sukčiavimo lapų.

Sklaida Dispersija (iš lotynų kalbos dispersio - dispersija)

matematinėje statistikoje ir tikimybių teorijoje – labiausiai paplitęs dispersijos matas, t.y. nuokrypis nuo vidurkio. Statistiniu požiūriu D.

yra reikšmių kvadratinių nuokrypių aritmetinis vidurkis x i nuo jų aritmetinio vidurkio

Tikimybių teorijoje atsitiktinis dydis NS vadinamas matematiniu lūkesčiu E ( NS - m x) 2 kvadratų nuokrypis NS iš jos matematinių lūkesčių m x= E ( NS). D. atsitiktinis dydis NSžymimas D ( X) arba per σ 2 X... D. kvadratinė šaknis (tai yra σ, jei D. yra σ 2) vadinama standartiniu nuokrypiu (žr. Kvadratinį nuokrypį).

Atsitiktiniam dydžiui NS su nuolatiniu tikimybių pasiskirstymu, apibūdinamu tikimybių tankiu (žr. Tikimybių tankį) R(NS), D. apskaičiuojamas pagal formulę

Tikimybių teorijoje didelę reikšmę turi ši teorema: D. nepriklausomų narių suma lygi jų sumai D. Lygiai taip pat svarbi yra Čebyševo nelygybė, leidžianti įvertinti atsitiktinio dydžio didelių nuokrypių tikimybę NS nuo jo matematinių lūkesčių.

II Sklaida

D. bangų buvimas sukelia signalų formos iškraipymą, kai jie sklinda terpėje. Taip yra dėl to, kad skirtingų dažnių harmoninės bangos, į kurias galima skaidyti signalą, sklinda skirtingu greičiu (plačiau žr. Bangos, Grupės greitis). D. šviesa, sklindanti skaidria prizme, veda prie baltos šviesos skaidymo į spektrą (žr. Šviesos sklaida).


Didžioji sovietinė enciklopedija. - M .: sovietinė enciklopedija. 1969-1978 .

Sinonimai:

Pažiūrėkite, kas yra „dispersija“ kituose žodynuose:

    dispersija- Kažką išbarstyti. Matematikoje dispersija apibrėžia reikšmių nuokrypį nuo vidurkio. Dėl baltos šviesos sklaidos ji suskaidoma į komponentus. Garso sklaida yra jo plitimo priežastis. Saugomų duomenų išsklaidymas visame pasaulyje ... Techninis vertėjo vadovas

    Šiuolaikinė enciklopedija

    - (dispersija) Duomenų sklaidos matas. N narių aibės dispersija randama sudėjus jų nuokrypių nuo vidurkio kvadratus ir padalijus iš N. Todėl jei nariai yra xi, kai i = 1, 2, ..., N, o jų vidurkis yra m , dispersija ...... Ekonomikos žodynas

    Sklaida- (iš lot. dispersio scattering) bangos, bangų sklidimo greičio medžiagoje priklausomybė nuo bangos ilgio (dažnio). Sklaidą lemia fizinės terpės, kurioje sklinda bangos, savybės. Pavyzdžiui, vakuume ...... Iliustruotas enciklopedinis žodynas

    - (iš lotynų kalbos dispersio dispersion) matematinėje statistikoje ir tikimybių teorijoje, sklaidos matas (nukrypimas nuo vidurkio). Statistikoje dispersija yra atsitiktinių ... Didysis enciklopedinis žodynas

    Tikimybių teorijoje labiausiai paplitęs nuokrypio nuo vidurkio matas (sklaidos matas). Anglų kalba: Dispersija Sinonimai: Statistinė dispersija Anglų kalba Sinonimai: Statistinė dispersija Taip pat žiūrėkite: Pavyzdžiai Finansų ... ... Finansų žodynas

    - [lat. dispersus scattered, scattered] 1) dispersija; 2) chem., fiz. medžiagos suskaidymas į labai mažas daleles. D. šviesa – tai baltos šviesos skaidymas naudojant prizmę į spektrą; 3) kilimėlis. nuokrypis nuo vidurkio. Užsienio žodžių žodynas. Komlev N.G., ...... Rusų kalbos svetimžodžių žodynas

    dispersija- (dispersijos) duomenų sklaidos rodiklis, atitinkantis šių duomenų nuokrypio nuo aritmetinio vidurkio vidutinį kvadratą. Lygus standartinio nuokrypio kvadratui. Praktinio psichologo žodynas. M .: AST, derlius. S. Yu. Golovinas. 1998... Didžioji psichologinė enciklopedija

    Sklaida, sklaida Rusų sinonimų žodynas. dispersijos daiktavardis, sinonimų skaičius: 6 nanodispersija (1) ... Sinonimų žodynas

    Sklaida- atsitiktinio dydžio verčių sklaidos charakteristika, išmatuota jų nuokrypių nuo vidurkio kvadratu (žymima d2). Skiriamas teorinis (nuolatinis arba diskretinis) ir empirinis (taip pat tęstinis ir ... Ekonomikos ir matematikos žodynas

    Sklaida- * dispersija * dispersija 1. Sklaidymas; išsklaidyti; variacija (žr.). 2. Teorinė tikimybinė samprata, apibūdinanti atsitiktinio dydžio nuokrypio nuo jo matematinio lūkesčio matą. Biometrinėje praktikoje imties dispersija s2 ... Genetika. enciklopedinis žodynas

Knygos

  • Anomali dispersija plačiose sugerties juostose, D.S. Kalėdos. Atkurta originalia 1934 m. leidimo autoriaus rašyba (SSRS mokslų akademijos leidykla „Izvestija“). V…

Jei populiacija suskirstyta į grupes pagal tiriamą požymį, tai šiai populiacijai galima skaičiuoti tokius sklaidos tipus: bendroji, grupė (intragrupė), vidurkis iš grupės (vidutinis iš grupės viduje), tarpgrupinis.

Iš pradžių apskaičiuojamas determinacijos koeficientas, kuris parodo, kiek visos tiriamo požymio kitimo sudaro tarpgrupinė variacija, t.y. dėl grupavimo atributo:

Empirinis koreliacijos koeficientas apibūdina ryšio tarp grupavimo (veiksnio) ir efektyviųjų sandarumą.

Empirinis koreliacijos santykis gali būti nuo 0 iki 1.

Norėdami įvertinti ryšio tvirtumą pagal empirinio koreliacijos santykio rodiklį, galite naudoti Chaddock koeficientus:

4 pavyzdys. Yra šie duomenys apie įvairių nuosavybės formų projektavimo ir tyrimo organizacijų atliktus darbus:

Apibrėžkite:

1) visuminė dispersija;

2) grupės dispersijos;

3) grupės dispersijų vidurkis;

4) tarpgrupinė dispersija;

5) visa dispersija, pagrįsta dispersijos pridėjimo taisykle;


6) determinacijos koeficientas ir empirinis koreliacijos santykis.

Daryti išvadas.

Sprendimas:

1. Nustatykime vidutinę dviejų nuosavybės formų įmonių atliekamų darbų apimtį:

Apskaičiuokime bendrą dispersiją:

2. Apibrėžkime grupę reiškia:

milijonas rublių;

RUB milijonas

Grupės skirtumai:

;

3. Apskaičiuokime grupių dispersijų vidurkį:

4. Apibrėžkime tarpgrupinę dispersiją:

5. Apskaičiuokime bendrą dispersiją pagal dispersijos pridėjimo taisyklę:

6. Apibrėžkime determinacijos koeficientą:

.

Taigi projektavimo ir tyrimo organizacijų atliekamų darbų kiekis 22% priklauso nuo įmonių nuosavybės formos.

Empirinis koreliacijos santykis apskaičiuojamas pagal formulę

.

Apskaičiuoto rodiklio reikšmė rodo, kad darbų apimties priklausomybė nuo įmonės nuosavybės formos nėra didelė.

5 pavyzdys. Atlikus gamybos vietų technologinės disciplinos tyrimą buvo gauti šie duomenys:

Nustatykite determinacijos koeficientą

Atsitiktinio dydžio dispersija yra šio dydžio reikšmių sklaidos matas. Maža dispersija reiškia, kad reikšmės sugrupuotos arti viena kitos. Didelė dispersija rodo stiprią reikšmių sklaidą. Statistikoje vartojama atsitiktinio dydžio dispersijos sąvoka. Pavyzdžiui, jei lyginate dviejų kintamųjų verčių dispersiją (pvz., pacientų vyrų ir moterų stebėjimus), galite patikrinti kintamojo reikšmę. Dispersija taip pat naudojama kuriant statistinius modelius, nes maža dispersija gali reikšti, kad pervertinate vertes.

Žingsniai

Imties dispersijos apskaičiavimas

  1. Užsirašykite pavyzdines vertes. Daugeliu atvejų statistikams prieinami tik konkrečių populiacijų pavyzdžiai. Pavyzdžiui, statistikai paprastai neanalizuoja visų Rusijos automobilių suvestinio išlaikymo kaštų – jie analizuoja atsitiktinę kelių tūkstančių automobilių imtį. Toks pavyzdys padės nustatyti vidutinę automobilio kainą, tačiau greičiausiai gauta vertė bus toli nuo tikrosios.

    • Pavyzdžiui, paanalizuokime per 6 dienas kavinėje parduotų bandelių skaičių atsitiktine tvarka. Imtis atrodo taip: 17, 15, 23, 7, 9, 13. Tai yra imtis, o ne visuma, nes neturime duomenų apie parduotas bandeles kiekvienai kavinės darbo dienai.
    • Jei jums pateikiama populiacija, o ne reikšmių pavyzdys, pereikite prie kito skyriaus.
  2. Užrašykite imties dispersijos apskaičiavimo formulę. Sklaida yra tam tikro dydžio verčių sklaidos matas. Kuo dispersijos reikšmė arčiau nulio, tuo arčiau reikšmės sugrupuojamos viena su kita. Dirbdami su reikšmių pavyzdžiu, dispersijai apskaičiuoti naudokite šią formulę:

    • s 2 (\ displaystyle s ^ (2)) = ∑[(x i (\ displaystyle x_ (i))-x̅) 2 (\ ekrano stilius ^ (2))] / (n - 1)
    • s 2 (\ displaystyle s ^ (2)) Ar dispersija. Sklaida matuojama kvadratiniais vienetais.
    • x i (\ displaystyle x_ (i))- kiekviena imties reikšmė.
    • x i (\ displaystyle x_ (i)) atimkite x̅, kvadratą ir pridėkite rezultatus.
    • x̅ - imties vidurkis (imties vidurkis).
    • n yra imties verčių skaičius.
  3. Apskaičiuokite imties vidurkį. Jis žymimas x̅. Imties vidurkis apskaičiuojamas kaip normalus aritmetinis vidurkis: sudėkite visas imties reikšmes ir padalykite rezultatą iš imtyje esančių reikšmių skaičiaus.

    • Mūsų pavyzdyje pridėkite vertes pavyzdyje: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Dabar padalykite rezultatą iš imties verčių skaičiaus (mūsų pavyzdyje yra 6): 84 ÷ 6 = 14.
      Imties vidurkis x̅ = 14.
    • Imties vidurkis yra centrinė vertė, aplink kurią pasiskirsto imties reikšmės. Jei imties reikšmės yra sugrupuotos aplink imties vidurkį, tada dispersija yra maža; kitu atveju dispersija yra didelė.
  4. Iš kiekvienos imties vertės atimkite imties vidurkį. Dabar apskaičiuokite skirtumą x i (\ displaystyle x_ (i))- x̅, kur x i (\ displaystyle x_ (i))- kiekviena imties reikšmė. Kiekvienas gautas rezultatas nurodo tam tikros reikšmės nukrypimo nuo imties vidurkio laipsnį, tai yra, kiek ši reikšmė yra nuo imties vidurkio.

    • Mūsų pavyzdyje:
      x 1 (\ displaystyle x_ (1))- x̅ = 17 - 14 = 3
      x 2 (\ displaystyle x_ (2))- x̅ = 15 - 14 = 1
      x 3 (\ displaystyle x_ (3))- x̅ = 23 - 14 = 9
      x 4 (\ displaystyle x_ (4))- x̅ = 7 - 14 = -7
      x 5 (\ displaystyle x_ (5))- x̅ = 9 - 14 = -5
      x 6 (\ displaystyle x_ (6))- x̅ = 13 - 14 = -1
    • Gautų rezultatų teisingumą nesunku patikrinti, nes jų suma turi būti lygi nuliui. Taip yra dėl vidurkio nustatymo, nes neigiamos reikšmės (atstumai nuo vidurkio iki žemesnių verčių) yra visiškai kompensuojamos teigiamomis reikšmėmis (atstumai nuo vidurkio iki didesnių verčių).
  5. Kaip minėta aukščiau, skirtumų suma x i (\ displaystyle x_ (i))- x̅ turi būti lygus nuliui. Tai reiškia, kad vidutinė dispersija visada yra lygi nuliui, o tai nesuteikia jokio supratimo apie tam tikro dydžio verčių sklaidą. Norėdami išspręsti šią problemą, kiekvieną skirtumą padalykite kvadratu x i (\ displaystyle x_ (i))- x̅. Tai lems tai, kad gausite tik teigiamus skaičius, kuriuos pridėjus niekada nebus 0.

    • Mūsų pavyzdyje:
      (x 1 (\ displaystyle x_ (1))-x̅) 2 = 3 2 = 9 (\ ekrano stilius ^ (2) = 3 ^ (2) = 9)
      (x 2 (\ ekrano stilius (x_ (2))-x̅) 2 = 1 2 = 1 (\ ekrano stilius ^ (2) = 1 ^ (2) = 1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Radote skirtumą kvadratu – x̅) 2 (\ ekrano stilius ^ (2)) kiekvienai imties vertei.
  6. Apskaičiuokite skirtumų kvadratų sumą. Tai yra, suraskite formulės dalį, kuri parašyta taip: ∑ [( x i (\ displaystyle x_ (i))-x̅) 2 (\ ekrano stilius ^ (2))]. Čia ženklas Σ reiškia kiekvienos reikšmės skirtumų kvadratų sumą x i (\ displaystyle x_ (i)) pavyzdyje. Jūs jau radote skirtumų kvadratus (x i (\ ekrano stilius (x_ (i))-x̅) 2 (\ ekrano stilius ^ (2)) kiekvienai vertei x i (\ displaystyle x_ (i)) mėginyje; dabar tiesiog pridėkite tuos kvadratus.

    • Mūsų pavyzdyje: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Padalinkite rezultatą iš n - 1, kur n yra imties verčių skaičius. Prieš kurį laiką statistika imties dispersijai apskaičiuoti tiesiog padalijo rezultatą iš n; šiuo atveju gausite vidutinę kvadratinę dispersiją, kuri idealiai tinka tam tikros imties dispersijai apibūdinti. Tačiau atminkite, kad bet kuri imtis sudaro tik mažą visos verčių populiacijos dalį. Jei paimsite kitą pavyzdį ir atliksite tuos pačius skaičiavimus, gausite skirtingą rezultatą. Pasirodo, padalijus iš n - 1 (ne tik n), gaunamas tikslesnis populiacijos dispersijos įvertis, kuris jus domina. Dalyba iš n - 1 tapo įprasta, todėl įtraukta į imties dispersijos skaičiavimo formulę.

    • Mūsų pavyzdyje pavyzdyje yra 6 reikšmės, ty n = 6.
      Imties dispersija = s 2 = 166 6 - 1 = (\ displaystyle s ^ (2) = (\ frac (166) (6-1)) =) 33,2
  8. Skirtumas tarp dispersijos ir standartinio nuokrypio. Atkreipkite dėmesį, kad formulėje yra eksponentas, todėl dispersija matuojama analizuojamo dydžio kvadratiniais vienetais. Kartais gana sunku operuoti su tokia verte; tokiais atvejais naudojamas standartinis nuokrypis, kuris yra lygus dispersijos kvadratinei šaknei. Štai kodėl imties dispersija žymima kaip s 2 (\ displaystyle s ^ (2)), o imties standartinis nuokrypis yra kaip s (\ displaystyle s).

    • Mūsų pavyzdyje imties standartinis nuokrypis yra s = √33,2 = 5,76.

    Skaičiuojant populiacijos dispersiją

    1. Išanalizuokite kai kurias vertybes. Rinkinyje yra visos svarstomo kiekio reikšmės. Pavyzdžiui, jei tiriame Leningrado srities gyventojų amžių, tada į suvestinę įeina visų šio regiono gyventojų amžius. Jei dirbate su populiacija, rekomenduojama sukurti lentelę ir į ją įvesti populiacijos reikšmes. Apsvarstykite šį pavyzdį:

      • Kai kuriuose kambariuose yra 6 akvariumai. Kiekviename akvariume yra toks žuvų skaičius:
        x 1 = 5 (\ ekrano stilius x_ (1) = 5)
        x 2 = 5 (\ displaystyle x_ (2) = 5)
        x 3 = 8 (\ ekrano stilius x_ (3) = 8)
        x 4 = 12 (\ ekrano stilius x_ (4) = 12)
        x 5 = 15 (\ ekrano stilius x_ (5) = 15)
        x 6 = 18 (\ ekrano stilius x_ (6) = 18)
    2. Užsirašykite populiacijos dispersijos apskaičiavimo formulę. Kadangi visuma apima visas tam tikro dydžio reikšmes, toliau pateikta formulė leidžia gauti tikslią agregato dispersijos reikšmę. Siekdami atskirti visumos dispersiją nuo imties dispersijos (kurios reikšmė yra tik įvertis), statistikai naudoja įvairius kintamuosius:

      • σ 2 (\ ekrano stilius ^ (2)) = (∑(x i (\ displaystyle x_ (i)) - μ) 2 (\ ekrano stilius ^ (2))) / n
      • σ 2 (\ ekrano stilius ^ (2))– populiacijos dispersija (skaitoma kaip „sigmos kvadratas“). Sklaida matuojama kvadratiniais vienetais.
      • x i (\ displaystyle x_ (i))- kiekviena bendra vertė.
      • Σ yra sumos ženklas. Tai yra, nuo kiekvienos vertės x i (\ displaystyle x_ (i)) atimkite μ, kvadratą ir pridėkite rezultatus.
      • μ – populiacijos vidurkis.
      • n yra reikšmių skaičius bendroje populiacijoje.
    3. Apskaičiuokite gyventojų vidurkį. Dirbant su bendrąja populiacija, jos vidutinė reikšmė žymima μ (mu). Visuomenės vidurkis apskaičiuojamas kaip įprastas aritmetinis vidurkis: sudėkite visas populiacijos reikšmes ir padalykite rezultatą iš populiacijos reikšmių skaičiaus.

      • Atminkite, kad vidurkiai ne visada skaičiuojami kaip aritmetinis vidurkis.
      • Mūsų pavyzdyje populiacijos vidurkis: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\ displaystyle (\ frac (5 + 5 + 8 + 12 + 15 + 18) (6))) = 10,5
    4. Iš kiekvienos populiacijos reikšmės atimkite populiacijos vidurkį. Kuo skirtumo reikšmė arčiau nulio, tuo konkreti reikšmė artimesnė populiacijos vidurkiui. Raskite skirtumą tarp kiekvienos populiacijos reikšmės ir jos vidurkio ir turėsite pirmąją idėją apie reikšmių pasiskirstymą.

      • Mūsų pavyzdyje:
        x 1 (\ displaystyle x_ (1))- μ = 5 - 10,5 = -5,5
        x 2 (\ displaystyle x_ (2))- μ = 5 - 10,5 = -5,5
        x 3 (\ displaystyle x_ (3))- μ = 8 - 10,5 = -2,5
        x 4 (\ displaystyle x_ (4))- μ = 12 - 10,5 = 1,5
        x 5 (\ displaystyle x_ (5))- μ = 15 - 10,5 = 4,5
        x 6 (\ displaystyle x_ (6))- μ = 18 - 10,5 = 7,5
    5. Kiekvieno gauto rezultato kvadratas. Skirtumo reikšmės bus teigiamos ir neigiamos; jei šios vertės pavaizduotos skaičių tiesėje, tada jos bus dešinėje ir kairėje nuo vidutinės populiacijos vertės. Tai nėra gerai skaičiuojant dispersiją, nes teigiami ir neigiami skaičiai panaikina vienas kitą. Taigi kiekvieną skirtumą padalykite kvadratu, kad gautumėte itin teigiamus skaičius.

      • Mūsų pavyzdyje:
        (x i (\ displaystyle x_ (i)) - μ) 2 (\ ekrano stilius ^ (2)) kiekvienai visumos vertei (nuo i = 1 iki i = 6):
        (-5,5)2 (\ ekrano stilius ^ (2)) = 30,25
        (-5,5)2 (\ ekrano stilius ^ (2)), kur x n (\ displaystyle x_ (n))- paskutinė reikšmė bendroje populiacijoje.
      • Norėdami apskaičiuoti gautų rezultatų vidutinę reikšmę, turite rasti jų sumą ir padalyti iš n: (( x 1 (\ displaystyle x_ (1)) - μ) 2 (\ ekrano stilius ^ (2)) + (x 2 (\ displaystyle x_ (2)) - μ) 2 (\ ekrano stilius ^ (2)) + ... + (x n (\ displaystyle x_ (n)) - μ) 2 (\ ekrano stilius ^ (2))) / n
      • Dabar parašykime aukščiau pateiktą paaiškinimą naudodami kintamuosius: (∑ ( x i (\ displaystyle x_ (i)) - μ) 2 (\ ekrano stilius ^ (2))) / n ir gaukite populiacijos dispersijos apskaičiavimo formulę.