20.09.2019

Funkcijų dispersijos formulė. Santykiniai kitimo rodikliai. Dispersija patogiai apskaičiuojama pagal formulę, kurią lengva gauti naudojant dispersijos savybes


Pagrindiniai statistikos kitimo apibendrinimo rodikliai yra sklaida ir standartinis nuokrypis.

Sklaida tai aritmetinis vidurkis kiekvienos požymio reikšmės nuokrypiai nuo bendro vidurkio kvadratu. Dispersija paprastai vadinama vidutiniu nuokrypių kvadratu ir žymima  2 . Priklausomai nuo pradinių duomenų, dispersija gali būti apskaičiuojama pagal aritmetinį vidurkį, paprastą arba svertinį:

 nesvertinė (paprastoji) dispersija;

 svertinė dispersija.

Standartinis nuokrypis yra absoliučių matmenų apibendrinanti charakteristika variacijos bruožas visumoje. Jis išreiškiamas tais pačiais vienetais kaip ir ženklas (metrais, tonomis, procentais, hektarais ir kt.).

Standartinis nuokrypis yra kvadratinė šaknis nuo dispersijos ir žymimas :

 nesvertinis standartinis nuokrypis;

 svertinis standartinis nuokrypis.

Standartinis nuokrypis yra vidurkio patikimumo matas. Kuo mažesnis standartinis nuokrypis, tuo aritmetinis vidurkis geriau atspindi visą reprezentuojamą populiaciją.

Prieš apskaičiuojant standartinį nuokrypį, apskaičiuojama dispersija.

Svertinės dispersijos apskaičiavimo procedūra yra tokia:

1) nustatyti aritmetinį svertinį vidurkį:

2) apskaičiuokite variantų nuokrypius nuo vidurkio:

3) kiekvieno varianto nuokrypį nuo vidurkio padėkite kvadratu:

4) padauginkite nuokrypius kvadratu iš svorių (dažnių):

5) apibendrinti gautus darbus:

6) gauta suma padalinama iš svorių sumos:

2.1 pavyzdys

Apskaičiuokite aritmetinį svertinį vidurkį:

Nuokrypių nuo vidurkio reikšmės ir jų kvadratai pateikti lentelėje. Apibrėžkime dispersiją:

Standartinis nuokrypis bus lygus:

Jei šaltinio duomenys pateikiami kaip intervalas platinimo serija , tada pirmiausia turite nustatyti atskirą funkcijos reikšmę ir tada taikyti aprašytą metodą.

2.2 pavyzdys

Parodykime duomenų apie kolūkio pasėlių ploto pasiskirstymą pagal kviečių derlių intervalų eilučių dispersijos apskaičiavimą.

Aritmetinis vidurkis yra:

Apskaičiuokime dispersiją:

6.3. Sklaidos apskaičiavimas pagal individualių duomenų formulę

Skaičiavimo technika dispersija sudėtingas, o didelės parinkčių ir dažnių vertės gali būti sudėtingos. Skaičiavimai gali būti supaprastinti naudojant dispersijos savybes.

Dispersija turi šias savybes.

1. Kintamo požymio svorių (dažnių) sumažėjimas arba padidėjimas tam tikru kartų skaičiumi sklaidos nekeičia.

2. Kiekvienos funkcijos reikšmės sumažinimas arba padidinimas ta pačia pastovia verte BET dispersija nesikeičia.

3. Kiekvienos funkcijos reikšmės sumažinimas arba padidinimas tam tikrą skaičių kartų k atitinkamai sumažina arba padidina dispersiją k 2 kartus standartinis nuokrypis  į k kartą.

4. Požymio dispersija, palyginti su savavališka verte, visada yra didesnė už dispersiją, palyginti su aritmetiniu vidurkiu, skirtumo tarp vidutinių ir savavališkų reikšmių kvadratu:

Jeigu BET 0, tada gauname tokią lygybę:

y., požymio dispersija yra lygi skirtumui tarp požymio reikšmių vidurkio kvadrato ir vidurkio kvadrato.

Skaičiuojant dispersiją, kiekviena savybė gali būti naudojama atskirai arba kartu su kitomis.

Dispersijos apskaičiavimo procedūra yra paprasta:

1) nustatyti aritmetinis vidurkis :

2) padėkite aritmetinį vidurkį kvadratu:

3) kiekvieno serijos varianto nuokrypį padėkite kvadratu:

X i 2 .

4) Raskite variantų kvadratų sumą:

5) padalykite variantų kvadratų sumą iš jų skaičiaus, t.y. nustatykite vidutinį kvadratą:

6) nustatyti skirtumą tarp požymio vidutinio kvadrato ir vidurkio kvadrato:

3.1 pavyzdys Turime šiuos duomenis apie darbuotojų produktyvumą:

Atlikime šiuos skaičiavimus:

Dažnai statistikoje, analizuojant reiškinį ar procesą, reikia atsižvelgti ne tik į informaciją apie vidutinius tiriamų rodiklių lygius, bet ir atskirų vienetų verčių išsibarstymas ar kitimas , kuri yra svarbi tirtos populiacijos savybė.

Akcijų kainos, pasiūlos ir paklausos apimtys, palūkanų normos skirtingais laikotarpiais ir skirtingose ​​vietose turi didžiausią svyravimą.

Pagrindiniai kitimą apibūdinantys rodikliai , yra diapazonas, dispersija, standartinis nuokrypis ir variacijos koeficientas.

Tarpo variacija yra skirtumas tarp didžiausių ir mažiausių atributo verčių: R = Xmax – Xmin. Šio rodiklio trūkumas yra tas, kad jis įvertina tik požymio kitimo ribas ir neatspindi jo svyravimo šiose ribose.

Sklaida neturintis šio trūkumo. Jis apskaičiuojamas kaip vidutinis atributų reikšmių nuokrypių nuo jų vidutinės vertės kvadratas:

Supaprastintas dispersijos skaičiavimo būdas atliekama naudojant šias formules (paprastas ir svertines):

Šių formulių taikymo pavyzdžiai pateikti 1 ir 2 užduotyse.

Praktikoje plačiai naudojamas rodiklis yra standartinis nuokrypis :

Standartinis nuokrypis apibrėžiamas kaip dispersijos kvadratinė šaknis ir turi tokį patį matmenį kaip ir tiriamas požymis.

Nagrinėjami rodikliai leidžia gauti absoliučią variacijos reikšmę, t.y. įvertinti jį tiriamo požymio matavimo vienetais. Skirtingai nei jie, variacijos koeficientas matuoja svyravimus santykiniais dydžiais – palyginti su vidutiniu lygiu, kuris daugeliu atvejų yra pageidautinas.

Variacijos koeficiento apskaičiavimo formulė.

Problemų sprendimo pavyzdžiai tema „Statistikos kitimo rodikliai“

1 užduotis . Tiriant reklamos įtaką vidutinio mėnesinio indėlio dydžiui regiono bankuose, buvo ištirti 2 bankai. Gaunami šie rezultatai:

Apibrėžkite:
1) kiekvienam bankui: a) vidutinis mėnesinis indėlis; b) įnašo paskirstymas;
2) vidutinis mėnesinis indėlis dviem bankams kartu;
3) Užstato paskirstymas 2 bankams, priklausomai nuo reklamos;
4) Indėlio paskirstymas 2 bankams, priklausomai nuo visų faktorių, išskyrus reklamą;
5) Bendra dispersija naudojant sudėjimo taisyklę;
6) Determinacijos koeficientas;
7) Koreliacijos ryšys.

Sprendimas

1) Padarykime skaičiavimo lentelę bankui su reklama . Norėdami nustatyti vidutinį mėnesinį indėlį, randame intervalų vidurio taškus. Šiuo atveju atvirojo intervalo reikšmė (pirmasis) sąlyginai prilyginama greta esančio intervalo (antrojo) reikšmei.

Vidutinį įnašo dydį randame naudodami svertinio aritmetinio vidurkio formulę:

29 000/50 = 580 rublių

Įnašo sklaida randama pagal formulę:

23 400/50 = 468

Mes atliksime panašius veiksmus bankui be skelbimų :

2) Raskite vidutinį indėlį dviem bankams kartu. Xav \u003d (580 × 50 + 542,8 × 50) / 100 \u003d 561,4 rubliai.

3) Indėlio dispersiją, dviem bankams, priklausomai nuo reklamos, rasime pagal formulę: σ 2 =pq (alternatyvaus požymio dispersijos formulė). Čia p=0,5 yra veiksnių, kurie priklauso nuo reklamos, dalis; q=1-0,5, tada σ 2 =0,5*0,5=0,25.

4) Kadangi kitų veiksnių dalis yra 0,5, tai dviejų bankų indėlio dispersija, kuri priklauso nuo visų veiksnių, išskyrus reklamą, taip pat yra 0,25.

5) Naudodami sudėjimo taisyklę, nustatykite bendrą dispersiją.

= (468*50+636,16*50)/100=552,08

= [(580-561,4)250+(542,8-561,4)250] / 100= 34 596/ 100=345,96

σ 2 \u003d σ 2 faktas + σ 2 poilsis \u003d 552,08 + 345,96 \u003d 898,04

6) Determinacijos koeficientas η 2 = σ 2 faktas / σ 2 = 345,96/898,04 = 0,39 = 39% - įnašo dydis priklauso nuo reklamos 39%.

7) Empirinis koreliacijos koeficientas η = √η 2 = √0,39 = 0,62 – ryšys gana glaudus.

2 užduotis . Yra įmonių grupavimas pagal parduodamų produktų vertę:

Nustatyti: 1) prekinių produktų vertės sklaidą; 2) standartinis nuokrypis; 3) variacijos koeficientas.

Sprendimas

1) Pagal sąlygą pateikiama intervalų pasiskirstymo eilutė. Jis turi būti išreikštas diskretiškai, tai yra, rasti intervalo vidurį (x "). Uždarų intervalų grupėse vidurį randame paprastu aritmetiniu vidurkiu. Grupėse su viršutine riba kaip skirtumas tarp šios viršutinės ribos ir pusė po jo einančio intervalo dydžio (200-(400 -200):2=100).

Grupėse su apatine riba - šios apatinės ribos ir pusės ankstesnio intervalo dydžio suma (800+(800-600):2=900).

Prekinių produktų vidutinė vertė apskaičiuojama pagal formulę:

Хср = k×((Σ((x"-a):k) × f):Σf)+a. Čia a=500 yra didžiausio dažnio varianto dydis, k=600-400=200 yra intervalo dydis didžiausiu dažniu Padėkime rezultatą į lentelę:

Taigi vidutinė parduodamos produkcijos vertė per visą tiriamąjį laikotarpį yra Xav = (-5:37) × 200 + 500 = 472,97 tūkst.

2) Mes randame dispersiją naudodami šią formulę:

σ 2 \u003d (33/37) * 2002-(472,97-500) 2 = 35 675,67-730,62 \u003d 34 945,05

3) standartinis nuokrypis: σ = ±√σ 2 = ±√34 945,05 ≈ ±186,94 tūkst.

4) variacijos koeficientas: V \u003d (σ / Xav) * 100 \u003d (186,94 / 472,97) * 100 \u003d 39,52%

Variacijų diapazonas (arba variacijų diapazonas) – yra skirtumas tarp didžiausios ir mažiausios funkcijos verčių:

Mūsų pavyzdyje darbuotojų pamainos našumo kitimo diapazonas yra toks: pirmoje brigadoje R=105-95=10 vaikų, antroje brigadoje R=125-75=50 vaikų. (5 kartus daugiau). Tai rodo, kad 1-osios brigados produkcija yra „stabilesnė“, tačiau antroji brigada turi daugiau rezervų produkcijos augimui, nes. jei visi darbuotojai pasiekia maksimalią šios brigados našumą, ji gali pagaminti 3 * 125 = 375 dalis, o 1-oje brigadoje tik 105 * 3 = 315 dalių.
Jei kraštutinės atributo reikšmės nėra būdingos populiacijai, tada naudojami kvartilių arba decilių diapazonai. Kvartilis diapazonas RQ= Q3-Q1 apima 50% populiacijos, pirmasis decilio diapazonas RD1 = D9-D1 apima 80% duomenų, antrasis decilio diapazonas RD2= D8-D2 apima 60%.
Variacijos diapazono rodiklio trūkumas yra tas, kad jo reikšmė neatspindi visų požymio svyravimų.
Paprasčiausias apibendrinamasis rodiklis, atspindintis visus bruožo svyravimus, yra vidutinis tiesinis nuokrypis, kuris yra atskirų pasirinkimų absoliučių nuokrypių nuo jų vidutinės vertės aritmetinis vidurkis:

,
sugrupuotiems duomenims
,
kur хi yra atributo reikšmė diskrečioje eilutėje arba intervalo vidurys intervalo skirstinyje.
Aukščiau pateiktose formulėse skaitiklio skirtumai imami modulo, kitu atveju pagal aritmetinio vidurkio savybę skaitiklis visada bus lygus nuliui. Todėl vidutinis tiesinis nuokrypis statistikos praktikoje naudojamas retai, tik tais atvejais, kai rodiklių sumavimas neatsižvelgiant į ženklą yra ekonomiškai prasmingas. Jos pagalba, pavyzdžiui, analizuojama darbuotojų sudėtis, gamybos pelningumas, užsienio prekybos apyvarta.
Funkcijų dispersija varianto nuokrypių nuo jų vidutinės vertės kvadratas:
paprasta dispersija
,
svertinis dispersija
.
Dispersijos apskaičiavimo formulę galima supaprastinti:

Taigi dispersija yra lygi skirtumui tarp varianto kvadratų vidurkio ir visumos varianto vidurkio kvadrato:
.
Tačiau dėl kvadratinių nuokrypių sumavimo dispersija suteikia iškreiptą nuokrypių vaizdą, todėl iš jos apskaičiuojamas vidurkis. standartinis nuokrypis, kuris parodo, kiek konkretūs atributo variantai vidutiniškai skiriasi nuo jų vidutinės reikšmės. Apskaičiuojama imant kvadratinę šaknį nuo dispersijos:
negrupuotiems duomenims
,
variacijų serijai

Kuo mažesnė dispersijos reikšmė ir standartinis nuokrypis, tuo populiacija homogeniškesnė, tuo patikimesnė (tipiškesnė) bus vidutinė reikšmė.
Vidutinis tiesinis ir vidutinis kvadratinis nuokrypis yra įvardijami skaičiais, t.y. išreiškiami atributo matavimo vienetais, yra identiški savo turiniu ir artimi reikšme.
Absoliučius kitimo rodiklius rekomenduojama apskaičiuoti naudojant lenteles.
3 lentelė. Variacijos charakteristikų apskaičiavimas (pagal darbo grupių pamainos našumo duomenų laikotarpio pavyzdį)


Darbuotojų skaičius

Intervalo vidurys

Numatomos vertės

Iš viso:

Vidutinė darbuotojų darbo pamaina:

Vidutinis tiesinis nuokrypis:

Išvesties dispersija:

Atskirų darbuotojų produkcijos standartinis nuokrypis nuo vidutinės produkcijos:
.

1 Sklaidos apskaičiavimas momentų metodu

Nuokrypių skaičiavimas yra susijęs su sudėtingais skaičiavimais (ypač jei vidurkis išreiškiamas dideliu skaičiumi keliomis skaitmenimis po kablelio). Skaičiavimai gali būti supaprastinti naudojant supaprastintą formulę ir dispersijos savybes.
Dispersija turi šias savybes:

  1. jei visos atributo reikšmės sumažinamos arba padidinamos ta pačia reikšme A, tada nuokrypis nuo to nesumažės:

,

, tada arba
Naudodami dispersijos savybes ir pirmiausia sumažinę visus populiacijos variantus reikšme A, o po to padalijus iš intervalo h reikšmės, gauname formulę dispersijos skaičiavimui variacijų eilutėse su vienodais intervalais. akimirkų būdas:
,
kur momentų metodu apskaičiuota dispersija;
h – variacijų eilutės intervalo reikšmė;
– naujos (transformuotos) variantų reikšmės;
A yra pastovi reikšmė, kuri naudojama kaip didžiausio dažnio intervalo vidurys; arba variantas su didžiausiu dažniu;
yra pirmosios eilės momento kvadratas;
yra antros eilės momentas.
Apskaičiuokime dispersiją momentų metodu, remdamiesi duomenimis apie dirbančios komandos pamainos našumą.
4 lentelė. Sklaidos apskaičiavimas momentų metodu


Gamybos darbuotojų grupės, vnt.

Darbuotojų skaičius

Intervalo vidurys

Numatomos vertės

Skaičiavimo procedūra:


  1. apskaičiuokite dispersiją:

2 Alternatyvaus požymio dispersijos apskaičiavimas

Tarp statistikos tyrinėtų ženklų yra tokių, kurie turi tik dvi viena kitą paneigiančias reikšmes. Tai alternatyvūs ženklai. Jiems suteikiamos atitinkamai dvi kiekybinės reikšmės: 1 ir 0 variantai. 1 variantų dažnis, žymimas p, yra vienetų, turinčių šią savybę, dalis. Skirtumas 1-p=q yra 0 variantų dažnis.


xi

Alternatyvaus požymio aritmetinis vidurkis
, nes p+q=1.

Funkcijų dispersija
, nes 1-p=q
Taigi alternatyvaus požymio dispersija yra lygi vienetų, turinčių šį požymį, ir vienetų, kurie neturi šio požymio, dalies sandaugai.
Jei reikšmės 1 ir 0 yra vienodai dažnos, ty p=q, dispersija pasiekia didžiausią pq=0,25.
Variacijos kintamasis naudojamas imčių tyrimuose, pavyzdžiui, produkto kokybei.

3 Tarpgrupinė dispersija. Nuokrypių pridėjimo taisyklė

Dispersija, skirtingai nuo kitų kitimo charakteristikų, yra adityvus dydis. Tai yra suvestinėje, kuri suskirstyta į grupes pagal faktoriaus kriterijų X , gaunama dispersija y gali būti suskaidytas į dispersiją kiekvienoje grupėje (grupėje) ir dispersiją tarp grupių (tarp grupių). Tada, kartu su požymio kitimo visoje populiacijoje tyrimu, tampa įmanoma ištirti kiekvienos grupės, taip pat ir tarp šių grupių skirtumus.

Bendra dispersija matuoja bruožo kitimą adresu visoje populiacijoje, veikiant visiems veiksniams, sukėlusiems šį kitimą (nukrypimus). Jis lygus atskirų požymio verčių nuokrypių vidutiniam kvadratui adresu bendrojo vidurkio ir gali būti apskaičiuojamas kaip paprasta arba svertinė dispersija.
Tarpgrupinė dispersija apibūdina efektyviosios savybės kitimą adresu, sukeltas ženklo-faktoriaus įtakos X grupavimo pagrindas. Jis apibūdina grupės vidurkių kitimą ir yra lygus vidutiniam grupės vidurkių nuokrypių nuo bendrojo vidurkio kvadratui:
,
kur yra i-osios grupės aritmetinis vidurkis;
– vienetų skaičius i-oje grupėje (i-osios grupės dažnis);
yra bendras gyventojų vidurkis.
Vidinė grupės dispersija atspindi atsitiktinę variaciją, t.y. tą variacijos dalį, kurią sukelia neatsižvelgtų veiksnių įtaka ir kuri nepriklauso nuo atributo faktoriaus, kuriuo grindžiama grupė. Jis apibūdina individualių verčių kitimą, palyginti su grupės vidurkiais, yra lygus individualių bruožo verčių nuokrypių vidutiniam kvadratui. adresu grupėje nuo šios grupės aritmetinio vidurkio (grupės vidurkio) ir apskaičiuojamas kaip paprastas arba svertinis kiekvienos grupės dispersija:
arba ,
kur yra vienetų skaičius grupėje.
Remiantis kiekvienos grupės skirtumais grupės viduje, galima nustatyti bendras grupės vidaus dispersijų vidurkis:
.
Santykis tarp trijų dispersijų vadinamas dispersijos pridėjimo taisyklės, pagal kurią bendra dispersija yra lygi tarpgrupinės dispersijos sumai ir grupės viduje esančių dispersijų vidurkiui:

Pavyzdys. Tiriant darbuotojų tarifinės kategorijos (kvalifikacijos) įtaką jų darbo našumo lygiui, gauti šie duomenys.
5 lentelė. Darbuotojų pasiskirstymas pagal vidutinę valandinę produkciją.



p/p

4 kategorijos darbuotojai

5 kategorijos darbuotojai

Sportuoti
darbininkas, vnt.,

Sportuoti
darbininkas, vnt.,

1
2
3
4
5
6

7
9
9
10
12
13

7-10=-3
9-10=-1
-1
0
2
3

9
1
1
0
4
9

1
2
3
4

14
14
15
17

14-15=-1
-1
0
2

1
1
0
4

Šiame pavyzdyje darbuotojai skirstomi į dvi grupes pagal veiksnį X- kvalifikacija, kuriai būdingas jų rangas. Efektyvus požymis – gamyba – kinta tiek pagal jo įtaką (tarpgrupinė variacija), tiek dėl kitų atsitiktinių veiksnių (intragrupinė variacija). Iššūkis yra išmatuoti šiuos skirtumus naudojant tris dispersijas: bendrą, tarp grupių ir grupės viduje. Empirinis determinacijos koeficientas parodo gauto požymio kitimo proporciją adresu veiksnio ženklo įtakoje X. Likusi visos variacijos dalis adresu sukeltas kitų veiksnių pokyčių.
Pavyzdyje empirinis determinacijos koeficientas yra:
arba 66,7 proc.
Tai reiškia, kad 66,7% darbuotojų darbo našumo kitimo lemia kvalifikacijos skirtumai, o 33,3% – kitų veiksnių įtaka.
Empirinis koreliacinis ryšys parodo santykio tarp grupavimo ir efektyvių savybių sandarumą. Jis apskaičiuojamas kaip empirinio determinacijos koeficiento kvadratinė šaknis:

Empirinis koreliacijos koeficientas, taip pat , gali būti nuo 0 iki 1.
Jei ryšio nėra, tada =0. Šiuo atveju =0, tai yra, grupės vidurkiai yra lygūs vienas kitam ir nėra tarpgrupinių variacijų. Tai reiškia, kad grupavimo ženklas – veiksnys neturi įtakos bendros variacijos susidarymui.
Jei ryšys yra funkcinis, tada =1. Šiuo atveju grupės vidurkių dispersija yra lygi bendrajai dispersijai (), ty nėra grupės viduje skirtumo. Tai reiškia, kad grupavimo ypatybė visiškai nulemia gautos tiriamos savybės variaciją.
Kuo koreliacinio ryšio reikšmė artimesnė vienetui, tuo artimesnis, artimesnis funkcinei priklausomybei, ryšys tarp požymių.
Kokybiniam ženklų ryšio glaudumo įvertinimui naudojami Chaddock santykiai.

Pavyzdyje , o tai rodo glaudų ryšį tarp darbuotojų produktyvumo ir jų kvalifikacijos.

Sklaidaatsitiktinis kintamasis- duotosios sklaidos matas atsitiktinis kintamasis, tai yra, ji nukrypimai iš matematinio lūkesčio. Statistikoje žymėjimas (sigma kvadratas) dažnai naudojamas dispersijai žymėti. Dispersijos kvadratinė šaknis vadinama standartinis nuokrypis arba standartinis užtepimas. Standartinis nuokrypis matuojamas tais pačiais vienetais kaip ir pats atsitiktinis dydis, o dispersija – to vieneto kvadratais.

Nors labai patogu naudoti tik vieną reikšmę (pvz., vidurkį arba režimą ir medianą), norint įvertinti visą imtį, šis metodas gali lengvai padaryti klaidingas išvadas. Tokios situacijos priežastis slypi ne pačioje vertėje, o tame, kad viena reikšmė niekaip neatspindi duomenų reikšmių sklaidos.

Pavyzdžiui, pavyzdyje:

vidurkis yra 5.

Tačiau pačiame imtyje nėra elemento, kurio vertė būtų 5. Gali reikėti žinoti, kiek kiekvienas imties elementas yra arti jo vidutinės vertės. Arba, kitaip tariant, reikia žinoti reikšmių dispersiją. Žinodami, kiek pasikeitė duomenys, galite geriau interpretuoti reiškia, mediana ir mada. Mėginių verčių kitimo laipsnis nustatomas apskaičiuojant jų dispersiją ir standartinį nuokrypį.



Dispersija ir dispersijos kvadratinė šaknis, vadinama standartiniu nuokrypiu, apibūdina vidutinį nuokrypį nuo imties vidurkio. Tarp šių dviejų dydžių svarbiausias yra standartinis nuokrypis. Šią reikšmę galima pavaizduoti kaip vidutinį atstumą, kuriuo elementai yra nuo vidurinio imties elemento.

Sklaidą sunku prasmingai interpretuoti. Tačiau šios vertės kvadratinė šaknis yra standartinis nuokrypis ir puikiai tinka interpretacijai.

Standartinis nuokrypis apskaičiuojamas pirmiausia nustatant dispersiją, o po to apskaičiuojant dispersijos kvadratinę šaknį.

Pavyzdžiui, paveikslėlyje parodytam duomenų masyvui bus gautos šios reikšmės:

1 paveikslas

Čia skirtumų kvadratu vidurkis yra 717,43. Norint gauti standartinį nuokrypį, belieka paimti šio skaičiaus kvadratinę šaknį.

Rezultatas bus maždaug 26,78.

Reikia atsiminti, kad standartinis nuokrypis interpretuojamas kaip vidutinis atstumas, kuriuo elementai yra nuo imties vidurkio.

Standartinis nuokrypis parodo, kaip gerai vidurkis apibūdina visą imtį.

Tarkime, kad esate kompiuterio surinkimo skyriaus vadovas. Ketvirčio ataskaitoje teigiama, kad praėjusį ketvirtį buvo pagaminta 2500 kompiuterių. Ar tai blogai ar gerai? Prašėte (arba ataskaitoje jau yra šis stulpelis), kad ataskaitoje būtų rodomas standartinis šių duomenų nuokrypis. Standartinio nuokrypio skaičius, pavyzdžiui, yra 2000. Jums, kaip skyriaus vedėjui, tampa aišku, kad gamybos liniją reikia geriau kontroliuoti (per dideli surenkamų kompiuterių skaičiaus nuokrypiai).

Prisiminkite, kad kai standartinis nuokrypis yra didelis, duomenys yra plačiai išsibarstę aplink vidurkį, o kai standartinis nuokrypis mažas, jie telkiasi arti vidurkio.

Keturios statistinės funkcijos VAR(), VAR(), STDEV() ir STDEV() skirtos skaičių dispersijai ir standartiniam nuokrypiui apskaičiuoti langelių diapazone. Prieš apskaičiuodami duomenų rinkinio dispersiją ir standartinį nuokrypį, turite nustatyti, ar duomenys atspindi populiaciją, ar jos imtį. Jei imtis yra iš bendrosios visumos, reikia naudoti VARP() ir STDEV() funkcijas, o bendrosios visumos atveju – VARP() ir STDEV() funkcijas:

Gyventojų skaičius Funkcija

VARP()

STDLONG ()
Pavyzdys

VARI()

STDEV()

Dispersija (taip pat ir standartinis nuokrypis), kaip pažymėjome, rodo, kokiu mastu į duomenų rinkinį įtrauktos reikšmės yra išsklaidytos aplink aritmetinį vidurkį.

Maža dispersijos arba standartinio nuokrypio reikšmė rodo, kad visi duomenys yra sutelkti aplink aritmetinį vidurkį, o didelė šių reikšmių reikšmė rodo, kad duomenys yra išsibarstę po platų verčių diapazoną.

Dispersiją gana sunku prasmingai interpretuoti (ką reiškia maža reikšmė, didelė reikšmė?). Spektaklis 3 užduotys leis vizualiai, grafike, parodyti duomenų rinkinio dispersijos reikšmę.

Užduotys

· 1 pratimas.

· 2.1. Pateikite sąvokas: dispersija ir standartinis nuokrypis; simbolinis jų žymėjimas apdorojant statistinius duomenis.

· 2.2. Sudarykite darbalapį pagal 1 paveikslą ir atlikite reikiamus skaičiavimus.

· 2.3. Pateikite pagrindines skaičiavimuose naudojamas formules

· 2.4. Paaiškinkite visas žymes ( , , )

· 2.5. Paaiškinkite dispersijos ir standartinio nuokrypio sąvokos praktinę reikšmę.

2 užduotis.

1.1. Pateikite sąvokas: bendroji visuma ir imtis; matematinis lūkestis ir jų simbolinio žymėjimo aritmetinis vidurkis apdorojant statistinius duomenis.

1.2. Pagal 2 paveikslą sudarykite darbalapį ir atlikite skaičiavimus.

1.3. Pateikite pagrindines skaičiavimuose naudotas formules (bendrai visumai ir imčiai).

2 pav

1.4. Paaiškinkite, kodėl pavyzdžiuose kaip 46,43 ir 48,78 galima gauti tokias aritmetinių vidurkių reikšmes (žr. failo priedą). Daryti išvadas.

3 užduotis.

Yra du pavyzdžiai su skirtingu duomenų rinkiniu, tačiau jų vidurkis bus toks pat:

3 pav

3.1. Sudarykite darbalapį pagal 3 paveikslą ir atlikite reikiamus skaičiavimus.

3.2. Pateikite pagrindines skaičiavimo formules.

3.3. Sudarykite grafikus pagal 4, 5 paveikslus.

3.4. Paaiškinkite susidariusias priklausomybes.

3.5. Atlikite panašius šių dviejų pavyzdžių skaičiavimus.

Pradinis pavyzdys 11119999

Pasirinkite antrojo imties reikšmes taip, kad antrojo imties aritmetinis vidurkis būtų toks pat, pavyzdžiui:

Antrojo pavyzdžio vertes pasirinkite patys. Išdėstykite skaičiavimus ir braižykite kaip 3, 4, 5 paveikslus. Parodykite pagrindines skaičiavimuose naudotas formules.

Padarykite atitinkamas išvadas.

Visos užduotys turi būti pateiktos ataskaitos forma su visais reikalingais skaičiais, grafikais, formulėmis ir trumpais paaiškinimais.

Pastaba: grafikų konstrukcija turi būti paaiškinta skaičiais ir trumpais paaiškinimais.

Dispersija yra dispersijos matas, apibūdinantis santykinį nuokrypį tarp duomenų verčių ir vidurkio. Tai dažniausiai statistikoje naudojamas sklaidos matas, apskaičiuojamas sumuojant, padalijus kvadratą kiekvienos duomenų reikšmės nuokrypį nuo vidurkio. Dispersijos apskaičiavimo formulė parodyta žemiau:

s 2 - imties dispersija;

x cf yra vidutinė imties reikšmė;

n imties dydis (duomenų reikšmių skaičius),

(x i – x cf) yra kiekvienos duomenų rinkinio reikšmės nuokrypis nuo vidutinės vertės.

Norėdami geriau suprasti formulę, pažvelkime į pavyzdį. Nelabai mėgstu gaminti, todėl tai darau retai. Tačiau, kad nemirčiau iš bado, karts nuo karto tenka užsukti prie viryklės įgyvendinti planą prisotinti organizmą baltymais, riebalais ir angliavandeniais. Toliau pateiktame duomenų rinkinyje parodyta, kiek kartų Renatas gamina maistą per mėnesį:

Pirmas žingsnis skaičiuojant dispersiją yra nustatyti imties vidurkį, kuris mūsų pavyzdyje yra 7,8 karto per mėnesį. Likusius skaičiavimus galima palengvinti šios lentelės pagalba.

Paskutinis dispersijos skaičiavimo etapas atrodo taip:

Tiems, kurie mėgsta visus skaičiavimus atlikti vienu kartu, lygtis atrodys taip:

Neapdoroto skaičiavimo metodo naudojimas (virimo pavyzdys)

Yra efektyvesnis dispersijos apskaičiavimo būdas, žinomas kaip „neapdoroto skaičiavimo“ metodas. Nors iš pirmo žvilgsnio lygtis gali pasirodyti gana sudėtinga, iš tikrųjų ji nėra tokia baisi. Galite tai patikrinti ir nuspręsti, kuris metodas jums labiausiai patinka.

yra kiekvienos duomenų vertės suma po kvadratūros,

yra visų duomenų reikšmių sumos kvadratas.

Neprarask proto dabar. Padėkime visa tai lentelės pavidalu, tada pamatysite, kad čia atlikta mažiau skaičiavimų nei ankstesniame pavyzdyje.

Kaip matote, rezultatas yra toks pat, kaip ir naudojant ankstesnį metodą. Šio metodo pranašumai išryškėja didėjant imties dydžiui (n).

Dispersijos skaičiavimas programoje Excel

Kaip tikriausiai jau atspėjote, „Excel“ turi formulę, leidžiančią apskaičiuoti dispersiją. Be to, pradedant Excel 2010, galite rasti 4 dispersijos formulės variantus:

1) VAR.V – pateikia imties dispersiją. Būlio reikšmės ir tekstas nepaisomi.

2) VAR.G – pateikia populiacijos dispersiją. Būlio reikšmės ir tekstas nepaisomi.

3) VASP – pateikia imties dispersiją, atsižvelgiant į logines ir tekstines reikšmes.

4) VARP – Grąžina visumos dispersiją, atsižvelgiant į logines ir tekstines reikšmes.

Pirmiausia pažvelkime į skirtumą tarp imties ir populiacijos. Aprašomosios statistikos tikslas – apibendrinti arba atvaizduoti duomenis taip, kad būtų galima greitai susidaryti bendrą vaizdą, taip sakant, apžvalgą. Statistinės išvados leidžia daryti išvadas apie populiaciją remiantis šios populiacijos duomenų imtimi. Visuomenė atspindi visus galimus rezultatus ar matavimus, kurie mus domina. Imtis yra populiacijos poaibis.

Pavyzdžiui, mus domina vieno iš Rusijos universitetų studentų grupės visuma ir reikia nustatyti vidutinį grupės balą. Galime apskaičiuoti vidutinius studentų rezultatus, o tada gautas skaičius bus parametras, nes į mūsų skaičiavimus dalyvaus visa populiacija. Tačiau jei norime apskaičiuoti visų mūsų šalies studentų GPA, tai ši grupė bus mūsų pavyzdys.

Imties ir visumos dispersijos apskaičiavimo formulės skirtumas yra vardiklyje. Kur imčiai jis bus lygus (n-1), o bendrajai visumai tik n.

Dabar panagrinėkime dispersijos su galūnėmis skaičiavimo funkcijas BET, kurio aprašyme sakoma, kad skaičiuojant atsižvelgiama į tekstines ir logines reikšmes. Šiuo atveju, apskaičiuodama konkretaus duomenų rinkinio, kuriame yra neskaitinių reikšmių, dispersiją, „Excel“ tekstą ir klaidingas logines vertes interpretuos kaip 0, o tikrąsias logines vertes – kaip 1.

Taigi, jei turite duomenų masyvą, nebus sunku apskaičiuoti jo dispersiją naudojant vieną iš aukščiau išvardytų „Excel“ funkcijų.