20.09.2019

Trovare un esempio di varianza. Dispersione di una variabile casuale. Esempio di deviazione standard


Dispersionevariabile casualeè la misura della diffusione del dato variabile casuale, cioè lei deviazioni dall'aspettativa matematica. In statistica, la notazione (sigma al quadrato) è spesso usata per denotare la varianza. Viene chiamata la radice quadrata della varianza uguale a deviazione standard o diffusione standard. La deviazione standard viene misurata nelle stesse unità della variabile casuale stessa e la varianza viene misurata nei quadrati di questa unità.

Sebbene sia molto conveniente utilizzare un solo valore (come la media o la moda e la mediana) per stimare l'intero campione, questo approccio può facilmente portare a imprecisioni. La ragione di questa situazione non risiede nella quantità in sé, ma nel fatto che una quantità non riflette in alcun modo la diffusione dei valori dei dati.

Ad esempio, nel campione:

la media è 5.

Tuttavia, il campione stesso non ha un singolo elemento con un valore di 5. Potrebbe essere necessario conoscere il grado in cui ogni elemento del campione è vicino alla sua media. O, in altre parole, è necessario conoscere la varianza dei valori. Conoscendo la misura in cui i dati sono cambiati, puoi interpretare meglio significare, mediano e la moda... La velocità di variazione dei valori campione è determinata calcolando la loro varianza e deviazione standard.



La varianza e la radice quadrata della varianza, chiamata deviazione standard, caratterizzano la deviazione media dalla media campionaria. Tra queste due quantità, la più importante è deviazione standard... Questo valore può essere considerato come la distanza media degli articoli dall'elemento centrale nel campione.

La varianza è difficile da interpretare in modo significativo. Tuttavia, la radice quadrata di questo valore è la deviazione standard ed è ben interpretata.

La deviazione standard viene calcolata determinando prima la varianza e quindi calcolando la radice quadrata della varianza.

Ad esempio, per l'array di dati mostrato in figura, si otterranno i seguenti valori:

Immagine 1

Qui la media dei quadrati delle differenze è 717,43. Per ottenere la deviazione standard, non resta che prendere la radice quadrata di quel numero.

Il risultato è di circa 26.78.

Si ricorda che la deviazione standard è interpretata come la distanza media degli elementi dalla media campionaria.

La deviazione standard misura quanto bene la media descrive l'intero campione.

Diciamo che sei il capo del reparto produzione per l'assemblaggio di un PC. Il rapporto trimestrale affermava di avere 2.500 PC nell'ultimo trimestre. Questo è un bene o un male? Hai chiesto (o il rapporto contiene già questa colonna) nel rapporto di visualizzare la deviazione standard per questi dati. La cifra di deviazione standard, ad esempio, è 2000. A te, come capo del dipartimento, diventa chiaro che la linea di produzione richiede una gestione migliore (scostamenti troppo grandi nel numero di PC assemblati).

Ricordiamo che quando la deviazione standard è grande, i dati sono ampiamente sparsi sulla media e quando la deviazione standard è piccola, sono raggruppati vicino alla media.

Le quattro funzioni statistiche VAR(), VAR(), STDEV() e STDEV() sono progettate per calcolare la varianza e la deviazione standard dei numeri in un intervallo di celle. Prima di calcolare la varianza e la deviazione standard di un set di dati, è necessario determinare se i dati rappresentano una popolazione o un campione di una popolazione. Nel caso di un campione della popolazione generale, dovrebbero essere utilizzate le funzioni VAR() e STDEV(), e nel caso della popolazione generale, dovrebbero essere utilizzate le funzioni VAR() e STDEVP():

Popolazione generale Funzione

VARP ()

STANDOLLON ()
Campione

DISP ()

DEVST ()

La varianza (così come la deviazione standard), come abbiamo notato, indica la misura in cui i valori inclusi nel set di dati sono sparsi attorno alla media aritmetica.

Un piccolo valore di varianza o deviazione standard indica che tutti i dati sono centrati attorno alla media aritmetica, mentre un valore grande di questi valori indica che i dati sono sparsi su un ampio intervallo di valori.

La varianza è piuttosto difficile da interpretare in modo significativo (cosa significa un valore piccolo, un valore grande?). Prestazione Compiti 3 consente di mostrare visivamente, su un grafico, il significato della varianza per un set di dati.

Compiti

· Esercizio 1.

· 2.1. Fornire concetti: varianza e deviazione standard; la loro designazione simbolica nell'elaborazione di dati statistici.

· 2.2. Redigere un foglio di lavoro secondo la Figura 1 ed eseguire i calcoli necessari.

· 2.3. Fornire le formule di base utilizzate nei calcoli

· 2.4. Spiega tutte le notazioni (,,)

· 2.5. Spiegare il significato pratico di varianza e deviazione standard.

Compito 2.

1.1. Fornire concetti: popolazione generale e campione; aspettativa matematica e media aritmetica della loro designazione simbolica nell'elaborazione di dati statistici.

1.2. In conformità con la Figura 2, redigere un foglio di lavoro ed eseguire calcoli.

1.3. Fornire le formule di base utilizzate nei calcoli (per la popolazione generale e il campione).

Immagine 2

1.4. Spiega perché è possibile ottenere valori medi aritmetici in campioni come 46.43 e 48.78 (vedi file Appendice). Trai conclusioni.

Compito 3.

Esistono due campioni con set di dati diversi, ma la media per loro sarà la stessa:

Figura 3

3.1. Redigere un foglio di lavoro secondo la Figura 3 ed eseguire i calcoli necessari.

3.2. Fornisci le formule di calcolo di base.

3.3. Costruisci grafici secondo le Figure 4, 5.

3.4. Spiega le dipendenze risultanti.

3.5. Eseguire calcoli simili per questi due campioni.

Campione originale 11119999

Seleziona i valori del secondo campione in modo che la media aritmetica per il secondo campione sia la stessa, ad esempio:

Scegli tu stesso i valori per il secondo campione. Progetta calcoli e grafici come le Figure 3, 4, 5. Mostra le formule di base che sono state utilizzate nei calcoli.

Trai le conclusioni appropriate.

Tutti i compiti dovrebbero essere redatti sotto forma di un rapporto con tutte le immagini, i grafici, le formule e le brevi spiegazioni necessarie.

Nota: la costruzione dei grafici deve essere spiegata con immagini e brevi spiegazioni.

La teoria della probabilità è una branca speciale della matematica che viene studiata solo dagli studenti universitari. Ti piacciono i calcoli e le formule? Non hai paura della prospettiva di conoscere la distribuzione normale, l'entropia dell'insieme, l'aspettativa matematica e la varianza di una variabile casuale discreta? Allora questo argomento sarà molto interessante per te. Facciamo conoscenza con alcuni dei concetti base più importanti in questo ramo della scienza.

Ricordiamo le basi

Anche se ricordi i concetti più semplici della teoria della probabilità, non trascurare i primi paragrafi dell'articolo. Il fatto è che senza una chiara comprensione delle basi, non sarai in grado di lavorare con le formule discusse di seguito.

Quindi, accade qualche evento casuale, qualche esperimento. Come risultato delle azioni eseguite, possiamo ottenere diversi risultati: alcuni sono più comuni, altri sono meno comuni. La probabilità di un evento è il rapporto tra il numero di risultati effettivamente ottenuti di un tipo e il numero totale di risultati possibili. Solo conoscendo la definizione classica di questo concetto, puoi iniziare a studiare l'aspettativa matematica e la varianza di variabili aleatorie continue.

Media

A scuola, alle lezioni di matematica, hai iniziato a lavorare con la media aritmetica. Questo concetto è ampiamente utilizzato nella teoria della probabilità, e quindi non può essere ignorato. La cosa principale per noi al momento è che lo incontreremo nelle formule per l'aspettativa matematica e la varianza di una variabile casuale.

Abbiamo una sequenza di numeri e vogliamo trovare la media aritmetica. Tutto ciò che ci viene richiesto è sommare tutto ciò che è disponibile e dividerlo per il numero di elementi nella sequenza. Supponiamo di avere numeri da 1 a 9. La somma degli elementi sarà 45 e divideremo questo valore per 9. Risposta: - 5.

Dispersione

In termini scientifici, la varianza è il quadrato medio delle deviazioni dei valori ottenuti di una caratteristica dalla media aritmetica. Uno è indicato da una lettera latina maiuscola D. Di cosa hai bisogno per calcolarlo? Per ogni elemento della sequenza, calcola la differenza tra il numero disponibile e la media aritmetica e quadrala. Ci saranno esattamente tanti valori quanti possono essere i risultati per l'evento che stiamo considerando. Successivamente, riassumiamo tutto ciò che abbiamo ricevuto e dividiamo per il numero di elementi nella sequenza. Se abbiamo cinque possibili risultati, allora dividiamo per cinque.

La varianza ha anche proprietà che devono essere ricordate per essere applicate durante la risoluzione dei problemi. Ad esempio, quando la variabile casuale viene aumentata di X volte, la varianza viene aumentata di X volte al quadrato (cioè, X * X). Non è mai inferiore a zero e non dipende dallo spostamento dei valori di un valore uguale verso l'alto o verso il basso. Inoltre, per i test indipendenti, la varianza della somma è uguale alla somma delle varianze.

Ora dobbiamo assolutamente considerare esempi di varianza di una variabile casuale discreta e di aspettativa matematica.

Diciamo che abbiamo eseguito 21 esperimenti e ottenuto 7 risultati diversi. Abbiamo osservato ciascuno di essi, rispettivamente, 1,2,2,3,4,4 e 5 volte. Qual è la varianza?

Per prima cosa calcoliamo la media aritmetica: la somma degli elementi è, ovviamente, uguale a 21. Dividilo per 7, ottenendo 3. Ora, da ogni numero nella sequenza originale, sottrai 3, quadra ogni valore e aggiungi il risultati insieme. Risulterà 12. Ora ci resta da dividere il numero per il numero di elementi e, sembrerebbe, il gioco è fatto. Ma c'è un problema! Discutiamolo.

Dipendenza dal numero di esperimenti

Si scopre che quando si calcola la varianza, il denominatore può essere uno di due numeri: N o N-1. Qui N è il numero di esperimenti eseguiti o il numero di elementi nella sequenza (che sono essenzialmente gli stessi). Da cosa dipende?

Se il numero di test è misurato in centinaia, allora dovremmo inserire il denominatore N. Se in unità, allora N-1. Gli scienziati hanno deciso di disegnare il confine in modo abbastanza simbolico: oggi corre al numero 30. Se abbiamo condotto meno di 30 esperimenti, divideremo la somma per N-1 e, se di più, per N.

Compito

Torniamo al nostro esempio di risoluzione del problema della varianza e dell'aspettativa. Abbiamo ottenuto un numero intermedio 12, che doveva essere diviso per N o N-1. Poiché abbiamo effettuato 21 esperimenti, che sono meno di 30, sceglieremo la seconda opzione. Quindi la risposta è: la varianza è 12/2 = 2.

Valore atteso

Passiamo al secondo concetto, che dobbiamo assolutamente considerare in questo articolo. Il valore atteso è la somma di tutti i possibili risultati moltiplicata per le probabilità corrispondenti. È importante capire che il valore ottenuto, così come il risultato del calcolo della varianza, viene ottenuto solo una volta per l'intero problema, indipendentemente dal numero di risultati considerati in esso.

La formula matematica dell'aspettativa è abbastanza semplice: prendiamo il risultato, moltiplichiamo per la sua probabilità, aggiungiamo lo stesso per il secondo, terzo risultato, ecc. Tutto ciò che riguarda questo concetto è facile da calcolare. Ad esempio, la somma dell'aspettativa è uguale all'aspettativa della somma. Lo stesso vale per un'opera. Non tutti i valori nella teoria della probabilità consentono di eseguire operazioni così semplici con se stessi. Prendiamo un problema e calcoliamo il significato dei due concetti che abbiamo studiato contemporaneamente. Inoltre, siamo stati distratti dalla teoria: è ora di esercitarsi.

Un altro esempio

Abbiamo eseguito 50 prove e ottenuto 10 tipi di risultati - numeri da 0 a 9 - che si verificano in percentuali diverse. Questi sono rispettivamente: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Ricordiamo che per ottenere le probabilità, è necessario dividere i valori in percentuale per 100. Quindi, otteniamo 0,02; 0.1, ecc. Presentiamo un esempio di risoluzione del problema per la varianza di una variabile casuale e di un'aspettativa matematica.

Calcoliamo la media aritmetica utilizzando la formula che ricordiamo dalle elementari: 50/10 = 5.

Ora convertiamo le probabilità nel numero di risultati "in pezzi" per facilitare il conteggio. Otteniamo 1, 5, 2, 7, 1, 9, 3, 8, 5 e 9. Sottrai la media aritmetica da ogni valore ottenuto, dopodiché quadra ciascuno dei risultati ottenuti. Guarda come farlo usando il primo elemento come esempio: 1 - 5 = (-4). Successivo: (-4) * (-4) = 16. Per il resto dei valori, eseguire queste operazioni da soli. Se hai fatto tutto bene, dopo aver aggiunto tutto ottieni 90.

Continuiamo a calcolare la varianza e la media dividendo 90 per N. Perché scegliamo N e non N-1? Esatto, perché il numero di esperimenti eseguiti supera 30. Quindi: 90/10 = 9. Abbiamo ottenuto la varianza. Se ottieni un numero diverso, non disperare. Molto probabilmente, hai commesso un errore comune nei calcoli. Ricontrolla ciò che hai scritto e di sicuro tutto andrà a posto.

Infine, ricordiamo la formula per l'aspettativa matematica. Non daremo tutti i calcoli, scriveremo solo una risposta con la quale potrete verificare dopo aver completato tutte le procedure richieste. L'aspettativa sarà 5.48. Ricordiamo solo come eseguire le operazioni, usando l'esempio dei primi elementi: 0 * 0.02 + 1 * 0.1 ... e così via. Come puoi vedere, stiamo semplicemente moltiplicando il valore del risultato per la sua probabilità.

Deviazione

Un altro concetto strettamente correlato alla varianza e all'aspettativa matematica è la deviazione standard. È indicato o dalle lettere latine sd, o dal greco minuscolo "sigma". Questo concetto mostra quanto, in media, i valori si discostino dalla caratteristica centrale. Per trovarne il valore, devi calcolare la radice quadrata della varianza.

Se si traccia la distribuzione normale e si desidera visualizzare la deviazione standard direttamente su di essa, è possibile farlo in diversi passaggi. Prendi metà dell'immagine a sinistra oa destra della modalità (valore centrale), disegna una perpendicolare all'asse orizzontale in modo che le aree delle forme risultanti siano uguali. Il valore del segmento compreso tra il centro della distribuzione e la proiezione risultante sull'asse orizzontale rappresenterà la deviazione standard.

Software

Come si può vedere dalle descrizioni delle formule e dagli esempi presentati, il calcolo della varianza e dell'aspettativa matematica non è la procedura più semplice da un punto di vista aritmetico. Per non perdere tempo, ha senso utilizzare il programma utilizzato nell'istruzione superiore: si chiama "R". Ha funzioni che ti consentono di calcolare i valori per molti concetti dalla statistica e dalla teoria della probabilità.

Ad esempio, stai definendo un vettore di valori. Questo viene fatto come segue: vettore<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Infine

Dispersione e aspettativa matematica - senza le quali è difficile calcolare nulla in futuro. Nel corso principale delle lezioni nelle università, sono considerati già nei primi mesi di studio della materia. È a causa della mancanza di comprensione di questi semplici concetti e dell'incapacità di calcolarli che molti studenti iniziano immediatamente a rimanere indietro nel programma e in seguito ricevono scarsi voti nella sessione, il che li priva di borse di studio.

Esercitati per almeno una settimana, mezz'ora al giorno, risolvendo compiti simili a quelli presentati in questo articolo. Quindi su qualsiasi test sulla teoria della probabilità, affronterai esempi senza suggerimenti e cheat sheet estranei.

Dispersione io Dispersione (dal latino dispersio - dispersione)

nella statistica matematica e nella teoria della probabilità, la misura più comune della dispersione, cioè la deviazione dalla media. Nella comprensione statistica di D.

è la media aritmetica delle deviazioni al quadrato dei valori x io dalla loro media aritmetica

Nella teoria della probabilità, una variabile casuale Xè chiamata aspettativa matematica E ( X - m x) Deviazione di 2 quadrati X dalla sua aspettativa matematica m x= E ( X). D. variabile casuale Xè indicato con D ( X) o tramite σ 2X... La radice quadrata di D. (cioè σ, se D. è σ 2) è chiamata deviazione standard (vedi Deviazione quadrata).

Per una variabile casuale X con una distribuzione di probabilità continua, caratterizzata da una densità di probabilità (vedi Densità di probabilità) R(X), D. è calcolato dalla formula

Nella teoria delle probabilità, il seguente teorema è di grande importanza: A X dalla sua aspettativa matematica.

II Dispersione

La presenza di onde D. porta alla distorsione della forma dei segnali quando si propagano nel mezzo. Ciò è dovuto al fatto che onde armoniche di diverse frequenze, in cui il segnale può essere scomposto, si propagano a velocità diverse (per maggiori dettagli, vedere Waves, Group Velocity). D. la luce, quando si propaga in un prisma trasparente, porta alla decomposizione della luce bianca in uno spettro (vedi Dispersione della luce).


Grande enciclopedia sovietica. - M.: Enciclopedia sovietica. 1969-1978 .

Sinonimi:

Guarda cos'è "Dispersion" in altri dizionari:

    dispersione- Disperdere qualcosa. In matematica, la varianza definisce la deviazione dei valori dalla media. La dispersione della luce bianca porta alla sua decomposizione in componenti. La dispersione del suono è la ragione della sua diffusione. Dispersione dei dati archiviati attraverso ... ... Guida tecnica del traduttore

    Enciclopedia moderna

    - (varianza) Una misura della dispersione dei dati. La varianza di un insieme di N membri si trova sommando i quadrati delle loro deviazioni dalla media e dividendo per N. Pertanto, se i membri sono xi per i = 1, 2, ..., N, e la loro media è m , la varianza... ... Dizionario economico

    Dispersione- (dal latino dispersio scattering) onde, la dipendenza della velocità di propagazione delle onde in una sostanza dalla lunghezza d'onda (frequenza). La dispersione è determinata dalle proprietà fisiche del mezzo in cui si propagano le onde. Ad esempio, nel vuoto ... ... Dizionario enciclopedico illustrato

    - (dal latino dispersio dispersion) in statistica matematica e teoria della probabilità, la misura della dispersione (deviazione dalla media). In statistica, la varianza è la media aritmetica delle deviazioni al quadrato dei valori osservati (x1, x2, ..., xn) di un casuale ... ... Grande dizionario enciclopedico

    Nella teoria della probabilità, la misura più comune della deviazione dalla media (misura di scattering). In inglese: Dispersione Sinonimi: Dispersione statistica Sinonimi inglesi: Dispersione statistica Vedi anche: Esempi finanziari ... ... Vocabolario finanziario

    - [lat. dispersus sparso, sparso] 1) dispersione; 2) chimico, fisico. frammentazione di una sostanza in particelle molto piccole. D. la luce è la decomposizione della luce bianca utilizzando un prisma in uno spettro; 3) stuoia. deviazione dalla media. Dizionario di parole straniere. Komlev NG, ... ... Dizionario di parole straniere della lingua russa

    dispersione- (varianza) indicatore della diffusione dei dati, corrispondente al quadrato medio della deviazione di questi dati dalla media aritmetica. Uguale al quadrato della deviazione standard. Dizionario dello Psicologo Pratico. M.: AST, Vendemmia. S. Yu. Golovin. 1998... Grande enciclopedia psicologica

    Scattering, scattering Dizionario dei sinonimi russi. dispersione sostantivo, numero di sinonimi: 6 nanodispersion (1) ... Dizionario dei sinonimi

    Dispersione- caratteristica della dispersione dei valori di una variabile casuale, misurata dal quadrato delle loro deviazioni dalla media (indicata con d2). Distingue tra teorico (continuo o discreto) ed empirico (anche continuo e ... Dizionario di economia e matematica

    Dispersione- * dispersione * dispersione 1. Scattering; dispersione; variazione (vedi). 2. Un concetto probabilistico teorico che caratterizza la misura della deviazione di una variabile casuale dalla sua aspettativa matematica. Nella pratica biometrica, la varianza campionaria s2 ... Genetica. dizionario enciclopedico

Libri

  • Dispersione anomala in larghe bande di assorbimento, D.S. Natale. Riprodotto nell'ortografia dell'autore originale dell'edizione del 1934 (Izvestia della casa editrice dell'Accademia delle scienze dell'URSS). V…

Se la popolazione è divisa in gruppi in base all'attributo studiato, è possibile calcolare i seguenti tipi di dispersione per questa popolazione: generale, gruppo (intragruppo), media dal gruppo (media all'interno del gruppo), intergruppo.

Inizialmente, calcola il coefficiente di determinazione, che mostra quanto della variazione totale del tratto studiato sia la variazione intergruppo, cioè a causa di un attributo di raggruppamento:

Il rapporto di correlazione empirica caratterizza la tenuta della connessione tra il raggruppamento (fattore) e quelli effettivi.

Il rapporto di correlazione empirica può assumere valori da 0 a 1.

Per valutare la tenuta della relazione in base all'indicatore del rapporto di correlazione empirica, è possibile utilizzare i rapporti di Chaddock:

Esempio 4. Esistono i seguenti dati sull'esecuzione del lavoro in base alla progettazione e alle organizzazioni di rilevamento di varie forme di proprietà:

Definire:

1) varianza totale;

2) varianze di gruppo;

3) la media degli scostamenti di gruppo;

4) varianza intergruppo;

5) varianza totale basata sulla regola dell'addizione della varianza;


6) il coefficiente di determinazione e il rapporto di correlazione empirica.

Trai conclusioni.

Soluzione:

1. Determiniamo il volume medio di lavoro svolto da imprese di due forme di proprietà:

Calcoliamo la varianza totale:

2. Definiamo il gruppo significa:

milioni di rubli;

milioni di rubli

Variazioni di gruppo:

;

3. Calcoliamo la media delle varianze di gruppo:

4. Definiamo la varianza intergruppo:

5. Calcoliamo la varianza totale in base alla regola di addizione della varianza:

6. Definiamo il coefficiente di determinazione:

.

Pertanto, la quantità di lavoro svolto dalle organizzazioni di progettazione e indagine del 22% dipende dalla forma di proprietà delle imprese.

Il rapporto di correlazione empirica è calcolato dalla formula

.

Il valore dell'indicatore calcolato indica che la dipendenza del volume di lavoro dalla forma di proprietà dell'impresa non è grande.

Esempio 5. A seguito di un'indagine sulla disciplina tecnologica dei siti produttivi, sono stati ottenuti i seguenti dati:

Determinare il coefficiente di determinazione

La varianza di una variabile casuale è una misura della diffusione dei valori di questa quantità. Bassa varianza significa che i valori sono raggruppati uno vicino all'altro. Una grande varianza indica una forte dispersione dei valori. Il concetto di varianza di una variabile casuale viene utilizzato in statistica. Ad esempio, se si confronta la varianza dei valori di due variabili (come le osservazioni di pazienti maschi e femmine), è possibile verificare la significatività di una variabile. La varianza viene utilizzata anche durante la creazione di modelli statistici, poiché una varianza bassa può indicare che si stanno superando i valori.

Passi

Calcolo della varianza del campione

  1. Annotare i valori di esempio. Nella maggior parte dei casi, gli statistici hanno a disposizione solo campioni di popolazioni specifiche. Ad esempio, di norma, gli statistici non analizzano i costi di mantenimento dell'aggregato di tutte le auto in Russia: analizzano un campione casuale di diverse migliaia di auto. Tale campione aiuterà a determinare il costo medio di un'auto, ma, molto probabilmente, il valore risultante sarà lontano da quello reale.

    • Ad esempio, analizziamo il numero di panini venduti in un bar in 6 giorni, presi in ordine casuale. Il campione si presenta così: 17, 15, 23, 7, 9, 13. Questo è un campione, non una popolazione, perché non abbiamo dati sui panini venduti per ogni giorno di apertura del bar.
    • Se ti viene fornita una popolazione anziché un campione di valori, vai alla sezione successiva.
  2. Annotare la formula per calcolare la varianza del campione. La dispersione è una misura della diffusione dei valori di una certa quantità. Più il valore della varianza è vicino a zero, più vicini sono raggruppati i valori. Quando si lavora con un campione di valori, utilizzare la seguente formula per calcolare la varianza:

    • s 2 (\ displaystyle s ^ (2)) = ∑[(x io (\ stile di visualizzazione x_ (i))- X) 2 (\ stile di visualizzazione ^ (2))] / (n - 1)
    • s 2 (\ displaystyle s ^ (2))È la varianza. La dispersione è misurata in unità quadrate.
    • x io (\ stile di visualizzazione x_ (i))- ogni valore nel campione.
    • x io (\ stile di visualizzazione x_ (i)) sottrarre x̅, quadrarlo e quindi aggiungere i risultati.
    • x̅ - media campionaria (media campionaria).
    • n è il numero di valori nel campione.
  3. Calcola la media del campione.È indicato come x̅. La media campionaria viene calcolata come una normale media aritmetica: sommare tutti i valori nel campione, quindi dividere il risultato per il numero di valori nel campione.

    • Nel nostro esempio, aggiungi i valori nel campione: 15 + 17 + 23 + 7 + 9 + 13 = 84
      Ora dividi il risultato per il numero di valori nel campione (nel nostro esempio ce ne sono 6): 84 ÷ 6 = 14.
      Media campionaria x̅ = 14.
    • La media campionaria è il valore centrale attorno al quale sono distribuiti i valori nel campione. Se i valori nel campione sono raggruppati attorno alla media campionaria, la varianza è piccola; in caso contrario, la varianza è ampia.
  4. Sottrarre la media campionaria da ogni valore nel campione. Ora calcola la differenza x io (\ stile di visualizzazione x_ (i))- x̅, dove x io (\ stile di visualizzazione x_ (i))- ogni valore nel campione. Ciascun risultato ottenuto indica il grado di deviazione di un determinato valore dalla media campionaria, ovvero quanto dista questo valore dalla media campionaria.

    • Nel nostro esempio:
      x 1 (\ displaystyle x_ (1))- x̅ = 17 - 14 = 3
      x 2 (\ displaystyle x_ (2))- x̅ = 15 - 14 = 1
      x 3 (\ displaystyle x_ (3))- x̅ = 23 - 14 = 9
      x 4 (\ displaystyle x_ (4))- x̅ = 7 - 14 = -7
      x 5 (\ displaystyle x_ (5))- x̅ = 9 - 14 = -5
      x 6 (\ displaystyle x_ (6))- x̅ = 13 - 14 = -1
    • La correttezza dei risultati ottenuti è facilmente verificabile, poiché la loro somma dovrebbe essere uguale a zero. Ciò è dovuto alla determinazione della media, poiché i valori negativi (distanze dalla media a valori inferiori) sono completamente compensati da valori positivi (distanze dalla media a valori maggiori).
  5. Come notato sopra, la somma delle differenze x io (\ stile di visualizzazione x_ (i))- x̅ deve essere uguale a zero. Ciò significa che la varianza media è sempre zero, il che non dà alcuna idea sulla diffusione dei valori di una certa quantità. Per risolvere questo problema, quadra ogni differenza x io (\ stile di visualizzazione x_ (i))- X. Ciò porterà al fatto che otterrai solo numeri positivi, che, una volta aggiunti, non daranno mai 0.

    • Nel nostro esempio:
      (x 1 (\ displaystyle x_ (1))- X) 2 = 3 2 = 9 (\ displaystyle ^ (2) = 3 ^ (2) = 9)
      (x 2 (\ displaystyle (x_ (2))- X) 2 = 1 2 = 1 (\ displaystyle ^ (2) = 1 ^ (2) = 1)
      9 2 = 81
      (-7) 2 = 49
      (-5) 2 = 25
      (-1) 2 = 1
    • Hai trovato la differenza al quadrato - x̅) 2 (\ stile di visualizzazione ^ (2)) per ogni valore del campione.
  6. Calcola la somma dei quadrati delle differenze. Cioè, trova la parte della formula scritta in questo modo: ∑ [( x io (\ stile di visualizzazione x_ (i))- X) 2 (\ stile di visualizzazione ^ (2))]. Qui il segno Σ indica la somma dei quadrati delle differenze per ogni valore x io (\ stile di visualizzazione x_ (i)) nel campione. Hai già trovato i quadrati delle differenze (x io (\ stile di visualizzazione (x_ (i))- X) 2 (\ stile di visualizzazione ^ (2)) per ogni valore x io (\ stile di visualizzazione x_ (i)) nel campione; ora aggiungi solo quei quadrati.

    • Nel nostro esempio: 9 + 1 + 81 + 49 + 25 + 1 = 166 .
  7. Dividi il risultato per n - 1, dove n è il numero di valori nel campione. Tempo fa, per calcolare la varianza di un campione, la statistica divideva semplicemente il risultato per n; in questo caso, otterrai la varianza media al quadrato, ideale per descrivere la varianza di un dato campione. Ma ricorda che qualsiasi campione è solo una piccola frazione della popolazione totale di valori. Se prendi un campione diverso e fai gli stessi calcoli, ottieni un risultato diverso. A quanto pare, la divisione per n - 1 (non solo per n) fornisce una stima più accurata della varianza della popolazione, che è ciò che ti interessa. La divisione per n - 1 è diventata comune, quindi è inclusa nella formula per il calcolo della varianza campionaria.

    • Nel nostro esempio, il campione include 6 valori, ovvero n = 6.
      Varianza campionaria = s 2 = 166 6 - 1 = (\ displaystyle s ^ (2) = (\ frac (166) (6-1)) =) 33,2
  8. La differenza tra varianza e deviazione standard. Si noti che nella formula è presente un esponente, quindi la varianza viene misurata in unità quadrate della quantità analizzata. A volte è abbastanza difficile operare con un tale valore; in questi casi viene utilizzata la deviazione standard, che è uguale alla radice quadrata della varianza. Ecco perché la varianza campionaria è indicata come s 2 (\ displaystyle s ^ (2)), e la deviazione standard del campione è come s (\ displaystyle s).

    • Nel nostro esempio, la deviazione standard campionaria è s = √33,2 = 5,76.

    Calcolo della varianza di una popolazione

    1. Analizza un insieme di valori. Il set include tutti i valori della quantità considerata. Ad esempio, se studi l'età dei residenti nella regione di Leningrado, l'aggregato include l'età di tutti i residenti di questa regione. Se stai lavorando con una popolazione, ti consigliamo di creare una tabella e di inserire i valori della popolazione in essa. Considera il seguente esempio:

      • In alcune stanze ci sono 6 acquari. Ogni acquario ha il seguente numero di pesci:
        x 1 = 5 (\ displaystyle x_ (1) = 5)
        x 2 = 5 (\ displaystyle x_ (2) = 5)
        x 3 = 8 (\ displaystyle x_ (3) = 8)
        x 4 = 12 (\ displaystyle x_ (4) = 12)
        x 5 = 15 (\ displaystyle x_ (5) = 15)
        x 6 = 18 (\ displaystyle x_ (6) = 18)
    2. Scrivi la formula per calcolare la varianza della popolazione. Poiché l'aggregato comprende tutti i valori di una certa quantità, la formula seguente consente di ottenere il valore esatto della varianza dell'aggregato. Per distinguere la varianza della popolazione dalla varianza del campione (il cui valore è solo una stima), gli statistici utilizzano diverse variabili:

      • σ 2 (\ stile di visualizzazione ^ (2)) = (∑(x io (\ stile di visualizzazione x_ (i)) - μ) 2 (\ stile di visualizzazione ^ (2))) / n
      • σ 2 (\ stile di visualizzazione ^ (2))- varianza della popolazione (letta come "sigma al quadrato"). La dispersione è misurata in unità quadrate.
      • x io (\ stile di visualizzazione x_ (i))- ogni valore in aggregato.
      • Σ è il segno della somma. Cioè, da ogni valore x io (\ stile di visualizzazione x_ (i)) sottrarre μ, quadrarlo e quindi sommare i risultati.
      • μ è la media della popolazione.
      • n è il numero di valori nella popolazione generale.
    3. Calcola la media della popolazione. Quando si lavora con la popolazione generale, il suo valore medio è indicato come μ (mu). La media della popolazione viene calcolata come una normale media aritmetica: sommare tutti i valori della popolazione, quindi dividere il risultato per il numero di valori della popolazione.

      • Tieni presente che le medie non sono sempre calcolate come media aritmetica.
      • Nel nostro esempio, la media della popolazione: μ = 5 + 5 + 8 + 12 + 15 + 18 6 (\ displaystyle (\ frac (5 + 5 + 8 + 12 + 15 + 18) (6))) = 10,5
    4. Sottrarre la media della popolazione da ogni valore della popolazione. Più il valore della differenza è vicino a zero, più il valore particolare è vicino alla media della popolazione. Trova la differenza tra ogni valore in una popolazione e la sua media e hai una prima idea della distribuzione dei valori.

      • Nel nostro esempio:
        x 1 (\ displaystyle x_ (1))- μ = 5 - 10,5 = -5,5
        x 2 (\ displaystyle x_ (2))- μ = 5 - 10,5 = -5,5
        x 3 (\ displaystyle x_ (3))- μ = 8 - 10,5 = -2,5
        x 4 (\ displaystyle x_ (4))- μ = 12 - 10,5 = 1,5
        x 5 (\ displaystyle x_ (5))- μ = 15 - 10,5 = 4,5
        x 6 (\ displaystyle x_ (6))- μ = 18 - 10,5 = 7,5
    5. Piazza ogni risultato che ottieni. I valori di differenza saranno sia positivi che negativi; se questi valori sono tracciati su una linea numerica, si troveranno a destra ea sinistra del valore medio della popolazione. Questo non va bene per calcolare la varianza, poiché i numeri positivi e negativi si annullano a vicenda. Quindi quadra ogni differenza per ottenere numeri estremamente positivi.

      • Nel nostro esempio:
        (x io (\ stile di visualizzazione x_ (i)) - μ) 2 (\ stile di visualizzazione ^ (2)) per ogni valore della popolazione (da i = 1 a i = 6):
        (-5,5)2 (\ stile di visualizzazione ^ (2)) = 30,25
        (-5,5)2 (\ stile di visualizzazione ^ (2)), dove x n (\ stile di visualizzazione x_ (n))- l'ultimo valore nella popolazione generale.
      • Per calcolare il valore medio dei risultati ottenuti, devi trovare la loro somma e dividerla per n: (( x 1 (\ displaystyle x_ (1)) - μ) 2 (\ stile di visualizzazione ^ (2)) + (x 2 (\ displaystyle x_ (2)) - μ) 2 (\ stile di visualizzazione ^ (2)) + ... + (x n (\ stile di visualizzazione x_ (n)) - μ) 2 (\ stile di visualizzazione ^ (2))) / n
      • Ora scriviamo la spiegazione sopra usando le variabili: (∑ ( x io (\ stile di visualizzazione x_ (i)) - μ) 2 (\ stile di visualizzazione ^ (2))) / n e ottenere una formula per calcolare la varianza della popolazione.