Cum se calculează variația
Varianța este un indicator al variabilității unui set de date. O valoare scăzută înseamnă că datele sunt grupate foarte aproape unul de celălalt, în timp ce o variație mare indică mai multe date distribuite. Acesta este un concept care are multe aplicații în statistici. De exemplu, compararea varianței a două seturi de date (cum ar fi pacienții de sex masculin și feminin) este o modalitate de a înțelege care variabilă produce un efect evident. Varianța este, de asemenea, utilă atunci când se creează modele statistice, deoarece atunci când este scăzută, indică o mostră foarte grupată.
paşi
Metoda 1
Calculați variația unui eșantion1
Scrieți datele care alcătuiesc eșantionul. În majoritatea cazurilor, statisticienii au acces numai la un eșantion sau la un grup de populație pe care o analizează. De exemplu, în loc de a analiza setul global de "costul fiecarui automobil din Germania", un cărturar calculează că un eșantion aleatoriu format din câteva mii de mașini. În acest fel, puteți utiliza eșantionul pentru a estima costurile mașinilor în Germania, chiar dacă valoarea nu coincide exact cu numerele reale.
- exemplu: analizând numărul de croissante vândute în fiecare zi într-o cantină, veți obține acest eșantion aleatoriu colectat în șase zile: 17 - 15 - 23 - 7 - 9 - 13. Aceasta este doar o probă și nu o populație, deoarece nu dețineți datele de vânzări din fiecare zi în care a fost deschisă bara.
- Dacă aveți toate datele populației, mergeți direct la următoarea metodă.
2
Scrieți formula pentru variația unui eșantion. Această valoare vă va oferi o idee despre distribuirea datelor. Cu cât variația se apropie de zero, cu atât mai multe date sunt grupate împreună. Când lucrați cu un eșantion, utilizați următoarea formulă:
3
Calculați media eșantionului. Simbolul xii indică media setului de date. Continuați cu calculul așa cum ați proceda în mod normal: suma tuturor valorilor împreună și împărțirea la numărul de date.
Apoi, împărțiți rezultatul cu numărul de valori, care în acest caz este egal cu 6: 84 ÷ 6 = 14.
Media eșantionului este x = 14.
4
Se scade media din fiecare valoare care formează întregul. Acum este timpul să continuați cu acest calcul - x, unde reprezintă toate datele care alcătuiesc eșantionul. Fiecare diferență vă informează despre abaterea datelor de la media sau, cu alte cuvinte, cu cât valoarea se îndepărtează de media.
- x = 17 - 14 = 3
- x = 15 - 14 = 1
- x = 23 - 14 = 9
- x = 7 - 14 = -7
- x = 9 - 14 = -5
- x = 13 - 14 = -1.
5
Ridicați fiecare rezultat. După cum sa menționat deja mai sus, suma abaterilor ( - xj) este zero. Aceasta înseamnă că "deviația medie" acesta trebuie să fie zero și prin urmare nu furnizează informații suplimentare privind distribuția eșantionului. Pentru a elimina această problemă, găsiți pătratul fiecărei abateri. În acest fel, veți obține numai valori pozitive, iar cele negative nu vor putea anula celelalte.
( - x)
- x)
92 = 81
(-7)2 = 49
(-5)2 = 25
(-1)2 = 1;
6
Găsiți suma pătratelor. În acest moment trebuie să calculați numărul de numerotare cu formula: Σ [( - x)]. Sigla literei grecești grecești, Σ, indică faptul că trebuie să adăugați toate valorile pe care termenul următor le asumă pentru fiecare . Ați calculat deja ( - x) pentru fiecare valoare din din eșantion, deci ceea ce trebuie să faceți este să treceți la o sumă simplă.
7
Împărțiți rezultatul cu n - 1, unde n este numărul de date din set. În trecut, statisticienii împărțiți numai la n în timpul calculului varianței. În acest fel, au obținut valoarea medie a deviației standard care se potrivește perfect varianței eșantionului. Cu toate acestea, trebuie să vă amintiți că eșantionul este doar o estimare a unei populații mai mari. Dacă luați în considerare o altă probă aleatorie și efectuați aceleași calcule, veți găsi rezultate diferite. Din acest motiv, împărțirea cu n-1 în loc de n oferă o estimare mai bună a varianței unei populații mai mari, ceea ce contează cu adevărat pentru statisticieni. Această corecție este atât de comună și larg acceptată încât face parte din definiția varianței.
Varianța eșantionului este = 33.2.
8
Înțelegeți varianța și deviația standard. Deoarece există putere în numerotator, amintiți-vă că varianța este exprimată cu unitatea originală de măsură măsurată în pătrat. Acest lucru face dificilă înțelegerea rapidă a sensului său - în acest scop, abaterea standard este folosită mai mult. Nu ați pierdut toate eforturile depuse până acum, deoarece abaterea standard este definită ca rădăcina pătrată a variației. Acesta este motivul pentru care varianța unui eșantion este exprimată ca , în timp ce deviația standard este .
Metoda 2
Calculați variația unei populații1
Luați în considerare o populație de date. Termenul "populație" se referă la întregul grup examinat. De exemplu, dacă studiați vârsta rezidenților Veneto, populația statistică oferă date despre vârsta fiecărui individ care trăiește în această regiune. În general, creați o foaie de calcul pentru acest tip de analiză pe scară largă, dar puteți proceda și cu un set mai mic:
- exemplu: există exact 6 tancuri în camera de acvariu municipală. Aceste 6 tancuri conțin următoarele cantități de pește:
.
2
Scrieți formula varianței unei populații. Din moment ce o populație conține toate datele de care aveți nevoie, formula vă permite să calculați varianța exactă a populației și nu o estimare. Pentru a le distinge de cea a eșantionului (care este doar o estimare), statisticienii folosesc diferite variabile:
3
Găsiți media populației. Atunci când analizăm un întreg grup de date, simbolul μ ("mu") reprezintă media aritmetică. Pentru ao calcula, sumați toate valorile împreună și apoi împărțiți-le cu numărul de date.
4
Reduceți media de la fiecare valoare care formează populația. Dacă valorile sunt apropiate de media, diferența va fi aproape de zero. Repetați scăderea pentru fiecare bucată din populație și veți începe să înțelegeți distribuția acesteia.
- μ = 5 - 10,5 = -5,5
- μ = 5 - 10,5 = -5,5
- μ = 8 - 10,5 = -2,5
- μ = 12 - 10,5 = 1,5
- μ = 15 - 10,5 = 4,5
- μ = 18 - 10,5 = 7,5.
5
Ridicați fiecare rezultat. În acest moment, unele dintre valorile calculate anterior vor fi negative, iar altele vor fi pozitive. Dacă aveți date pe o linie de numere, aceste grupuri vor reprezenta numerele din stânga și din dreapta mediei. Acest lucru nu ajută la calcularea varianței, deoarece aceste valori se anulează reciproc. Ridicați pătrat pentru a obține numai date pozitive.
( - μ) pentru fiecare valoare din de la 1 la 6:
(-5.5) = 30,25
(-5.5) = 30,25
(-2.5) = 6,25
(1,5) = 2,25
(4,5) = 20,25
(7.5) = 56,25.
6
Găsiți rezultatele medii. Acum aveți valoarea pentru fiecare dată, legată (indirect) de cât de departe este de la media. Calculați media prin însumarea acestora și apoi împărțind rezultatul cu numărul de date.
Variația populației = 24,25.
7
Conectați acest rezultat la formule. Dacă nu sunteți sigur că se potrivește cu formula descrisă la începutul metodei, rescrieți întreaga ecuație în întregime:
Sfaturi
- Deoarece interpretarea varianței este destul de dificilă, ea este de obicei calculată ca un punct de pornire pentru obținerea deviației standard.
- În timpul analizei eșantionului, utilizarea "n-1" în loc de "n" în numitorul acesta este numit Corecție Bessel. Eșantionul reprezintă doar o estimare a populației complete, iar eșantionul se adaptează doar parțial acestei estimări. Corecția ne permite să eliminăm această inexactitate. Acest estimator este legat de faptul că, atunci când n-1 puncte sunt enumerate, punctul final n-hex este obligatorie, deoarece numai anumite valori vor determina media eșantionului (xj) utilizat în formula varianței.
Distribuiți pe rețelele sociale:
înrudit
- Cum se calculează marjele de profit
- Cum se calculează valorile anomale
- Cum se calculează costul marginal
- Cum se calculează rata de creștere
- Cum se calculează valoarea P
- Cum se calculează vârsta medie
- Cum se calculează indicele prețurilor de consum (CPI)
- Cum se calculează deviația standard
- Cum se calculează dimensiunea unui eșantion
- Cum se calculează deviația medie, standard și eroarea standard
- Cum se calculează precizia
- Cum se calculează resturile interquartile (IQR)
- Cum se calculează un interval de încredere
- Cum se calculează un interval statistic
- Cum se calculează un scor Z
- Cum se calculează deviația standard cu Excel
- Cum de a calcula moda cu Excel
- Cum se creează o diagramă de bare în Excel
- Cum se creează un set de date aleatoriu în Excel
- Cum se calculează costurile marginale
- Cum se calculează valoarea lucrării implementată (valoarea câștigată)