gtemata.com

Cum se calculează variația

Varianța este un indicator al variabilității unui set de date. O valoare scăzută înseamnă că datele sunt grupate foarte aproape unul de celălalt, în timp ce o variație mare indică mai multe date distribuite. Acesta este un concept care are multe aplicații în statistici. De exemplu, compararea varianței a două seturi de date (cum ar fi pacienții de sex masculin și feminin) este o modalitate de a înțelege care variabilă produce un efect evident. Varianța este, de asemenea, utilă atunci când se creează modele statistice, deoarece atunci când este scăzută, indică o mostră foarte grupată.

paşi

Metoda 1

Calculați variația unui eșantion
1
Scrieți datele care alcătuiesc eșantionul. În majoritatea cazurilor, statisticienii au acces numai la un eșantion sau la un grup de populație pe care o analizează. De exemplu, în loc de a analiza setul global de "costul fiecarui automobil din Germania", un cărturar calculează că un eșantion aleatoriu format din câteva mii de mașini. În acest fel, puteți utiliza eșantionul pentru a estima costurile mașinilor în Germania, chiar dacă valoarea nu coincide exact cu numerele reale.
  • exemplu: analizând numărul de croissante vândute în fiecare zi într-o cantină, veți obține acest eșantion aleatoriu colectat în șase zile: 17 - 15 - 23 - 7 - 9 - 13. Aceasta este doar o probă și nu o populație, deoarece nu dețineți datele de vânzări din fiecare zi în care a fost deschisă bara.
  • Dacă aveți toate datele populației, mergeți direct la următoarea metodă.
  • 2
    Scrieți formula pentru variația unui eșantion. Această valoare vă va oferi o idee despre distribuirea datelor. Cu cât variația se apropie de zero, cu atât mai multe date sunt grupate împreună. Când lucrați cu un eșantion, utilizați următoarea formulă:
  • s2{ displaystyle s ^ {2}} = Σ [(x{ displaystyle x_ {i}} - x)2{ displaystyle ^ {2}}]/(n - 1);
  • s2{ displaystyle s ^ {2}} varianța este întotdeauna măsurată în unități pătrate;
  • x{ displaystyle x_ {i}} reprezintă o mostră de date;
  • Σ înseamnă "însumării" și indică faptul că este necesar să calculați următorii termeni pentru fiecare valoare din x{ displaystyle x_ {i}} și apoi adăugați-le împreună;
  • xj este valoarea medie a eșantionului;
  • n este numărul de date care alcătuiesc întregul.
  • 3
    Calculați media eșantionului. Simbolul xii indică media setului de date. Continuați cu calculul așa cum ați proceda în mod normal: suma tuturor valorilor împreună și împărțirea la numărul de date.
  • exemplu: mai întâi, însumați toate datele care alcătuiesc eșantionul - apoi: 17 + 15 + 23 + 7 + 9 + 13 = 84
    Apoi, împărțiți rezultatul cu numărul de valori, care în acest caz este egal cu 6: 84 ÷ 6 = 14.
    Media eșantionului este x = 14.
  • Puteți lua în considerare media ca "punct central" din eșantion. Dacă datele sunt grupate în jurul mediei, înseamnă că varianța este scăzută. Dacă valorile se îndepărtează și sunt foarte distribuite în jurul valorii de media, atunci varianța este mare.
  • 4
    Se scade media din fiecare valoare care formează întregul. Acum este timpul să continuați cu acest calcul x{ displaystyle x_ {i}} - x, unde x{ displaystyle x_ {i}} reprezintă toate datele care alcătuiesc eșantionul. Fiecare diferență vă informează despre abaterea datelor de la media sau, cu alte cuvinte, cu cât valoarea se îndepărtează de media.
  • exemplu:
    x1{ displaystyle x_ {1}} - x = 17 - 14 = 3
    x2{ displaystyle x_ {2}} - x = 15 - 14 = 1
    x3{ displaystyle x_ {3}} - x = 23 - 14 = 9
    x4{ displaystyle x_ {4}} - x = 7 - 14 = -7
    x5{ displaystyle x_ {5}} - x = 9 - 14 = -5
    x6{ displaystyle x_ {6}} - x = 13 - 14 = -1.
  • Nu este dificil să verificați calculele, deoarece suma rezultatelor trebuie să dea zero. Acest fenomen se datorează aceeași definiție a valorii medii, ca valori negative (distanța de la numerele minore medii) trebuie să anuleze perfect valorile pozitive (distanța față de media numere mai mari).
  • 5
    Ridicați fiecare rezultat. După cum sa menționat deja mai sus, suma abaterilor (x{ displaystyle x_ {i}} - xj) este zero. Aceasta înseamnă că "deviația medie" acesta trebuie să fie zero și prin urmare nu furnizează informații suplimentare privind distribuția eșantionului. Pentru a elimina această problemă, găsiți pătratul fiecărei abateri. În acest fel, veți obține numai valori pozitive, iar cele negative nu vor putea anula celelalte.
  • exemplu:
    (x1{ displaystyle x_ {1}} - x)2=32=9{ displaystyle ^ {2} = 3 ^ {2} = 9}
    (x2{ displaystyle (x_ {2}} - x)2=12=1{ displaystyle ^ {2} = 1 ^ {2} = 1}
    92 = 81
    (-7)2 = 49
    (-5)2 = 25
    (-1)2 = 1;
  • Acum aveți valoarea (x{ displaystyle x_ {i}} - x)2{ displaystyle ^ {2}} pentru fiecare eșantion de date.
  • 6
    Găsiți suma pătratelor. În acest moment trebuie să calculați numărul de numerotare cu formula: Σ [(x{ displaystyle x_ {i}} - x)2{ displaystyle ^ {2}}]. Sigla literei grecești grecești, Σ, indică faptul că trebuie să adăugați toate valorile pe care termenul următor le asumă pentru fiecare x{ displaystyle x_ {i}}. Ați calculat deja (x{ displaystyle x_ {i}} - x)2{ displaystyle ^ {2}} pentru fiecare valoare din x{ displaystyle x_ {i}} din eșantion, deci ceea ce trebuie să faceți este să treceți la o sumă simplă.
  • exemplu: 9 + 1 + 81 + 49 + 25 + 1 = 166.
  • 7
    Împărțiți rezultatul cu n - 1, unde n este numărul de date din set. În trecut, statisticienii împărțiți numai la n în timpul calculului varianței. În acest fel, au obținut valoarea medie a deviației standard care se potrivește perfect varianței eșantionului. Cu toate acestea, trebuie să vă amintiți că eșantionul este doar o estimare a unei populații mai mari. Dacă luați în considerare o altă probă aleatorie și efectuați aceleași calcule, veți găsi rezultate diferite. Din acest motiv, împărțirea cu n-1 în loc de n oferă o estimare mai bună a varianței unei populații mai mari, ceea ce contează cu adevărat pentru statisticieni. Această corecție este atât de comună și larg acceptată încât face parte din definiția varianței.
  • exemplu: există șase date în eșantion, deci n = 6.
    Varianța eșantionului este = s2=1666-1={ displaystyle s ^ {2} = { frac {166} {6-1}} =} 33.2.
  • 8
    Înțelegeți varianța și deviația standard. Deoarece există putere în numerotator, amintiți-vă că varianța este exprimată cu unitatea originală de măsură măsurată în pătrat. Acest lucru face dificilă înțelegerea rapidă a sensului său - în acest scop, abaterea standard este folosită mai mult. Nu ați pierdut toate eforturile depuse până acum, deoarece abaterea standard este definită ca rădăcina pătrată a variației. Acesta este motivul pentru care varianța unui eșantion este exprimată ca s2{ displaystyle s ^ {2}}, în timp ce deviația standard este s{ displaystyle s}.
  • De exemplu, abaterea standard a eșantionului luată anterior este s = √33.2 = 5.76.
  • Metoda 2

    Calculați variația unei populații

    1
    Luați în considerare o populație de date. Termenul "populație" se referă la întregul grup examinat. De exemplu, dacă studiați vârsta rezidenților Veneto, populația statistică oferă date despre vârsta fiecărui individ care trăiește în această regiune. În general, creați o foaie de calcul pentru acest tip de analiză pe scară largă, dar puteți proceda și cu un set mai mic:
    • exemplu: există exact 6 tancuri în camera de acvariu municipală. Aceste 6 tancuri conțin următoarele cantități de pește:
      x1=5{ displaystyle x_ {1} = 5}
      x2=5{ displaystyle x_ {2} = 5}
      x3=8{ displaystyle x_ {3} = 8}
      x4=12{ displaystyle x_ {4} = 12}
      x5=15{ displaystyle x_ {5} = 15}
      x6=18{ displaystyle x_ {6} = 18}.
  • 2
    Scrieți formula varianței unei populații. Din moment ce o populație conține toate datele de care aveți nevoie, formula vă permite să calculați varianța exactă a populației și nu o estimare. Pentru a le distinge de cea a eșantionului (care este doar o estimare), statisticienii folosesc diferite variabile:
  • σ2{ displaystyle ^ {2}} = (Σ (x{ displaystyle x_ {i}} - μ)2{ displaystyle ^ {2}})/n;
  • σ2{ displaystyle ^ {2}} = variația populației. Aceasta este litera greacă minuscule sigma pătratului. Varianța este exprimată în unități de măsură patratice;
  • x{ displaystyle x_ {i}} reprezintă un termen al setului de date;
  • Termenii incluși în Σ vor fi calculați pentru fiecare valoare din x{ displaystyle x_ {i}} și apoi adăugat;
  • μ este media populației;
  • n este numărul de valori care alcătuiesc populația.
  • 3
    Găsiți media populației. Atunci când analizăm un întreg grup de date, simbolul μ ("mu") reprezintă media aritmetică. Pentru ao calcula, sumați toate valorile împreună și apoi împărțiți-le cu numărul de date.
  • S-ar putea să credeți că media este și valoarea medie, dar aveți grijă, pentru că acest termen are definiții diferite în matematică.
  • exemplu: media = μ = 5+5+8+12+15+186{ displaystyle { frac {5 + 5 + 8 + 12 + 15 + 18} {6}}} = 10.5.
  • 4
    Reduceți media de la fiecare valoare care formează populația. Dacă valorile sunt apropiate de media, diferența va fi aproape de zero. Repetați scăderea pentru fiecare bucată din populație și veți începe să înțelegeți distribuția acesteia.
  • exemplu:
    x1{ displaystyle x_ {1}} - μ = 5 - 10,5 = -5,5
    x2{ displaystyle x_ {2}} - μ = 5 - 10,5 = -5,5
    x3{ displaystyle x_ {3}} - μ = 8 - 10,5 = -2,5
    x4{ displaystyle x_ {4}} - μ = 12 - 10,5 = 1,5
    x5{ displaystyle x_ {5}} - μ = 15 - 10,5 = 4,5
    x6{ displaystyle x_ {6}} - μ = 18 - 10,5 = 7,5.
  • 5
    Ridicați fiecare rezultat. În acest moment, unele dintre valorile calculate anterior vor fi negative, iar altele vor fi pozitive. Dacă aveți date pe o linie de numere, aceste grupuri vor reprezenta numerele din stânga și din dreapta mediei. Acest lucru nu ajută la calcularea varianței, deoarece aceste valori se anulează reciproc. Ridicați pătrat pentru a obține numai date pozitive.
  • exemplu:
    (x{ displaystyle x_ {i}} - μ)2{ displaystyle ^ {2}} pentru fiecare valoare din de la 1 la 6:
    (-5.5)2{ displaystyle ^ {2}} = 30,25
    (-5.5)2{ displaystyle ^ {2}} = 30,25
    (-2.5)2{ displaystyle ^ {2}} = 6,25
    (1,5)2{ displaystyle ^ {2}} = 2,25
    (4,5)2{ displaystyle ^ {2}} = 20,25
    (7.5)2{ displaystyle ^ {2}} = 56,25.
  • 6
    Găsiți rezultatele medii. Acum aveți valoarea pentru fiecare dată, legată (indirect) de cât de departe este de la media. Calculați media prin însumarea acestora și apoi împărțind rezultatul cu numărul de date.
  • exemplu:
    Variația populației = 30,25+30,25+6,25+2,25+20,25+56,256=145,56={ displaystyle { frac {30.25 + 30.25 + 6.25 + 2.25 + 20.25 + 56.25} {6}} = { frac {145.5} {6} 24,25.
  • 7
    Conectați acest rezultat la formule. Dacă nu sunteți sigur că se potrivește cu formula descrisă la începutul metodei, rescrieți întreaga ecuație în întregime:
  • După ce ați calculat diferența față de media și ați ridicat-o la pătrat, aveți valoarea (x1{ displaystyle x_ {1}} - μ)2{ displaystyle ^ {2}}, (x2{ displaystyle x_ {2}} - μ)2{ displaystyle ^ {2}} și așa mai departe până la (xn{ displaystyle x_ {n}} - μ)2{ displaystyle ^ {2}}, unde xn{ displaystyle x_ {n}} acestea sunt ultimele date ale populației.
  • Pentru a găsi media acestor valori, adăugați-le împreună și împărțiți cu n: ((x1{ displaystyle x_ {1}} - μ)2{ displaystyle ^ {2}} + (x2{ displaystyle x_ {2}} - μ)2{ displaystyle ^ {2}} + ... + (xn{ displaystyle x_ {n}} - μ)2{ displaystyle ^ {2}} ) / n
  • După re-scrierea numărătorului cu notația sigma, veți primi: (Σ (x{ displaystyle x_ {i}} - μ)2{ displaystyle ^ {2}})/n, adică formula de variație.
  • Sfaturi

    • Deoarece interpretarea varianței este destul de dificilă, ea este de obicei calculată ca un punct de pornire pentru obținerea deviației standard.
    • În timpul analizei eșantionului, utilizarea "n-1" în loc de "n" în numitorul acesta este numit Corecție Bessel. Eșantionul reprezintă doar o estimare a populației complete, iar eșantionul se adaptează doar parțial acestei estimări. Corecția ne permite să eliminăm această inexactitate. Acest estimator este legat de faptul că, atunci când n-1 puncte sunt enumerate, punctul final n-hex este obligatorie, deoarece numai anumite valori vor determina media eșantionului (xj) utilizat în formula varianței.
    Distribuiți pe rețelele sociale:

    înrudit