Cum se calculează Covariance
Covariance este un termen statistic care ajută la înțelegerea corelării între două seturi de date. De exemplu, să presupunem că antropologii studiază înălțimea și greutatea unui anumit populațional pentru fiecare individ luat în considerare, valorile relative de înălțime și greutate sunt exprimate ca o pereche de date (x-y). Aceste numere pot fi introduse într-o formulă standard pentru a calcula relația lor de covarianță. Acest articol descrie mai întâi procesul matematic pentru a ajunge la această valoare și apoi se ocupă de două metode automate de obținere a rezultatului.
paşi
Partea 1
Calculați Covariance de mână folosind Formula standard1
Aflați formula standard și componentele acesteia. Ecuația pentru calcularea covarianței este: - pentru ao folosi, trebuie să cunoașteți semnificația variabilelor și simbolurilor:
- : acest simbol este scrisoarea greacă "sigma" care în matematică reprezintă suma tuturor variabilelor care urmează. În formula de covarianță, simbolul Σ indică faptul că trebuie să calculați valorile care apar în numerotatorul fracțiunii și să le adăugați împreună înainte de a le împărți de numitor.
- : această variabilă este citită "x din i", indicele este un contor și înseamnă că trebuie să efectuați calculele luând în considerare fiecare valoare a lui x prezentă în seria de date.
- : abrevierea "avg" indică valoarea medie a tuturor datelor "x"- uneori, media este indicată de litera x cu o linie orizontală deasupra ei. Simbolul citește "valoarea medie a lui x".
- : în acest caz, trebuie să citiți "y din i" iar indicele reprezintă un contor indicând că trebuie să efectuați calculele luând în considerare fiecare valoare a y prezentă în seria de date.
- : abrevierea "avg" indică valoarea medie a tuturor datelor "y"- uneori, media este indicată cu litera y cu o linie orizontală deasupra ei. Simbolul citește "valoarea medie a y".
- : reprezintă numărul de date prezente în colecție. Rețineți că pentru a rezolva o problemă legată de covarianță trebuie să luați în considerare elementele statistice ca o pereche de valori (x-y). Valoarea lui n este egală cu numărul de perechi și nu cu cel al datelor individuale.
2
Organizați un tabel de date. Înainte de a începe calculele, merită să colectați toate valorile. Ar trebui să desenați un tabel format din cinci coloane care să eticheteze fiecare în funcție de aceste criterii:
3
Calculați valoarea medie a lui x. Setul descris mai jos este alcătuit din nouă numere - pentru a găsi cifra medie pe care trebuie să o adăugați și împărțiți rezultatul cu 9. Aceasta înseamnă că: 1 + 3 + 2 + 5 + 8 + 7 + 12 + 2 + 4 = 44. Împărțiți suma cu 9 și obțineți valoarea medie de 4,89. Acestea sunt datele medii pentru x pe care le utilizați în locul variabilei x (avg) în timpul următoarelor calcule.
4
Calculați valoarea medie a y. Procedați în mod similar. Coloana corespunzătoare datelor din y constă din nouă numere asociate cu cele ale lui x - constată media acestor date. Pentru exemplul considerat se procedează cu: 8 + 6 + 9 + 4 + 3 + 3 + 2 + 7 + 7 = 49. Împărțiți suma cu 9 și obțineți 5.44. Aceasta este valoarea medie pe care o utilizați în locul variabilei y (avg) în calculele următoare.
5
Găsiți valorile pentru . Pentru fiecare dată x indicată în coloana corespunzătoare, trebuie să găsiți diferența cu valoarea medie. Acesta este un calcul simplu, adică trebuie să scadeți 4,89 din fiecare valoare x din set. Dacă valoarea este mai mică decât media, obțineți un număr negativ - dacă este mai mare, obțineți un număr pozitiv. Aveți grijă să nu uitați semnele.
6
Calculați valorile pentru . În această coloană trebuie să raportați rezultatele unei scăderi similare, utilizând toate valorile y și media y (avg). Dacă valoarea inițială este mai mică decât media, obțineți un rezultat negativ - în caz contrar, rezultatul este pozitiv. Aveți grijă să nu uitați semnele.
7
Calculați produsul pentru fiecare rând de date. Completați casetele din ultima coloană prin înmulțirea numerelor pe care le-ați scris în cele două anterioare și care sunt etichetate ca și . Aveți grijă să lucrați linia în linie, înmulțind două numere care corespund perechilor de date - nu uitați semnele negative când mergeți.
8
Adăugați datele afișate în ultima coloană între ele. Aceasta este faza în care simbolul Σ "vine în acțiune". Odată ce toate calculele au fost efectuate, trebuie să adăugați rezultatele. Pentru setul simplu de date considerat ca un exemplu, ar trebui să obțineți nouă numere în coloana finală, rezumând-o prin atenția la simbolurile negative.
9
Calculează numitorul ecuației. De fapt, această valoare a fost deja găsită în timpul procedurii descrise mai sus - este de fapt reprezentată de (n - 1), adică de numărul de perechi de valori minus 1.
10
Împărțiți numitorul cu numitorul. Ultimul pas în procesul de calculare a covarianței este împărțirea numărătorului - - pentru numitor, adică . Cotația este covarianța setului de date.
Partea 2
Utilizați o foaie de calcul Excel pentru a calcula Covariance1
Luați notă de calculele repetate. Aceasta a covarianță este o procedură matematică pe care ar trebui să efectuați manual de câteva ori, în scopul de a înțelege sensul risultato- Cu toate acestea, dacă utilizați în mod constant acest instrument statistic pentru interpretarea datelor, este util să se găsească un mod mai rapid, mai automatizat pentru a obține rezultate. Ar trebui să realizeze că semnarea pentru seria de date relativ mici, care a fost considerat până acum, a trebuit să găsească două valori medii, efectua scădere opt single-uri, nouă multiplicare separată, o adunare și o divizie finală. Acestea sunt cele 31 de calcule elementare necesare pentru a obține o dată - de-a lungul căii, ați putea risca să uitați semnele negative sau să copiați cifrele în mod eronat, modificând astfel rezultatul.
2
Creați o foaie de calcul pentru a găsi covarianța. Dacă aveți posibilitatea să utilizați programul Excel (sau o altă foaie de calcul cu același potențial), puteți configura cu ușurință o masă. Etichetați cele cinci coloane așa cum ați proceda pentru calculele manuale: x, y, (x (i) -x (avg)), (y (i) -y (avg)) și produsul.
3
Notați seria numerică. Introduceți valorile lui x și y în coloanele corespunzătoare - rețineți că ordinea punctelor este importantă și că trebuie să împerecheați fiecare valoare a lui y cu x corespunzătoare.
4
Găsiți media lui x și y. Programul Excel poate calcula foarte repede valoarea medie. În prima celulă goală a fiecărei coloane de date, tastați formula = MEDIA (A2: A ___). În spațiul alb, introduceți numărul corespunzător celulei ocupate de ultimele date.
5
Introduceți formula pentru coloana (x (i) -x (avg)). În celula C2, trebuie să introduceți funcția care vă permite să calculați prima scădere care este: = A2 -____. În spațiul alb trebuie să raportați celula care conține valoarea medie a lui x.
6
Repetați aceeași funcție pentru coloană (y (i) -y (avg)). În urma exemplului de mai sus, trebuie să introduceți formula în celula D2 ca = B2-B102.
7
Introduceți formula pentru coloana produsului. În caseta E2 din coloana a cincea trebuie să tastați formula care vă permite să calculați produsul celor două celule anterioare - în acest caz scrieți doar: = C2 * D2.
8
Copiați diferitele funcții din celulele de sub fiecare coloană. Până acum ați programat calcule numai pentru primele două numere care ocupă linia 2. Folosind mouse-ul, evidențiați celulele C2, D2 și E2-mai târziu, plasați cursorul pe piață mică, situată în partea din dreapta jos până nu devine un semn "+". Faceți clic cu butonul stâng al mouse-ului și glisați cursorul în jos pentru a extinde casetele evidențiate pe întregul tabel. Această acțiune copiază automat cele trei formule din C2, D2 și E2 în celulele de mai jos. Trebuie să rețineți că calculele sunt efectuate automat prin completarea tabelului cu numere.
9
Setați suma pentru ultima coloană. Trebuie să calculați suma tuturor valorilor din coloană "produs". În prima celulă goală de mai jos lista de valori, introduceți formula = SUM (E2: E ___) și umple spațiul gol cu numărul de celule care conține ultimele date ale listei.
10
Găsiți covarianța. Foaia de calcul vă permite să efectuați ultima operație. Ultimul număr a constatat că, în exemplul de mai sus este în E102, este numărătorul cu formula covarianza- aveți posibilitatea să tastați funcția de direct sub această celulă: = E102 / ___ scris, în loc de spațiu alb, numărul de date aflate în posesia dumneavoastră minus 1. În exemplul considerat până acum, datele sunt 100, deci trebuie să tastați 99 - coeficientul obținut este valoarea covarianței.
Partea 3
Utilizați un Calculator online1
Faceți o căutare online pentru a găsi calculatoare de covarianță. Mai multe școli, companii de programare sau alte surse au creat pagini web care vă permit să calculați cu ușurință datele de covarianță - puteți utiliza orice motor de căutare tastând cuvinte cheie "calculator de covariate".
2
Introduceți datele. Citiți cu atenție instrucțiunile site-ului pentru a introduce corect seria numerică. Este important ca perechile de date să fie comandate, altfel veți obține rezultate greșite. Diferitele pagini online oferă diferite metode de introducere a datelor.
3
Calculați rezultatele. Aspectul interesant al acestor pagini este că, după introducerea datelor, trebuie doar să faceți clic pe buton "Calculeaza" pentru a obține valoarea covarianței imediat - majoritatea calculatoarelor online oferă, de asemenea, rezultate intermediare pentru media lui x, y și a valorii lui n.
Partea 4
Interpretați rezultatele Covariance1
Căutați o relație pozitivă sau negativă. Covariance este un instrument statistic care reprezintă relația dintre două seturi de date. În exemplul dat în introducere, vom examina înălțimea și greutatea unei populații, v-ați aștepta ca, pe măsura creșterii înălțimii, să crească și greutatea, ceea ce înseamnă că există un raport de covarianță pozitiv. Un alt exemplu este setul de ore pe care un individ îl antrenează în golf și scorurile pe care le primește - în acest caz, trebuie să vă așteptați la o covarianță negativă, deoarece, în timp ce persoana se antrenează, Scorul Gara_Stroke_Play ar trebui să scadă (în jocul de golf jucătorul cu cel mai mic scor câștigă).
- Luați în considerare proba de date descrisă mai sus. Cotația finală este -8.07, care este un număr negativ, ceea ce înseamnă că, pe măsură ce x crește, y scade. Puteți verifica dacă acest fenomen este adevărat, prin observarea unor perechi de a datelor, de exemplu, pentru valorile lui x 1 și 2 vor avea, respectiv, a valorilor 7, 8 și 9. Valorile x egal cu 8 și 12 sunt cuplate, respectiv, cu y = 3 și -y = 2.
2
Interpretează semnificația valorii absolute a covarianței. Dacă numărul este mare, fie pozitiv, fie negativ, înseamnă că cele două serii numerice sunt puternic corelate între ele atât pozitiv, cât și negativ.
3
Înțelegeți absența unei relații. Dacă găsiți o valoare de covarianță egală sau apropiată de 0, puteți ajunge la concluzia că perechile de date sunt practic independente - în acest caz, creșterea sau scăderea unei valori nu schimbă cealaltă: cei doi termeni sunt cuplați în mod aleatoriu .
4
Observați relația din punct de vedere grafic. Pentru a înțelege covarianța vizual, poate aduce perechile de valori pe un sistem cartezian de a face acest lucru, este destul de simplu pentru a realiza că, deși ele nu formează o linie dreaptă perfectă, diferitele puncte sunt distribuite de-a lungul unei dur pe diagonală, care merge de la din stânga sus în dreapta jos - aceasta este descrierea diagramă a unei covarianțe negative. În plus, valoarea -8.07 covarianță este faptul că, în comparație cu seturile de date, este un număr destul de mare-acest lucru sugerează că raportul dintre cele două serii numerice este destul de îngust și se poate observa în căutarea liniară distribuirea punctelor.
Avertismente
- Covarianța are o aplicare limitată în statistici - calculul său este adesea un pas intermediar pentru a găsi indici de corelare sau alți termeni. Aveți grijă să nu trageți concluzii bazate prea mult pe acest fapt.
Distribuiți pe rețelele sociale:
înrudit
- Cum se calculează factorul Scale
- Cum se calculează perimetrul unui dreptunghi
- Cum se calculează riscul relativ
- Cum se calculează rata de creștere cumulată
- Cum se calculează volumul unui con
- Cum se calculează volumul unui cub utilizând suprafața de suprafață
- Cum se calculează suprafața unei pătrunde din diagonală
- Cum se calculează energia cinetică
- Cum se calculează eroarea standard
- Cum se calculează inflația
- Cum se calculează diagonala unei pătraturi
- Cum se calculează dimensiunea unui eșantion
- Cum se calculează lungimea valului
- Cum se calculează masa moleculară
- Cum se calculează panta unei linii drepte prin două puncte
- Cum se calculează variația
- Cum se creează o diagramă de control
- Cum se calculează deviația standard cu Excel
- Cum de a calcula conținutul de alcool din sânge (Widmark Formula)
- Cum se calculează Volemia
- Cum să calculați până la maturitate sau să reveniți la expirare