gtemata.com

Cum se calculează valoarea P

Valoarea P

conținut

, sau valoarea de probabilitate, este o măsură statistică care ajută oamenii de știință să determine corectitudinea ipotezelor lor. P este folosit pentru a înțelege dacă rezultatele unui experiment se află în intervalul normal de valori pentru evenimentul observat. De obicei, dacă valoarea P a unui anumit set de date scade sub un anumit nivel prefixat (de exemplu 0,05) atunci oamenii de știință resping "ipoteza nulă" din experimentul lor, cu alte cuvinte, exclud ipoteza a cărei variabilă nu este semnificativ pentru rezultate. Puteți utiliza un tabel pentru a găsi valoarea p, după calcularea altor valori statistice. Una dintre valorile statistice care urmează să fie determinate în primul rând este care cadru.

paşi

1
Determinați rezultatele așteptat din experimentul dvs. De obicei, atunci când oamenii de știință efectuează teste și observă rezultatele, au deja o idee despre ceea ce este în avans "normal" sau "tipic". Această idee se poate baza pe experimente anterioare, pe o serie de date fiabile, pe literatură științifică și / sau pe alte surse. Deci, în experimentul dvs., determinați ce ar putea fi rezultatele așteptate și exprimați-le în formă numerică.
  • De exemplu: să spunem că studiile anterioare au arătat că, la nivel național, șoferii de mașini roșii au luat mai multe amenzi la viteză decât șoferii de mașini albastre, într-un raport de 2: 1. Vrei să înțelegi dacă poliția din orașul tău "privințe" această statistică și preferă automobilele roșii. Dacă luați un eșantion aleatoriu de 150 de amenzi de accelerare atribuite autoturismelor roșii și albastre, trebuie să vă așteptați 100 sunt pentru roșu și 50 pentru blues, dacă poliția din orașul tău respectă tendința națională.
  • 2
    Determinați rezultatele observate din experimentul dvs. Acum că știți ce să vă așteptați, trebuie să efectuați testul pentru a găsi valoarea reală (sau "observate"). De asemenea, în acest caz, rezultatele trebuie exprimate în formă numerică. Dacă manipulăm anumite condiții externe și observăm rezultatele diferi din cele așteptate, există două posibilități: este o aleatorie sau intervenția noastră are cauzate abaterea. Scopul calculului valorii P este de a înțelege dacă datele rezultate se abat atât de mult de cele așteptate să fie făcute "ipoteza nulă" (adică ipoteza că nu există o corelație între variabila experimentală și rezultatele observate) este puțin probabil să fie respinsă.
  • De exemplu: în orașul dvs., cele 150 de amenzi aleatorii pentru depășirea vitezei pe care le-ați luat în considerare sunt împărțite în 90 pentru masini rosii si 60 pentru cele albastre. Aceste date se abat de la media națională (și se așteaptă) 100 și 50. Manipularea experimentului (în acest caz, am schimbat eșantionul de la național la cel local) a fost cauza acestei diferențe sau poliția orașului a aceasta nu este urmată media națională? Observăm un comportament diferit sau am introdus o variabilă semnificativă? Valoarea P ne spune acest lucru.
  • 3
    Determinați gradul de libertate din experimentul dvs. Gradul de libertate reprezintă măsura cantității de variabilitate pe care o oferă experimentul și care este determinată de numărul de categorii pe care le examinați. Ecuația pentru gradele de libertate este: Gradul de libertate = n-1, unde "n" este numărul de categorii sau variabile pe care le analizați.
  • Exemplu: experimentul dvs. are două categorii, unul pentru mașinile roșii și unul pentru cele albastre. Deci ai 2-1 = 1 grad de libertate. Dacă ați fi avut în vedere mașinile roșii, albastre și verzi, ați fi avut 2 grade de libertate și așa mai departe.
  • 4


    Comparați rezultatele așteptate cu cele observate utilizând care cadru. Piața Chi (scrisă "x2") este o valoare numerică care măsoară diferența dintre date așteptat și observate a unui test. Ecuația pentru chi-square este: x2 = Σ ((o-e)2/ S), unde "sau" este valoarea observată ed "și" este cea așteptată. Adăugați rezultatele acestei ecuații pentru toate rezultatele posibile (vedeți mai jos).
  • Rețineți că ecuația include simbolul Σ (Sigma). Cu alte cuvinte, trebuie să calculați ((| o-e | -, 05)2/ e) pentru fiecare rezultat posibil și apoi adăugați rezultatele împreună pentru a obține chi-pătratul. În exemplul pe care îl considerăm, avem două rezultate: mașina care a fost amendată este albastră sau roșie. Deci, calculăm ((o-e)2/ e) de două ori, una pentru roșu și una pentru albastru.
  • De exemplu: introduceți valorile așteptate și observate în ecuația x2 = Σ ((o-e)2/ S). Amintiți-vă că pentru că există simbolul sigma, trebuie să efectuați calculul de două ori, unul pentru mașinile roșii și celălalt pentru cele albastre. Iată cum faceți:
  • x2 = ((90-100)2/ 100) + (60-50)2/ 50)
  • x2 = ((-10)2/ 100) + (10)2/ 50)
  • x2 = (100/100) + (100/50) = 1 + 2 = 3 .
  • 5
    Alegeți a nivelul de semnificație. Acum că aveți grade de libertate și chi pătrat, există o ultimă valoare pe care trebuie să o găsiți pentru valoarea P, trebuie să decideți nivelul de semnificație. În practică, este o valoare care măsoară cât doriți să fiți siguri de rezultatul dvs.: un nivel scăzut de semnificație corespunde unei probabilități scăzute ca experimentul să fi produs date aleatorii și viceversa. Această valoare este exprimată în zecimale (ca 0,01) și corespunde procentului posibilității ca datele rezultate să fie aleatorii (în acest caz 1%).
  • Prin convenție, oamenii de știință determină nivelul de semnificație la 0,05 sau 5%. Aceasta înseamnă că datele experimentale au cel mult 5% șanse de a fi aleatorii. Cu alte cuvinte, există o șansă de 95% ca rezultatele să fie influențate de manipularea variabilelor de testare de către oamenii de știință. Pentru majoritatea experimentelor, 95% siguranța că există o corelație între două variabile demonstrează într-o manieră "satisfăcător" că corelația există cu adevărat.
  • De exemplu: în testul auto roșu și albastru, urmați convenția comunității științifice și stabiliți nivelul dvs. de semnificație 0,05.
  • 6
    Utilizați o tabelă de distribuție chi-pătrată pentru a găsi valoarea P în aproximație. Oamenii de știință și statisticienii folosesc tabele mari pentru a calcula P în testele lor. Aceste tabele au, de obicei, grade diferite de libertate pe coloana verticală stângă și valoarea P corespunzătoare pe rândul superior al liniei. Mai întâi găsiți gradele de libertate și apoi derulați în jos tabelul de la stânga la dreapta pentru a găsi primul număr cea mai mare a picturii tale. Acum mergeți în sus pentru a găsi ce se potrivește cu valoarea P (de obicei valoarea P este între acest număr pe care l-ați identificat și cel mai mare următor).
  • Tabelele de distribuire a chirurilor sunt disponibile aproape oriunde, le puteți găsi online sau în știință și statistici. Dacă nu le poți obține, folosește fotografia de mai sus sau utilizați acest link.
  • De exemplu: pătratul dvs. chi este 3. Apoi, utilizați tabelul de distribuție în fotografia de mai sus și găsiți valoarea aproximativă a lui P. Deoarece știți că experimentul dvs. are doar 1 gradul de libertate, veți începe de la cea mai înaltă linie. Deplasați-vă de la stânga la dreapta în tabel până când găsiți o valoare mai mare decât 3 (chi chi quadro). Primul număr pe care îl întâlniți este 3,84. Ridicați coloana și rețineți că aceasta corespunde unei valori de 0,05. Aceasta înseamnă că valoarea P este între 0,05 și 0,1 (următorul număr cel mai mare din tabel).
  • 7
    Decideți dacă doriți să respingeți sau să vă mențineți ipoteza. Deoarece ați găsit o valoare aproximativă a lui P pentru experimentul dvs., puteți decide dacă să respingeți sau nu ipoteza nulă (vă reamintesc că ipoteza nulă este cea care presupune că nu există o corelație între variabila și rezultatele experimentului). Dacă P este sub nivelul dvs. de semnificație, felicitări: ați arătat că există o mare probabilitate de corelație între variabilă și rezultatele observate. Dacă P este mai mare decât nivelul dvs. de semnificație, atunci rezultatele observate ar putea fi mai probabil să provină din întâmplare.
  • De exemplu: valoarea P este între 0,05 și 0,1, deci cu siguranță nu inferior de 0,05. Asta înseamnă că nu puteți refuza ipoteza dvs. nulă și că nu ați atins pragul minim de securitate de 95% pentru a decide dacă poliția orașului dvs. acordă amenzi autoturismelor roșu și albastru cu o proporție semnificativ diferită de media națională.
  • Cu alte cuvinte, există o șansă de 5-10% ca datele obținute să fie rezultatul șanselor și nu al faptului că ați modificat eșantionul (de la național la cel local). Deoarece ați impus o limită maximă de insecuritate de 5%, nu puteți spune cu siguranță că poliția din orașul tău este mai mică "prevenite" față de șoferii care conduc o mașină roșie.
  • Sfaturi

    • Utilizarea unui calculator științific va face calculele mult mai ușor. Puteți găsi, de asemenea, calculatoare online.
    • Puteți calcula valoarea p utilizând diferite programe, cum ar fi un software de calcul tabelar comun sau cele mai specializate pentru calculul statistic.
    Distribuiți pe rețelele sociale:

    înrudit