gtemata.com

Cum să te culci cu statisticile

După cum știe cineva cu un ochi de detaliu, statisticile pot fi foarte flexibile fără un context care să le ajute să le interpreteze. Citiți pașii de mai jos pentru a afla cum să prindeți statistici înșelătoare și înșelătoare și să folosiți aceste cunoștințe în avantajul dvs.

paşi

Metoda 1

Situată cu mediul
Imaginea intitulată Lie with Statistics Step 1
1
Aflați terminologia. Cuvântul "media" poate însemna o mulțime de lucruri atunci când se discută despre date statistice. La prima vedere, termenul este destul de simplu: media este cantitatea care cade aproximativ în mijloc. Cu toate acestea, există câteva tipuri diferite de medii, fiecare dintre acestea putând să fie înșelătoare dacă nu este înțeles în mod adecvat.
  • media aritmetică este obținut prin adăugarea tuturor numerelor într-o listă și împărțirea acestora cu numărul de intrări. Cu alte cuvinte, dacă aveți numerele 3, 3, 5, 4 și 7, media matematică se obține prin însumarea tuturor numerelor (și obțineți 22) și împărțirea acestei sume cu 5 (deoarece există cinci numere în eșantion) .
  • În acest exemplu, media este de 4,4.
  • media ponderată reprezintă valoarea care se încadrează la jumătatea distanței dintre numerele cele mai scăzute și cele mai ridicate ale unui eșantion. Folosind aceleași date ca și înainte (3, 3, 5, 4 și 7), media ponderată este de 4, deoarece 2 dintre numere sunt mai mici și 2 sunt mai mari.
  • armonic înseamnă este o reprezentare a celui mai comun număr din grupul de date. Folosind exemplul nostru, media armonică este de 3, deoarece apare de două ori.
  • Imaginea intitulată Lie with Statistics Step 2
    2
    Situată cu mijloace aritmetice. Acest suport poate părea cel mai sigur de metodele descrise mai sus, dar nu este deloc așa. Acest lucru se datorează faptului că numerele extrem de mari sau scăzute din lista de date pot fluctua semnificativ valoarea medie. Voi stati cu o medie aritmetica, considerand datele la capete si folosindu-le in ecuatie.
  • De exemplu, imaginați-vă să faceți un studiu al veniturilor a 50 de familii dintr-un cartier. Majoritatea familiilor câștigă între 40.000 și 60.000 de euro într-un an, însă o familie are un venit de 5 milioane de euro pe an. La calcularea mediei aritmetice, numărul va fi semnificativ mai mare decât venitul mediu "real" în această zonă, deoarece valoarea de 5 milioane de euro este mult mai mare decât celelalte.
  • În mod similar, dacă aveam date care să ateste că 9 persoane au câte 1000 de euro în conturile lor bancare, dar o singură persoană are doar 1 euro, media ponderată ar fi fost 900,10 euro - cu aproape 10% mai mică la cea mai comună.
  • Sondajele de încredere îndepărtează adesea numerele mult mai mari și mult mai mici înainte de a calcula media. Cu toate acestea, nu toată lumea vedeți la știrile TV este fiabilă. Cu excepția cazului în care aveți acces direct la toate datele sau aveți o garanție scrisă că s-au eliminat valori extreme sau valori extreme, este mai sigur să presupuneți că nu sunt.
  • Imaginea intitulată Lie with Statistics Step 3
    3
    Situată cu medii ponderate. Această medie este de fapt cea mai dificilă valoare "amăgește"deoarece nu poate fi niciodată prea mare sau prea scăzută în comparație cu majoritatea valorilor din listă. Trebuie să se întoarcă în centru cu forța. Cu toate acestea, puteți utiliza media ponderată pentru a ascunde un număr foarte mare sau foarte mic. De exemplu, dacă lista de date este 1, 1, 2, 3, 4, 5, 3000, media ponderată este de 3.
  • Când aveți o cantitate uniformă de date, puteți calcula media ponderată pentru a găsi media între cele două elemente. Cu toate acestea, acest lucru nu ia în considerare valorile anormale.
  • Acordați atenție mediilor ponderate utilizate pentru a descrie modificările în timp. O companie care crește prețul serviciilor cu 3% în fiecare an ar putea să-i facă să crească cu 20% anul acesta și să o ascundă prin prezentarea unei medii ponderate de 3% în ultimii 9 ani.
  • Image cu titlul Lie cu statistici Pasul 4
    4
    Minciuna cu mediile armonioase. În unele cazuri, este aproape imposibil să se întâmple cu mediile armonice - numărul mediu de bilete achiziționate pe persoană pentru un meci de fotbal, de exemplu, este aproape întotdeauna o cifră sigură în acest tip de calcul. Cu toate acestea, media armonică poate exclude date importante, în special în cazul probelor mai mici.
  • De exemplu, dacă aveți o listă cu toate numerele de la 1 la 100, dar numărul 1 este introdus de 3 ori, 1 va fi media armonică, chiar dacă media aritmetică (și în acest caz, cea mai sensibilă) este foarte mai aproape de 50.
  • Fiecare anchetă la scară largă poate fi manipulată prin accentuarea statisticilor armonice. Să presupunem că facem un sondaj de 100 de persoane care îi cere să evalueze un subiect cu o scară de la 1 la 10. Dacă mulți oameni au dat votul 10 mai degrabă decât orice alt vot, atunci media armonică va fi de 10 chiar dacă există mai mulți oameni minor) care a votat 1.
  • Image cu titlul Lie with Statistics Pasul 5
    5
    Situată cu reprezentarea numerelor. Dacă aveți o listă de date abstracte, mai degrabă decât numere concrete (de exemplu, un sondaj al satisfacției clienților), este ușor de înfricoșător să găsiți aceste date. Dacă cereți oamenilor să-și evalueze satisfacția pe o scară de la 1 la 3, aceasta nu înseamnă neapărat că clienții care au ales 3 sunt de trei ori mai fericiți decât cei care au ales 1. Acest calcul este utilizat în principal pentru medii asimetrice, dar poate fi aplicat uneori și la media ponderată și chiar la media aritmetică.
  • Metoda 2

    Întinzându-se cu o mostră de date
    Imaginea intitulată Lie with Statistics Step 6
    1
    Utilizați un set redus. Fiecare om de stat bun știe că singura modalitate de abordare a unei medii utile sau de identificare a unei tendințe reale este colectarea datelor dintr-un întreg cât mai larg posibil. Dacă puteți obține informații de la 100 de persoane, este un bun de 10.000 este chiar mai bine. Cele mai multe elemente de informații sunt introduse în lista de date, cu atât este mai probabil să se obțină mijloace fiabile. Folosind o serie de 3 sau 5 date, puteți obține rezultate care nu reflectă cu acuratețe starea lucrurilor.
    • De exemplu, dacă găsiți două persoane care s-au rănit recent într-un mod stupid - cum ar fi cu o pernă - și folosiți aceste date ca și când ar fi o anchetă completă, ați putea ajunge la concluzia că pernele sunt periculoase pentru toată lumea. Indiferent de media pe care o alegeți să o utilizați, dacă nu dezvăluiți dimensiunea eșantionului dat de doar 2 persoane, nu există nicio modalitate de a respinge revendicarea.
  • Imaginea intitulată
    2
    Utilizați un eșantion controlat. Cele mai exacte eșantioane de date nu sunt numai mari, ci și mari. Un studiu geologic privind tipurile de minerale dintr-un deșert va avea o listă mai precisă dacă colectați multe mostre din fiecare parte a deșertului, în loc să colectați 1.000 de probe din același punct. Prin limitarea sferei de acoperire a eșantionului de date, puteți influența semnificativ rezultatele.
  • Uneori acest lucru este funcțional și se face în mod intenționat. O cercetare demografică pentru a identifica munca depusă de bărbați va efectua ancheta pe un eșantion de bărbați. Atâta timp cât acest lucru este clar menționat în date, nu este nimic în neregulă cu acesta.
  • Rezultatele obținute din micile proiecte de cercetare efectuate la nivel de școală, în special, tind să compare datele din studiul lor cu un rezultat general. Acest lucru se datorează faptului că multe proiecte de cercetare școlară nu au timp sau resurse pentru a folosi un eșantion mare aleatoriu de cetățeni obișnuiți și se bazează numai pe studenți. Încă o dată, acest lucru este bun, atâta timp cât această informație este indicată în mod clar, dar rețelele, mereu în căutarea unor titluri senzaționale, au ascuns adesea detaliile unui mic studiu universitar, lăsându-l ca pe un studiu mai amplu.


  • Image cu titlul Lie with Statistics Step 8
    3
    Utilizați o mostră neechilibrată. Această tehnică este deosebit de subtilă, deoarece poate ascunde o mulțime de detalii de la utilizator. Trucul este de a folosi date care nu pot fi comparate în mod obiectiv și de a le trata ca și cum ar fi la același nivel. De exemplu, dacă există un oraș de 100 000 care a crescut cu 10 000 de locuitori în 10 ani și se compară cu un oraș de 10 care a câștigat 10 rezidenți în ultimii 10 ani, procentele pentru fiecare creștere de populație vor apărea arată că orașul mic a crescut mult mai repede.
  • Această metodă este folosită uneori de persoane care analizează datele de piață și prezintă o imagine înșelătoare a cifrelor de vânzări. Să presupunem că faceți o analiză a vânzărilor de mere și portocale, dar la jumătatea investigației nu mai există portocale deoarece există o lipsă. Dacă veți continua să comparăți datele pentru restul cercetărilor, va exista un uriaș vârf în vânzările de mere în comparație cu vânzările de portocale, deși probabil că mereul nu a devenit din ce în ce mai popular.
  • Metoda 3

    Minciuna cu grafica
    Imaginea intitulată Minciuna cu statisticile Pasul 9
    1
    Lăsați y gol. Nimic nu oferă o imagine mai clară a unei diagrame sau a unei mese, dar chiar și acestea pot fi manipulate subtil pentru a da diferite efecte. Acest lucru se datorează faptului că oamenii tind să privească formele și dimensiunile de pe hărți înainte de a vă îngrijora de verificarea specificațiilor numerice legate de acestea. Cea mai ușoară modalitate de a manipula axa y este pur și simplu să nu o etichetați.
    • Dacă aveți un eșantion de 5 bare pe axa x, dar nu există nici un indicator al gradului în care acestea sunt comparate între ele, nu există nicio modalitate de a evalua dacă există o diferență semnificativă între ele.
  • Image cu titlul Lie cu statistici Pasul 10
    2
    Utilizați cifre foarte mari sau mici pe y. Să presupunem că setul de date este cuprins între 1 și 50. Pentru a ascunde diferențele, puteți măsura axa y pe o scală de 100, dar măsurarea axei y în incremente de 1/10 îmbunătățește incorect datele. O diferență între 3 și 10 pare a fi uriașă, măsurată în zecimi (aceasta este de 70 de unități!), Dar este abia vizibilă pe o diagramă a cărei scală este pentru fiecare 100 (este mult, mult mai puțin decât 1 unitate! ).
  • Imaginea intitulată Lie cu statistici Pasul 11
    3
    Setați axa y parțial între intervale. Dacă datele variază de la 11 la 51, puteți face ca valorile extreme să pară chiar mai mari și mai mici, marcând axa y astfel încât să pornească de la 10. Astfel, bara 11 este reprezentată doar deasupra axa x. Acest lucru va face ca datele să apară aproape nulă, cu excepția cazului în care cineva este suficient de expert pentru a observa îndeaproape îndeaproape și pentru a găsi că graficul începe de la valoarea 10 și nu de la 0.
  • Bara reprezentând 51 este de 50 de ori mai mare decât bara reprezentând 11 pe un astfel de grafic, deoarece bara cea mai mică este de numai 1 unitate. Dacă graficul a început la 0, bara reprezentând 51 ar fi fost de 5 ori mai mare decât înălțimea barei reprezentând 11.
  • Image cu titlul Lie with Statistics Step 12
    4
    Utilizați o scară necorespunzătoare. Ori de câte ori vedeți cuvintele "nu în scară" în final, este probabil ca un exemplu ca acesta să fie făcut. Nu este întotdeauna rău - uneori, numerele implicate sunt atât de diferite încât nu există nici o modalitate de a le reprezenta cu exactitate în aceeași diagramă. Astfel, acesta poate fi utilizat cu ușurință în scopuri nerecomandate.
  • De exemplu, o reprezentare vizuală a dimensiunilor poate fi dimensionată pentru înălțime, dar nu în lățime, făcând obiectul mai înalt (cum ar fi o clădire) și, de asemenea, mult mai subțire sau mai larg decât este de fapt.
  • Imaginea intitulată Lie cu statistici Pasul 13
    5
    Utilizați grafice care omit datele. Acest lucru este frecvent observat în statisticile mari care împart rezultate pentru unele categorii, cum ar fi celebrul grafic care arată cum o băutură carbonatată este mai populară într-un județ decât în ​​Statele Unite. La prima vedere, această informație pare foarte detaliată, însă în curând apar întrebări: cât de mari sunt datele sondajului? Care este pragul pentru a determina rezultatul? Are o medie aritmetică, ponderată sau armonică?
  • Dacă utilizați un singur rezultat pentru fiecare zonă intervievată și excludeți orice altceva, puteți verifica cu ușurință rezultatele în funcție de zonă, fără a informa vreodată că dimensiunea eșantionului pentru fiecare zonă a fost mică. Și în acest caz, este o lipsă de informații concrete care fac rezultatele foarte dificil de cuantificat.
  • Sfaturi

    • În caz de îndoială, verificați. Dacă nu puteți obține informații detaliate și complete privind mărimea, domeniul de aplicare, metodele de eșantionare a unei statistici, nu aveți încredere.

    Avertismente

    • Este destul de ușor să stați cu statisticile odată ce știți cum să faceți acest lucru, dar nu este strict etic. Acordați atenție modului în care utilizați cunoștințele pe care le-ați dobândit. Nu le folosiți pentru a răni, a înșela sau pentru a marginaliza pe oricine.
    Distribuiți pe rețelele sociale:

    înrudit