Cum să evitați cele șapte păcate capitale ale interpretării greșite statistice

Statistica este un instrument util pentru înțelegerea tiparelor din lumea care ne înconjoară. Dar intuiția noastră ne dezamăgește adesea atunci când vine vorba de interpretarea acestor tipare. În această serie analizăm câteva dintre greșelile comune pe care le facem și cum să le evităm când ne gândim la statistici, probabilitate și risc.Conversaţie

1. Presupunând că diferențele mici sunt semnificative

Multe dintre fluctuațiile zilnice de pe piața bursieră reprezintă mai degrabă șansa decât ceva semnificativ. Diferențele din sondaje atunci când o parte este înaintea unui punct sau două sunt adesea doar zgomot statistic.

Puteți evita să trageți concluzii greșite despre cauzele acestor fluctuații cerând să vedeți „marja de eroare” referitoare la numere.

Dacă diferența este mai mică decât marja de eroare, probabil că nu există nicio diferență semnificativă, iar variația este probabil doar la fluctuații aleatorii.

Cum să evitați cele șapte păcate capitale ale interpretării greșite statisticeBarele de erori ilustrează gradul de incertitudine dintr-un scor. Atunci când astfel de marje de eroare se suprapun, diferența este probabil să se datoreze zgomotului statistic.


innerself abonare grafică



2. Echivalarea semnificației statistice cu semnificația lumii reale

Auzim adesea generalizări despre modul în care două grupuri diferă într-un fel, cum ar fi faptul că femeile sunt mai îngrijitoare, în timp ce bărbații sunt mai puternici din punct de vedere fizic.

Aceste diferențe se bazează adesea pe stereotipuri și înțelepciune populară, dar ignoră adesea similitudinile la oameni între cele două grupuri și variația la oameni în cadrul grupurilor.

Dacă alegeți doi bărbați la întâmplare, este probabil să existe o mare diferență în puterea lor fizică. Și dacă alegeți un bărbat și o femeie, acestea pot ajunge să fie foarte asemănătoare din punct de vedere al hrănirii sau bărbatul poate fi mai hrănitor decât femeia.

Puteți evita această eroare cerând „dimensiunea efectului” diferențelor dintre grupuri. Aceasta este o măsură a diferenței dintre media unui grup și media altui grup.

Dacă dimensiunea efectului este mică, atunci cele două grupuri sunt foarte asemănătoare. Chiar dacă dimensiunea efectului este mare, cele două grupuri vor avea probabil o mare variație în interiorul lor, astfel încât nu toți membrii unui grup vor fi diferiți de toți membrii unui alt grup.


3. Neglijând privirea la extreme

Flipside-ul dimensiunii efectului este relevant atunci când lucrul pe care vă concentrați urmează un „distributie normala”(Numită uneori„ curbă clopot ”). Aici majoritatea oamenilor sunt aproape de scorul mediu și doar un grup mic este cu mult peste sau cu mult sub medie.

Când se întâmplă acest lucru, o mică modificare a performanței pentru grup produce o diferență care nu înseamnă nimic pentru persoana obișnuită (vezi punctul 2), dar care schimbă caracterul extremelor mai radical.

Evitați această eroare reflectând dacă aveți sau nu probleme extreme. Când aveți de-a face cu oameni obișnuiți, diferențele de grup mic adesea nu contează. Atunci când ții mult la extreme, diferențele de grup mic pot conta în grămezi.

Cum să evitați cele șapte păcate capitale ale interpretării greșite statisticeCând două populații urmează o distribuție normală, diferențele dintre ele vor fi mai evidente la extreme decât la medii.


4. Coincidență de încredere

Știați că există corelație între numărul de oameni care s-au înecat în fiecare an în Statele Unite căzând într-o piscină și numărul de filme apărute în Nicholas Cage?

Cum să evitați cele șapte păcate capitale ale interpretării greșite statisticeDar există o legătură cauzală? tylervigen.com

Dacă arăți suficient de greu, poți găsi modele și corelații interesante care se datorează doar coincidenței.

Doar pentru că se întâmplă să se schimbe două lucruri în același timp sau în modele similare, nu înseamnă că sunt legate.

Evitați această eroare întrebând cât de fiabilă este asocierea observată. Este unică sau s-a întâmplat de mai multe ori? Se pot prezice asociații viitoare? Dacă l-ați văzut o singură dată, atunci probabil că se va datora întâmplării aleatorii.


5. Obținerea cauzalității înapoi

Când două lucruri sunt corelate - să zicem, șomajul și problemele de sănătate mintală - ar putea fi tentant să vedem o cale cauzală „evidentă” - spunem că problemele de sănătate mintală duc la șomaj.

Dar uneori calea cauzală merge în cealaltă direcție, cum ar fi șomajul care provoacă probleme de sănătate mintală.

Puteți evita această eroare amintindu-vă să vă gândiți la cauzalitatea inversă atunci când vedeți o asociere. Ar putea influența să meargă în cealaltă direcție? Sau ar putea merge în ambele sensuri, creând o buclă de feedback?


6. Uitarea de a lua în considerare cauzele exterioare

Oamenii nu reușesc adesea să evalueze posibili „factori terți”, sau cauze exterioare, care pot crea o asociere între două lucruri, deoarece ambii sunt de fapt rezultatele celui de-al treilea factor.

De exemplu, ar putea exista o asociere între mâncarea la restaurante și o sănătate cardiovasculară mai bună. Acest lucru vă poate determina să credeți că există o legătură cauzală între cele două.

Cu toate acestea, s-ar putea dovedi că cei care își pot permite să mănânce în mod regulat la restaurante se află într-o categorie socio-economică ridicată și își pot permite, de asemenea, îngrijiri medicale mai bune, iar îngrijirea sănătății este cea care oferă o sănătate cardiovasculară mai bună.

Puteți evita această eroare amintindu-vă să vă gândiți la alți factori atunci când vedeți o corelație. Dacă urmărești un lucru ca posibilă cauză, întreabă-te ce cauzează, la rândul tău, acel lucru? Ar putea acest al treilea factor să provoace ambele rezultate observate?


7. Grafice înșelătoare

O mulțime de răutate apare în scalarea și etichetarea axei verticale pe grafice. Etichetele trebuie să arate întreaga gamă semnificativă a oricărui aspect pe care îl priviți.

Dar, uneori, creatorul de grafice alege un interval mai restrâns pentru a face o diferență mică sau asocierea arată mai impactant. Pe o scară de la 0 la 100, două coloane ar putea arăta la aceeași înălțime. Dar dacă graficăm aceleași date care arată doar între 52.5 și 56.5, acestea ar putea arăta drastic diferite.

Puteți evita această eroare având grijă să notați etichetele graficului de-a lungul axelor. Fiți deosebit de sceptici cu privire la graficele neetichetate.

Cum să evitați cele șapte păcate capitale ale interpretării greșite statisticeGraficele pot spune o poveste - făcând diferențele să pară mai mari sau mai mici, în funcție de scară.

Despre autor

Winnifred Louis, profesor asociat, psihologie socială, Universitatea din Queensland și Cassandra Chapman, doctorandă în psihologie socială, Universitatea din Queensland

Acest articol a fost publicat inițial Conversaţie. Citeste Articol original.

Cărți asemănătoare:

at InnerSelf Market și Amazon