DiplomaDe10 Blog Asimetria (Skewness) în SPSS

Asimetria (Skewness) în SPSS

Bun găsit,

Skewness este o măsură a asimetriei unei distribuții. O distribuție este asimetrică atunci când partea stângă și dreaptă nu sunt imagini în oglindă.

O distribuție poate avea asimetrie la dreapta (sau pozitivă), la stânga (sau negativă) sau zero. O distribuție oblică la dreapta este mai lungă pe partea dreaptă a vârfului său, iar o distribuție oblică la stânga este mai lungă pe partea stângă a vârfului său:

Poate doriți să calculați asimetria unei distribuții pentru a:

Descrie distribuția unei variabile alături de alte statistici descriptive
Determina dacă o variabilă este distribuită normal. O distribuție normală are o asimetrie zero și este o presupunere a multor proceduri statistice.

Ce este declinul zero?
Când o distribuție are declinare zero, este simetrică. Laturile sale stânga și dreapta sunt imagini în oglindă.

Distribuțiile normale au distorsiuni zero, dar nu sunt singurele distribuții cu distorsiuni zero. Orice distribuție simetrică, cum ar fi o distribuție uniformă sau unele distribuții bimodale (cu două vârfuri), va avea, de asemenea, deformare zero.

Cel mai simplu mod de a verifica dacă o variabilă are o distribuție anormală este să o reprezentați într-o histogramă. De exemplu, greutățile puilor de șase săptămâni sunt prezentate în histograma de mai jos.

Distribuția este aproximativ simetrică, cu observațiile distribuite în mod similar pe părțile din stânga și din dreapta ale vârfului său. Prin urmare, distribuția are aproximativ zero deformare.

Într-o distribuție cu distorsiune zero, media și mediana sunt egale.

Deformare zero: medie = mediană
De exemplu, greutatea medie a puiului este de 261,3 g, iar mediana este de 258 g. Media și mediana sunt aproape egale. Ele nu sunt perfect egale, deoarece distribuția eșantionului are o declinare foarte mică.

Deși o distribuție teoretică (de exemplu, distribuția z) poate avea o distorsiune zero, datele reale au aproape întotdeauna cel puțin un pic de distorsiune. Cu toate acestea, dacă o distribuție este aproape de a fi simetrică, de obicei este considerată a avea o asimetrie zero în scopuri practice, cum ar fi verificarea ipotezelor modelului.

Ce este declinul corect (declinarea pozitivă)?
O distribuție oblică la dreapta este mai lungă pe partea dreaptă a vârfului său decât pe partea stângă. Declinarea la dreapta este denumită și declinare pozitivă.

Vă puteți gândi la asimetrie în ceea ce privește cozile. O coadă este un capăt lung și conic al unei distribuții. Indică faptul că există observații la unul dintre capetele extreme ale distribuției, dar că sunt relativ rare. O distribuție oblică la dreapta are o coadă lungă pe partea dreaptă.

Numărul de pete solare observate pe an, prezentat în histograma de mai jos, este un exemplu de distribuție oblică la dreapta. Petele solare, care sunt zone întunecate, mai reci de pe suprafața soarelui, au fost observate de astronomi între 1749 și 1983.

Distribuția este înclinată spre dreapta deoarece este mai lungă în partea dreaptă a vârfului său. Există o coadă lungă în partea dreaptă, ceea ce înseamnă că la fiecare câteva decenii există un an în care numărul de pete solare observate este mult mai mare decât media.

Media unei distribuții inclinate spre dreapta este aproape întotdeauna mai mare decât mediana acesteia. Asta pentru că valorile extreme (valorile din coadă) afectează mai mult media decât mediana.

Înclinare la dreapta: medie > mediană
De exemplu, numărul mediu de pete solare observate pe an a fost de 48,6, ceea ce este mai mare decât mediana de 39.

Ce este declinul la stânga (declinarea negativă)?

O distribuție oblică la stânga este mai lungă în partea stângă a vârfului său decât în dreapta. Cu alte cuvinte, o distribuție oblică la stânga are o coadă lungă pe partea stângă. Declinarea la stânga este denumită și declinare negativă.

Scorurile testelor urmează adesea o distribuție oblică la stânga, majoritatea studenților având performanțe relativ bune și câțiva studenți cu performanțe mult sub medie. Histograma de mai jos arată scorurile pentru porțiunea de zoologie a unui test standardizat susținut de elevii indieni la sfârșitul liceului.

Distribuția este oblică la stânga deoarece este mai lungă în partea stângă a vârfului său. Coada lungă din stânga ei reprezintă proporția mică de studenți care au primit scoruri foarte mici.

Media unei distribuții oblice la stânga este aproape întotdeauna mai mică decât mediana acesteia.

Înclinare la stânga: medie < mediană
De exemplu, scorul mediu la testul zoologic a fost 53,7, ceea ce este mai mic decât mediana de 55.

Cum se calculează asimetria
Există mai multe formule pentru măsurarea asimetriei. Una dintre cele mai simple este asimetria mediană a lui Pearson. Se profită de faptul că media și mediana sunt inegale într-o distribuție anormală.

Inclinația mediană a lui Pearson = 3\time\dfrac{(\textup{Media}-\textup{Media})}{\textup{Standard\,\,deviația}}
Inclinația mediană a lui Pearson vă spune câte abateri standard separă media și mediana.

Observațiile reale au rareori o asimetrie mediană a lui Pearson de exact 0. Dacă datele dvs. au o valoare apropiată de 0, puteți considera că are o asimetrie zero. Nu există o convenție standard pentru ceea ce este considerat „suficient de aproape” de 0 (deși această cercetare sugerează că 0,4 și -0,4 sunt limite rezonabile pentru eșantioane mari).

Exemplu: Calcularea asimetriei mediane a lui Pearson
Deformarea mediană a numărului de pete solare observate pe an a lui Pearson:
Medie = 48,6
Mediana = 39
Abaterea standard = 39,5
Calcul

Inclinația mediană a lui Pearson = 3\time\dfrac{(\textup{Media}-\textup{Media})}{\textup{Standard\,\,deviația}}
Inclinația mediană a lui Pearson = 3\times\dfrac{(48,6-39)}{39,5}
Asimetria mediană a lui Pearson = 0,73
Ce trebuie să faceți dacă datele dvs. sunt denaturate
Un motiv pentru care ați putea verifica dacă o distribuție este denaturată este să verificați dacă datele dumneavoastră sunt adecvate pentru o anumită procedură statistică. Multe proceduri statistice presupun că variabilele sau reziduurile sunt distribuite în mod normal. Skew este o modalitate comună prin care o distribuție poate diferi de o distribuție normală.

În general, aveți trei opțiuni dacă procedura dvs. statistică necesită o distribuție normală și datele dvs. sunt denaturate:

Nu face nimic. Multe teste statistice, inclusiv teste t, ANOVA și regresii liniare, nu sunt foarte sensibile la datele distorsionate. Mai ales dacă înclinarea este ușoară sau moderată, poate fi cel mai bine să o ignorați.
Utilizați un alt model. Poate doriți să alegeți un model care nu presupune o distribuție normală. Testele neparametrice sau modelele liniare generalizate ar putea fi mai potrivite pentru datele dvs.
Transformă variabila. O altă opțiune este să transformați o variabilă deformată, astfel încât să fie mai puțin denaturată. „Transform” înseamnă a aplica aceeași funcție tuturor observațiilor unei variabile.

Descoperă cum te pot ajuta, apăsând pe butonul albastru.

Despre Lorena

Salut,

Sunt Lorena și sunt primul coach de scriere academică din România.

Sunt doctor în economie și am finalizat și un program de postdoctorat la o universitate de renume.

Din 2021 am devenit fondatoarea Diplomade10.ro.

Am fondat această școală pentru a-i ajuta pe studenți, masteranzi și doctoranzi să scape de teama de ce vor scrie în lucrare și mai ales cum vor scrie.

Este nevoie să evoluăm în domeniul cercetării, să venim cu noi soluții pentru a face o lume mai bună.

Dacă ai orice nelămuriri, te rog să-mi scrii. 

Alte postări asemănătoare