Razlaga, uporaba in primeri
The Sturges pravilo je merilo, ki se uporablja za določanje števila razredov ali intervalov, ki so potrebni za grafično predstavitev niza statističnih podatkov. To pravilo je leta 1926 zapisal nemški matematik Herbert Sturges.
Sturges je predlagal preprosto metodo, ki je temeljila na številu vzorcev x, ki so omogočili iskanje števila razredov in njihove amplitude razpona. Pravilo Sturges se pogosto uporablja predvsem na področju statistike, zlasti za izdelavo frekvenčnih histogramov.
Indeks
- 1 Razlaga
- 2 Aplikacije
- 3 Primer
- 4 Reference
Razlaga
Pravilo Sturges je empirična metoda, ki se široko uporablja v opisni statistiki za določitev števila razredov, ki morajo obstajati v frekvenčnem histogramu, da bi razvrstili niz podatkov, ki predstavljajo vzorec ali populacijo..
V bistvu to pravilo določa širino grafičnih posod, frekvenčni histogrami.
Za določitev svojega pravila je Herbert Sturges upošteval idealen frekvenčni diagram, ki je sestavljen iz K intervalov, kjer i-ti interval vsebuje določeno število vzorcev (i = 0, ... k-1), predstavljenih kot:
To število vzorcev je podano s številom načinov, na katere je mogoče izvleči podmnožico niza; to je z binomskim koeficientom, izraženo takole:
Za poenostavitev izraza je uporabil lastnosti logaritmov v obeh delih enačbe:
Tako je Sturges ugotovil, da je optimalno število intervalov k podano z izrazom:
Lahko se izrazi tudi kot:
V tem izrazu:
- k je število razredov.
- N je skupno število opazovanj vzorca.
- Log je skupni logaritem osnove 10.
Če želite na primer narediti frekvenčni histogram, ki izraža naključni vzorec višine 142 otrok, bo število intervalov ali razredov, ki jih bo imela distribucija:
k = 1 + 3,322 * log10 (N)
k = 1 + 3,322* log (142)
k = 1 + 3,322* 2,1523
k = 8,14 ≈ 8
Tako bo porazdelitev potekala v 8 intervalih.
Število intervalov mora biti vedno predstavljeno s celimi števili. V primerih, ko je vrednost decimalna, je treba narediti približek na najbližje celo število.
Aplikacije
Pravilo Sturges se uporablja predvsem v statistiki, saj omogoča porazdelitev frekvenc s pomočjo izračuna števila razredov (k), kakor tudi dolžino vsakega od teh, znanih tudi kot amplituda..
Amplituda je razlika med zgornjo in spodnjo mejo razreda, deljeno s številom razredov, in je izražena:
Obstaja veliko empiričnih pravil, ki omogočajo porazdelitev frekvence. Vendar se pravilo Sturges običajno uporablja, ker je približno enako številu razredov, ki se običajno gibljejo med 5 in 15.
Na ta način upoštevajte vrednost, ki ustrezno predstavlja vzorec ali populacijo; to pomeni, da približevanje ne predstavlja skrajnih skupin, niti ne deluje s prevelikim številom razredov, ki ne omogočajo povzemanja vzorca.
Primer
Potrebno je izvesti frekvenčni histogram v skladu z danimi podatki, ki ustreza starosti, dobljeni pri anketi moških, ki vadijo v lokalni telovadnici..
Za določitev intervalov morate vedeti, kakšna je velikost vzorca ali število opažanj; v tem primeru imate 30.
Nato velja pravilo Sturges:
k = 1 + 3,322 * log10 (N)
k = 1 + 3,322* log (30)
k = 1 + 3,322* 1,4771
k = 5,90 ≈ 6 intervalov.
Iz števila intervalov se lahko izračuna amplituda, ki jo bodo imeli; to je širina vsake vrstice, prikazane v frekvenčnem histogramu:
Spodnja meja velja za najnižjo vrednost podatkov, zgornja meja pa za najvišjo vrednost. Razlika med zgornjo in spodnjo mejo se imenuje obseg ali pot spremenljivke (R).
Iz tabele imamo, da je zgornja meja 46 in spodnja meja 13; na ta način bo amplituda vsakega razreda:
Intervali bodo sestavljeni iz zgornje in spodnje meje. Če želite določiti te intervale, začnite šteti od spodnje meje in ji dodajte amplitudo, določeno s pravilom (6), kot sledi:
Nato se izračuna absolutna frekvenca, da se določi število moških, ki ustrezajo vsakemu intervalu; v tem primeru je:
- Interval 1: 13 - 18 = 9
- Interval 2: 19-24 = 9
- Interval 3: 25 - 30 = 5
- Interval 4: 31 - 36 = 2
- Interval 5: 37 - 42 = 2
- Interval 6: 43 - 48 = 3
Pri dodajanju absolutne frekvence vsakega razreda mora biti to enako skupnemu številu vzorca; v tem primeru 30.
Nato se izračuna relativna frekvenca vsakega intervala, tako da absolutno frekvenco tega intervala delimo s skupnim številom opazovanj:
- Interval 1: fi = 9 = 30 = 0.30
- Interval 2: fi = 9 = 30 = 0,30
- Interval 3: fi = 5 = 30 = 0,1666
- Interval 4: fi = 2 = 30 = 0,0666
- Interval 5: fi = 2 = 30 = 0,0666
- Interval 4: fi = 3 = 30 = 0,10
Nato lahko naredite tabelo, ki odraža podatke, in tudi diagram iz relativne frekvence glede na dobljene intervale, kot je razvidno iz naslednjih slik:
Na ta način pravilo Sturges omogoča določanje števila razredov ali intervalov, v katerih je mogoče vzorec razdeliti, da se povzame vzorec podatkov s pripravo tabel in grafov..
Reference
- Alfonso Urquía, M. V. (2013). Modeliranje in simulacija diskretnih dogodkov. UNED,.
- Altman Naomi, M. K. (2015). "Enostavna linearna regresija." Naravne metode .
- Antúnez, R. J. (2014). Statistika v izobraževanju. Digitalni UNID.
- Fox, J. (1997). Uporabljena regresijska analiza, linearni modeli in sorodne metode. Publikacije SAGE.
- Humberto Llinás Solano, C. R. (2005). Opisna statistika in verjetnostne porazdelitve. Univerza na severu.
- Pantelejeva, O. V. (2005). Osnove verjetnosti in statistika.
- O. Kuehl, M. O. (2001). Načrtovanje eksperimentov: statistična načela načrtovanja in raziskovalne analize. Thomson Editors.