Правило за повторения: Обяснение, приложения и примери

Правилото Sturges е критерий, използван за определяне на броя на класовете или интервалите, които са необходими за графично представяне на набор от статистически данни. Това правило е обявено през 1926 г. от германския математик Херберт Стюргес.

Sturges предлага един прост метод, базиран на броя на пробите x, които позволяват намирането на броя на класовете и тяхната амплитуда на обхвата. Правилото Sturges се използва широко в областта на статистиката, по-специално за изграждане на честотни хистограми.

обяснение

Правилото Sturges е емпиричен метод, широко използван в описателната статистика, за да се определи броят на класовете, които трябва да съществуват в честотната хистограма, за да се класифицира набор от данни, които представляват извадка или популация.

По принцип това правило определя ширината на графичните контейнери, на честотните хистограми.

За да установи своето правило, Херберт Стургес разглежда идеалната честотна диаграма, която се състои от К интервали, където i-тият интервал съдържа определен брой проби (i = 0, ... k-1), представени като:

Този брой проби се дава от броя на начините, по които може да се извлече подмножество от набор; т.е. чрез биномиалния коефициент, изразен както следва:

За да опрости израза, той прилага свойствата на логаритмите в двете части на уравнението:

По този начин Sturges установява, че оптималният брой интервали k се дава от израза:

Тя може да се изрази и като:

В този израз:

- k е броят на класовете.

- N е общият брой наблюдения в извадката.

- Log е логаритъмът на общата база 10.

Например, за да направите честотна хистограма, която изразява случайна извадка от височината на 142 деца, броят на интервалите или класовете, които разпределението ще има, е:

k = 1 + 3, 322 * log 10 (N)

k = 1 + 3, 322 * log (142)

k = 1 + 3, 322 * 2, 1523

k = 8.14 ≈ 8

Така разпределението ще бъде в 8 интервала.

Броят на интервалите винаги трябва да бъде представен с цели числа. В случаите, когато стойността е десетична, трябва да се направи приближение до най-близкото цяло число.

приложения

Правилото на Sturges се прилага главно в статистиката, тъй като позволява да се извършва честотно разпределение чрез изчисляване на броя на класовете (k), както и дължината на всяка от тях, известна също като амплитуда.

Амплитудата е разликата между горната и долната граница на класа, разделена на броя на класовете, и се изразява:

Има много емпирични правила, които позволяват да се направи честотно разпределение. Правилото Sturges обаче обикновено се използва, тъй като е приблизително с броя на класовете, които обикновено варират от 5 до 15.

По този начин, помислете за стойност, която адекватно представя извадка или население; сближаване не представлява екстремни групировки, нито работи с прекомерно голям брой класове, които не позволяват обобщаване на извадката.

пример

Необходимо е да се извърши честотна хистограма според дадените данни, които съответстват на възрастта, получена при изследване на мъже, които правят упражнения в местна фитнес зала.

За да определите интервалите, трябва да знаете какъв е размерът на пробата или броя на наблюденията; в този случай имате 30.

Тогава важи правилото Sturges:

k = 1 + 3, 322 * log 10 (N)

k = 1 + 3, 322 * log (30)

k = 1 + 3, 322 * 1, 4771

k = 5, 90 - 6 интервала.

От броя на интервалите може да се изчисли амплитудата, която те ще имат; т.е. ширината на всеки бар, представен в честотната хистограма:

Долната граница се счита за най-ниската стойност на данните, а горната граница е най-високата стойност. Разликата между горната и долната граница се нарича обхват или път на променливата (R).

От таблицата имаме, че горната граница е 46 и долната граница 13; по този начин амплитудата на всеки клас ще бъде:

Интервалите ще се състоят от горна и долна граница. За да определите тези интервали, започнете да броите от долната граница, като добавите към нея амплитудата, определена по правило (6), както следва:

Тогава абсолютната честота се изчислява, за да се определи броят на мъжете, съответстващи на всеки интервал; в този случай това е:

- Интервал 1: 13 - 18 = 9

- Интервал 2: 19 - 24 = 9

- Интервал 3: 25 - 30 = 5

- Интервал 4: 31 - 36 = 2

- Интервал 5: 37 - 42 = 2

- Интервал 6: 43 - 48 = 3

Когато се добавя абсолютната честота на всеки клас, тя трябва да бъде равна на общия брой на извадката; в този случай, 30.

Впоследствие се изчислява относителната честота на всеки интервал, като абсолютната честота на този интервал се разделя на общия брой наблюдения:

- Интервал 1: fi = 9 = 30 = 0.30

- Интервал 2: fi = 9 = 30 = 0.30

- Интервал 3: fi = 5 = 30 = 0.1666

- Интервал 4: fi = 2 = 30 = 0.0666

- Интервал 5: fi = 2 = 30 = 0.0666

- Интервал 4: fi = 3 = 30 = 0.10

След това можете да направите таблица, която отразява данните, както и диаграмата от относителната честота по отношение на получените интервали, както се вижда от следните изображения:

По този начин правилото Sturges позволява да се определи броят на класовете или интервалите, в които една извадка може да бъде разделена, за да се обобщи извадка от данни чрез изготвянето на таблици и графики.