Приложна статистика Проверка на хомогенността на две биномни проби

Част 1. Основи на приложната статистика

1.3.3. Проверка на хомогенността на две биномни проби

Посочената по-долу декларация за проблема по отношение на приложната статистика е следната. Разглежда се въпрос с два възможни отговора, например „да“ и „не“. В първата група на n1 интервюиран m1 лицето каза да, а във втората група на n2 интервюиран м2 каза да. Вероятностният модел предполага това m1 и м2 - биномни случайни променливи B (n1 , p1) и B (n2 , p2) съответно. (Запис B (n, p) означава, че случайната променлива м, биномиално разпределени B (n, p) с параметри н - размер на извадката и стр - вероятността за определен отговор (да речем, отговорът "да") може да бъде представена като м = X1 + X2 + ... + Xn , където случайни променливи X1, X2, ..., Xn са независими, еднакво разпределени, вземат две стойности 1 и 0 и P (Xi = 1) = p, P (Xi = 0) = 1-p, i = 1,2, ..., n.)

Хомогенността на две групи означава, че съответните вероятности са равни, хетерогенността означава, че тези вероятности са различни. По отношение на приложната математическа статистика: хипотезата за хомогенност трябва да бъде проверена

при алтернативна хипотеза

Н1 : p1 p2 .

(Понякога едностранчиви алтернативни хипотези и представляват интерес.)

Оценка на вероятността p1 е честотата p1 * = m1/n1, и вероятностната оценка p2 е честотата p2 * = m2/n2 . Дори вероятностите да съвпадат p1 и p2 честотите обикновено са различни. Както се казва, „по чисто случайни причини“. Помислете за случайна променлива p1 * - p2 *. Тогава

От теоремата на Moivre-Laplace и теоремата за наследяването на конвергенцията следва (глава 1.4 и [4, т. 2.4]), че

където е функцията на стандартното нормално разпределение с математическо очакване 0 и дисперсия 1. За практическото приложение на тази връзка, неизвестната статистика на дисперсията на честотната разлика трябва да бъде заменена с оценката на тази дисперсия:

(Могат да се използват и други оценки на разглежданата дисперсия, например въз основа на обединената проба). Използвайки горната математическа техника, може да се покаже, че

1. Изчислете статистика

2. Сравнете стойността на статистиката на модула |Q | с гранична стойност К. Ако | Q | К, след това декларирайте липсата на хомогенност и приемете алтернативната хипотеза Н1 .

Гранична стойност ДА СЕ се определя от избора на нивото на значимост на статистическия критерий за тестване на хомогенност. От горните гранични отношения следва, че ако хипотезата за хомогенност е валидна, Н0 за нивото на значимост, което имаме (за

Следователно граничната стойност, в зависимост от нивото на значимост, е препоръчително да се избере от условието

Пример 2. Да предположим, че 200 в първата група от 500 респонденти отговориха с "да", докато във втората група от 700 респонденти казаха "да"?

Нека премахнем термина „генерална съвкупност“ от формулирането на примера. Получаваме следната настройка.

Да предположим, че от 500 интервюирани мъже отговориха „да, харесвам Pepsi-Cola“ 200, а от 700 интервюирани жени 350 казаха „да, харесвам Pepsi-Cola“. Има ли разлика между мъжете и жените в дела на тези, които отговарят с "да" на въпроса за любовта към Пепси-Кола?

В разглеждания пример стойностите, необходими за изчисления, са както следва: Нека изчислим статистиката

Тъй като |Въпрос:| = 3,45> 1,96, тогава е необходимо да се отхвърли нулевата хипотеза и да се приеме алтернативата. По този начин мъжете и жените се различават на базата на въпроса - любовта към Pepsi-Cola.

Трябва да се отбележи, че резултатът от тестването на хипотезата за хомогенност зависи не само от честотите, но и от размера на пробата. Нека приемем, че честотите (фракциите) са фиксирани и размерите на пробите растат. Тогава числителят на статистиката Въпрос: не се променя и знаменателят намалява, което означава, че цялата дроб се увеличава. Тъй като знаменателят клони към 0, фракцията нараства до безкрайност и рано или късно ще надмине всяка граница. Има само едно изключение - когато числителят е 0. Следователно, при строг подход към формулировките, изходът на статистиката трябва да изглежда така: „намерена е разлика“ или „не е намерена разлика“. Във втория случай разликата може да е била открита при увеличаване на размера на извадката.

Както и за оценка на доверието на вероятността, VTsIOM разработи две полезни таблици за оценка на допустимите несъответствия между честотите в групи, причинени от чисто случайни причини. Тези таблици се изчисляват, когато е изпълнена нулевата хипотеза за хомогенност и съответстват на ситуации, когато честотите са близки до 50% (таблица 10) или 20% (таблица 11). Ако наблюдаваните честоти са от 30% до 70%, тогава се препоръчва да се използва първата от тези таблици, ако от 10% до 30% или от 70% до 90%, то втората. Ако наблюдаваните честоти са по-малко от 10% или повече от 90%, тогава теоремата на Moivre-Laplace и асимптотичните формули, базирани на нея, дават не много добри приближения, препоръчително е да се използват други, по-усъвършенствани математически средства, по-специално приближения използвайки разпределението на Поасон.

Допустими несъответствия (в%) между честотите в двете групи, когато се наблюдават честоти от 30% до 70%

Допустими несъответствия (в%) между честотите в две групи, когато се наблюдават честоти от 10% до 30% или от 70% до 90%

При условията на примера, обсъден по-горе, Таблица 10 дава приемливо несъответствие от 7%. Всъщност обемът на първата група 500 отсъства в таблицата, но редовете, съответстващи на обемите 400 и 600, съвпадат за първите две колони вляво. Тези колони съответстват на обемите от втората група 750 и 600, между които е даден обемът 700 в примера. Той е по-близо до 750, така че приемаме стойността на несъответствието в пресечната точка на първата колона и втория (и трети) редове, т.е. 7%. Тъй като реалното несъответствие (10%) е по-голямо от 7%, заключаваме, че има значителна разлика между групите. Естествено, това заключение съвпада с получения по-рано метод за изчисление.

Както в таблица 5, стойностите в таблици 10 и 11 са малко по-високи от тези, изчислени по горните формули. Както и преди, фактът е, че таблиците VTsIOM не са свързани с нивото на значимост, а с нивото на значимост, на което съответства граничната стойност от 2.58.

Допустимото несъответствие между честотите е лесно да се получи чрез изчисление. За да направите това, просто използвайте формулата за статистика Въпрос: и да се определи при каква максимална несъответствие на честотата все още се стига до заключението, че хипотезата за хомогенност е вярна. Следователно допустимото несъответствие се намира от уравнението

Например 2 данни = 1,96 0,029 = 0,057 или 5,7% за ниво на значимост 0,05.

За други нива на значимост трябва да се използват различни коефициенти., К(0,01) = 2,58 за ниво на значимост от 1% и K (0,10) = 1,64 за ниво на значимост от 10%. Например данни = 2,58 0,029 = = 0,7482 0,075 или 7,5% за ниво на значимост 0,01. Закръгляването до най-близкия цял процент дава 7%, както при използване на Таблица 7 по-горе.

Анализът на таблици 10 и 11 показва, че за да се установят разликите, честотите трябва да се различават най-малко с 6%, а при някои размери на пробите - с повече от 10%, със 100 и 100 размера на пробите - с 19%. Ако честотите се различават с 5% или по-малко, можем веднага да кажем, че статистическият анализ ще доведе до заключението, че не е открита разлика (за проби с обеми не повече от 750).

В тази връзка възниква въпросът: каква е типичната разлика в честотите в две проби от една и съща популация? Честотната разлика в този случай има нулево математическо очакване и дисперсия

Количеството R(един-R) достига максимум при R= 1/2, а този максимум е 1/4. Ако R= 1/2, а обемите на двете проби съвпадат и са равни на 500, тогава дисперсията на честотната разлика е

Следователно стандартното отклонение е 0,032, или 3,2%. Тъй като за стандартна нормална случайна променлива в 50% от случаите нейната стойност не надвишава 0,67 по абсолютна стойност (а в 50% от случаите е повече от 0,67), тогава типичният спред е 0,67, а в този случай - 2,1%. Горните съображения позволяват да се изгради метод за наблюдение на коректността на повторните интервюта. Ако честотите са твърде стабилни, стойностите при многократни анкети са твърде близки - това е подозрително! Може би са нарушени правилата за провеждане на анкети, извадките не са случайни и т.н.