Определяне на необходимия размер на пробата

Извиква се средната стойност на даден признак, изчислена за цялата генерална популация общо средно и обозначени .

Извиква се средната стойност на характеристиката, изчислена от извадката примерна средна стойност и обозначени .

Общата дисперсия и дисперсията на пробата се определят по подобен начин. .

Изчисляване на средната стойност на пробата за различни проби със същия размер н от една обща популация може да се отбележи, че тази стойност не съвпада с общата средна стойност и варира от проба до проба. Причината е по-малкият размер на извадката в сравнение с общата популация

Средна грешка при вземане на проби м се нарича стандартно отклонение на всички х възможни стойности на средната стойност на пробата от общата средна стойност.

Средната грешка в извадката характеризира средната стойност на възможните несъответствия между извадката и общата средна стойност.

Случайно повторно вземане на проби

.

При случаен неповторен избор

,

Където н - обемът на общото население;

н - размер на извадката.

Ако функцията е алтернативна и w Е делът на единиците в извадката с характеристика и е делът на единиците, които нямат характеристика, тогава дисперсията на характеристиката е .

Средна грешка при вземане на проби за фракция при случайно повторно вземане на проби

.

Средна грешка в извадката за фракция при произволно вземане на проби без повторение

.

С увеличаване на размера на извадката средната грешка на извадката намалява.

Като се има предвид, че е невъзможно точно да се оцени изследвания параметър на генералната съвкупност въз основа на извадково проучване, е необходимо да се намерят границите, в които той се намира. Всяко отклонение от м има определена вероятност. Познавайки средната грешка на извадката, с известна вероятност е възможно да се оцени отклонението на средната стойност на извадката от общата средна стойност и да се установят границите, в които се намира изследваният параметър в общата съвкупност.

Пределна грешка вземане на проби д дефинирани във фракции от средната грешка

,

Където т - коефициентът на доверие, в зависимост от вероятността P, с които се определя максималната грешка при вземане на проби.

Вероятност P се определя от специални таблици, в които се изчислява като функция т според формулата

.

Като се има предвид вероятността P, можете да намерите фактора на доверие т. Това ни позволява да твърдим, че с вероятност P общата средна стойност е в рамките

.

При тази вероятност е 0,997.

Обратният проблем също може да бъде решен: чрез задаване на пределната грешка на извадката, определете вероятността, с която тя може да бъде гарантирана. При това. Да знаеш д и м, първо намерете фактора на доверието

,

и след това, според таблицата, желаната стойност на вероятността.

При случайно повторно вземане на проби пределната грешка при вземането на проби е

.

Оттук можете да намерите необходимия размер на извадката

.

По този начин, за да се определи необходимия размер на извадката, трябва да се посочи нейната пределна грешка и вероятността тази грешка да не надвиши определената граница. В съответствие с тази вероятност коефициентът на доверие се намира от таблицата т.

Най-трудно е да се определи дисперсията на изследваната черта в общата популация. Тъй като при голям размер на извадката дисперсията на пробата е близка до общата дисперсия, дисперсията на пробата се използва вместо общата дисперсия.

Общата дисперсия може да бъде оценена чрез познаване на коефициента на вариация въз основа на резултатите от предишното наблюдение

%.

Оттук следва, че общата дисперсия е

.

В случай на произволен неповторен избор, размерът на извадката се определя по формулата

.

Ако в резултат на извадково проучване е необходимо да се установи делът на единиците с определена стойност на алтернативната характеристика, тогава дисперсията за пропорцията ще бъде равна на pq. В този случай размерът на извадката се определя по формулата

.

Ако частта от единиците стр, с характеристика е неизвестна, тогава те се вземат, докато стойността на дисперсията на алтернативната характеристика е максимална.

Ако размерът на пробата, тогава пробата се нарича малка. В този случай е необходимо, първо, във формулата за средна грешка в знаменателя да се замени н На н-1, т.е. извършват изчисления по формулата

,

второ, когато намирате вероятността за допускане на една или друга грешка, използвайте таблиците на разпределението на Student.