Асимптотична оптималност на Bootstrap оценки - Разработване на проект на методи за оценка на показатели

Асимптотична оптималност на Bootstrap оценки

Помислете за проблема с оценката на функцията за разпределение F за извадка с размер n от. За простота приемаме, че функцията за разпределение F и оценката принадлежат на някакво пространство Z на функции на линията, което е оборудвано с нормата || * ||. В този случай загубите от приемане на оценката, когато истинската функция на разпределение е F, се измерват с величината, където l е монотонна не намаляваща функция на множеството неотрицателни числа. Например можете да измервате загубите с или. Рискът от оценка е средната стойност на загубите, т.е. ... За да се изключи появата на т. Нар. Свръхефикасни оценки, се въвежда минимален риск, където V е квартал на (неизвестно истинско разпределение) във F. Оценката се нарича локален асимптотичен минимум, ако в границата при него минималният риск над всеки достатъчно малък квартал V се оказва по-малък от този на която и да е друга оценка, т.е.

Свойството на локалната асимптотична минимакситност за оценката по правило ще бъде валидно за друга оценка, отклоняваща се от нея с, т.е. (по вероятност).

За много проблеми с оценката на функциите (не само функциите на разпределение), долните граници на асимптотичния риск на оценките са описани чрез информационно неравенство на формата

По-визуална форма на последното твърдение, която го доближава до класическите информационни неравенства, се получава, ако отидем до границата над кварталите V, свиващи се към (неизвестното вярно, по-скоро произволно) разпределение F 0:

Ето един гаусов процес с непрекъснати траектории, който има нулева средна стойност и ковариация, определени от формата на оценяваната функция и степента на априорна несигурност в разпределението на наблюденията. Така че, в проблема за непараметричната оценка на функцията на разпределение с обща несигурност на разпределение, това е добре известен Браунов мост с ковариационна функция на формата

тук е минимумът от t, s. Позволявам да бъде bootstrap версията на емпиричния процес,

където е емпиричната функция на разпределение, конструирана от извадка от бустрастрап с обем m от разпределението .

Беран обмисли тази ситуация. Да предположим, че статистика със свойството на асимптотична нормалност се изгражда от независима повтаряща се проба X n с размер n. По-точно, има поредица от функционали, за които се осъществява сближаване в разпределението, т.е. - оценка на функционалното в зависимост от n. Беран въведе редица аналитични предположения, които означават, че функцията на разпределение на случайната променлива допуска асимптотично разширение от първи ред (от типа на разширяването на Edgeworth) равномерно във функцията на разпределение F от малък квартал на произволно истинско разпределение F 0 . По този начин Беран използва приблизително приближение и по-точно приближение

Тук коефициентите k (F), (F) и b (F) зависят от неизвестното разпределение F и удовлетворяват някои допълнителни предположения. Имайте предвид, че това е стандартното отклонение на статистиката. Еднородността на такова разширение означава, че за достатъчно малка околност V на (неизвестно) произволно разпределение F 0, остатъкът не само клони към нула при, но удовлетворява условието

При тези предположения Беран описва долните граници на асимптотичния риск по отношение на функцията за загуба на формата, където е конволюцията на функцията W с някаква абсолютно непрекъсната функция на разпределение V.

Дясната страна на това неравенство съдържа Гаусов процес

където е неслучайно количество в зависимост от неизвестното разпределение F; - неслучайна функция на вида; Z - стандартна нормална случайна променлива.

Оценката за функцията на разпределение има свойството на локален асимптотичен минимум. По-специално, оценката на bootstrap отговаря на тези условия. Освен това, за оценката на bootstrap, процесът слабо се сближава с процес на Гаус, по отношение на който са описани долните граници на асимптотичния риск. Използвайки разширението на Edgeworth (2.2.2), може да се заменят техните оценки вместо неизвестните коефициенти. Оценката на функцията за разпределение, получена по този начин, се различава от оценката на bootstrap със стойността и има същите асимптотични свойства. На практика обаче този подход може да доведе до известни неудобства, тъй като оценката, използваща разширението на Edgeworth, може да не е функция на разпределение, т.е. тя ще приписва отрицателни вероятности на някои събития, но с увеличаване на размера на извадката този ефект ще бъде все по-малко забележим.

Беран обясни и парадокс, известен при анализа на данните. Изглежда така. ако функцията на разпределение при е приблизително равна на (тук е функцията на разпределение на стандартната нормална стойност), тогава оценката, където е оценката на количеството, появяващо се в (21), също изглежда напълно приемлива. Всъщност нормализираното отклонение при се сближава слабо към процеса, където е някаква неслучайна функция, определена от истинската функция на разпределение. По-специално, ако разпределението има ненулев коефициент на изкривяване или оценката е предубедена, функцията е ненулева. В този случай резултатите показват, че асимптотичният риск на оценката надвишава асимптотичния риск на оценката на bootstrap.

Резултатите на Беран изясняват теоретичните свойства на процедурите за зареждане. Въпросът е, че много процедури за изграждане на приблизителни интервали на доверие по същество се основават на оценки на функцията на разпределение и функционалните функции на. [12], [14]