Главная > Математика > Выборочный метод
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

4.2. РАСПРЕДЕЛЕНИЕ ОЦЕНОК

При случайном отборе единиц выборки каждая единица совокупности имеет определенную вероятность быть отобранной. Так как заранее неизвестно, какие единицы будут отобраны, то неизвестно и какие значения будут получены в результате выборки.

Если совокупность содержит N единиц, а в выборку должно входить единиц, то всего возможно

Каждая из выборок имеет одинаковую вероятность быть отобранной, равную

Хотя на практике, как правило, извлекается и используется одна выборка, с теоретической точки зрения интересно, что число возможных выборок чрезвычайно велико.

Пусть должна быть взята выборка объема из совокупности объема Количество возможных выборок (подмножеств из элементов) равно тогда:

Чтобы получить представление о величине этого числа, мы грубо оценим его снизу. Уменьшим числитель, заменив все 10 сомножителей на 1000, и увеличим знаменатель, заменив все 9 сомножителей числом 10. Тогда получим:

Итак, количество возможных выборок больше, чем (десять с 21 нулем!). Вероятность того, что будет извлечена некоторая фиксированная выборка, таким образом, меньше

Каждому возможному вектору результата соответствует сдно значение функции оценки, одна оценка. Так как значение первой случайно отобранной единицы выборки представляет собой реализацию случайной величины и аналогично все другие значения

также являются реализациями случайных величин, то функция оценки — также случайная величина, а конкретная оценка, следовательно, — реализация случайной величины. Закон распределения непрерывной случайной величины задается в виде плотности и функции распределения вероятностей. Закон распределения дискретной случайной величины задается в виде ряда распределения вероятностей и функции распределения. Если Z — случайная величина, а - определенное её значение, то функция распределения определяется следующим образом:

показывает вероятность того, что случайная величина принимает значение, не превышающее (т. е. меньшее или равное) фиксированной величины z. Для вероятности случайного события А мы применяем здесь обозначение ; обычного обозначения Р (А) мы будем избегать, так как символ Р в теории выборки обозначает определенный параметр совокупности.

Знание функции распределения случайной величины позволяет ответить на два вопроса, важных как для математической статистики, так и для теории выборки:

а) Какова вероятность того, что случайная величина примет некоторое фиксированное значение (в дискретном случае) или же будет находиться внутри некоторого интервала (интервалов)?

б) Как велики интервалы, внутри которых случайная величина будет находиться с некоторой заранее заданной вероятностью?

Если в случае а) интервалы (т. е. события) заданы и с помощью функции распределения определяются соответствующие

вероятности, то и случае б) ищутся интервалы (события), соответствующие заданным вероятностям.

Пусть — действительные числа, такие, что Интервал определяет случайное событие, состоящее в том, что случайная величина Z принимает значения внутри этого интервала, т. е. ее реализации удовлетворяют неравенству

Рис. 1. Функция плотности непрерывной случайной величины

Если — функция распределения случайной величины со свойствами

то

т. e. вероятность попадания случайной величины в интервал при заданной функции распределения легко вычисляется (см. рис. 1, 2), она равна разности значений функции распределения на концах этого интервала.

Из равенства (4.7) можно получить следующие выражения:

Равенство (4.8) позволяет определить вероятность того, что случайная величина превосходит некоторую границу, вероятность того, что случайная величина не превышает ее. В случае б), как правило, задается вероятность превышения или непревышения некоторой границы (или

обе сразу) и определяются границы (или граница), которые нм соответствуют.

Равенства (4.5)-(4.9) описывают общие свойства функции распределения случайной величины. Они не дают нам сведений о конкретном виде функции распределения оценок, которые мы можем получить в результате исследования выборки.

Рис. 2. Функция распределения непрерывно» случайной величины

Фундаментальное значение для теории выборки имеет центральная предельная теорема математической статистики, которая дает ответ на этот вопрос.

В упрощенном виде центральная предельная теорема математической статистики формулируется следующим образом.

Пусть — независимые, произвольно, но одинаково распределенные случайные величины с математическим

ожиданием Z и дисперсией . Тогда при больших :

сумма этих случайных величин нормально распределена с математическим ожиданием и средним квадратичным отклонением

среднее нормально распределено с математическим ожиданием Z и стандартным отклонением

В конкретных случаях следует, естественно, указывать, какие значения можно считать большими.

В последующих главах мы покажем, что функции выборки, как правило, представляют собой суммы случайных величин и поэтому к оценкам применима центральная предельная теорема. Математическое ожидание и дисперсия нормально распределенных случайных величин могут принимать любые значения. Однако по формуле (4.10) любую случайную величину можно преобразовать так, что ее математическое ожидание станет равным 0, а стандартное отклонение будет 1. Тогда говорят о стандартизованной нормально распределенной случайной величине. Такую величину обозначают как (Здесь N указывает на нормальное распределение. Не путать с объемом совокупности!)

Пусть — случайная величина с математическим ожиданием Z и дисперсией . Тогда

будет случайной величиной с математическим ожиданием 0 и дисперсией 1.

Известная симметричная форма нормального распределения, называемого часто распределением Гаусса, изображена на рис. 3 и 4.

Рис. 3. Нормальное распределение. Функция плотности . Функция распределения

Рис. 4. Нормальное распределение. Соотношение между функцией распределения и функцией

Таблицы нормального распределения содержат реличины функции, плотности а также функции распределения или применяемые для некоторых целей площади над интервалом от О до и. Очевидно, что

и

В табл. 4.2 приведены выдержки из таблицы нормального распределения, показывающие некоторые значения функций в зависимости от и. Рис. 5 иллюстрирует

Таблица 4.2. Площади под кривой нормального распределения

соотношение между вероятностями попадания нормально распределенной случайной величины в интервалы и шириной этих интервалов, выраженных в долях а.

Рис. 5. Нормальное распределение

<< Предыдущий параграф Следующий параграф >>
Оглавление