Главная > Математика > Выборочный метод
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

6.2.3. ОЦЕНКИ И ИХ СТАНДАРТНЫЕ ОШИБКИ ПРИ НЕКОТОРЫХ СПОСОБАХ РАЗМЕЩЕНИЯ ЕДИНИЦ ВЫБОРКИ

В этом параграфе мы обсудим некоторые методы размещения единиц выборки. Все приведенные здесь формулы являются частными случаями формул (6.2.16), (6.2.18), (6.2.28), (6.2.33) и получаются из них при определенном отборе

Для всех рассматриваемых здесь методов

    (6.2.37)

6.2.3.1. Расслоение с равномерным размещением единиц выборки

В простейшем случае правило отбора может быть следующим: из каждого из L слоев отбирают равное число единиц. Тогда

    (6.2.38)

При этом, если объем выборки велик, может, конечно, случиться, что для отдельных слоев , т. е. расчетное число единиц, подлежащих включению в выборку, больше общего числа единиц в слое. При подобной ситуации в соответствующем слое можно предпринять сплошное обследование, а оставшиеся единиц заново равномерно распределить между остальными слоями.

Оценки и их стандартные ошибки рассчитываются по упомянутым формулам. Введя в формулы стандартных ошибок оценок (6.2.28) и (6.2.33) значения (6.2.38), получим:

    

или при , т. е. если доля отбора в каждом слое мала,

    (6.2.40)

Формулы для стандартной ошибки оценки среднего получают, используя соотношение

    (6.2.41)

Итак,

и

    (6-2-43)

Расслоение с равномерным размещением единиц выборки близко к оптимальному (см. 6.2.3.3). Однако оно оказывается неприемлемым, если объемы различных слоев сильно отличаются друг от друга, так как это может привести к невыполнению требования (см. пример из 6.2.6).

6.2.3.2. Расслоение с пропорциональным размещением единиц выборки

В противоположность равномерному размещению при пропорциональном размещении требуется, чтобы доли отбора для всех слоев были одинаковы, т. е.

Так, например, можно потребовать, чтобы в выборку попадало 5% единиц из каждого слоя, т. е. для всех слоев Тогда доля отбора в общей выборке также равна:

Следовательно, при пропорциональном размещении способ отбора полностью описывается заданием общей доли отбора, которая совпадает с долей отбора в каждом из слоев. При 5%-ной выборке из каждого слоя также отбираются 5% единиц. Количество отбираемых единиц пропорционально объему слоя

    (6.2.46)

Легко убедиться, что при (6.2.46) требования (6.2.37) выполняются автоматически. При пропорциональном размещении (и только при нем) формулы для оценок (6.2.16) и (6.2.18) принимают вид

    (6.2.47)

и

    (6.2.48)

Если подставить (6.2.46) в общие формулы стандартных ошибок оценок [(6.2.28) и (6.2.33)], то после простых преобразований для пропорционального размещения получим:

или

    (6-2-60)

С помощью соотношения (6.2.41) или непосредственно из (6.2.28) получается выражение стандартной ошибки оценки у? суммарного значения признака:

или

    (6.2.52)

Пропорциональное размещение применяется часто из-за простоты его организации. Конечно, если объемы слоев сильно отличаются друг от друга, то объемы выборок также сильно различаются. Если кроме параметров для совокупности желательно оценить параметры отдельных слоев, то пропорциональное размещение единиц выборки может иногда дать оценки для слоев, сильно различающиеся по точности. (Пример пропорционального размещения приведен в 6.2.6.)

6.2.3.3. Оптимальное размещений

Если при заданном объеме выборки и заданном расслоении совокупности рассматривать стандартную ошибку как функцию то возникает вопрос об определении способа размещения единиц выборки по L слоям, при котором стандартная ошибка s- (или ) будет минимальной. Названная проблема представляет как теоретический, так и практический интерес, потому что с помощью соответствующего размещения единиц выборки по слоям, т. е. количества единиц, отбираемых из каждого слоя, можно повышать точность оценивания. Величины при этом предполагаются заданными.

Каждое возможное размещение единиц выборки по слоям, удовлетворяющее условию

    (6.2.53)

дает значение функции вычисляемое по формуле (6.2.33). С математической точки зрения проблема состоит в нахождении экстремального значения функции s- при дополнительном условии (6.2.53). Экстремум функции определяется с помощью метода множителей Лагранжа (см., например, [5, русский перевод, с. 113, 114], 132], [33], [6, с. 433]).

В результате получают следующую формулу для оптимального размещения единиц выборки по слоям:

    (6.2.54)

При таком размещении единиц выборки с общим объемом при заданных значениях функции оценки получаются с наименьшими стандартными ошибками. Легко убедиться, что (6.2.54) удовлетворяет условию (6.2.53).

Из формулы размещения (6.2.54) видно, что объем выборки из слоя пропорционален объему и среднему квадратичному отклонению Поэтому из слоев с большими средними квадратичными отклонениями значении признака (из менее однородных слоев) следует включить в выборку большее число единиц, чем из слоев с меньшим средним квадратичным отклонением.

Подставляя значения из (6.2.54) в общую формулу (6.2.28), после элементарных преобразований получаем формулы для вычисления стандартной ошибки оценки суммарного значения признака при оптимальном размещении:

    (6.2.56)

и

Подставляя значение из (6.2.54) в (6.2.33) и принимая во внимание условие (6.2.41), получаем формулы для определения стандартной ошибки оценки среднего значения:

    (6.2.57)

и

    

Оптимальное размещение при заданном объеме выборки приводит к самой эффективной функции оценки. При этом, однако, следует учитывать, что для применения этого способа размещения еще до проведения собственно выборочного обследования необходимо знать величины средних квадратичных отклонений Это, естественно, может затруднить или даже сделать невозможным оптимальное размещение.

При обсуждении определения необходимого объема выборки в 5.3.4.2 и 5.3.4.4 рассматривался вопрос о том, как получить информацию о величине среднего квадратичного отклонения до извлечения выборки. Предлагаемые рекомендации

дают, как правило, лишь приближенные оценки действительных средних квадратичных отклонений. Можно считать, что их использование ведет к приближенно оптимальному размещению. Расчеты, проводимые после извлечения и обследования выборки, позволяют сделать вывод о достигнутой точности и оценить, насколько выбранное размещение близко к оптимальному. Пример оптимального размещения приведен в 6.2.6.

6.2.3.4. Размещение единиц выборки при заданных расходах на обследование

Пусть С — заданный уровень общих расходов на проведение выборочного обследования, который нельзя превысить. Пусть расходы на обследование (опрос и т. д.) одной единицы выборки в слое равны . Расходы на обследование единиц выборки в слое составляют, следовательно, , а общие расходы на выборочное обследование равны: -

    (6.2.59)

— расходы, независимые от объема выборки (например, накладные расходы). Предполагается также, что расходы на одну единицу выборки различны для различных слоев.

Теперь можно поставить вопрос о подборе таких значений которые минимизируют стандартные ошибки при дополнительном условии (6.2.59), т. е. при заданном постоянном объеме расходов С. Сумма величин удовлетворяющих условию (6.2.59), не является постоянной. Поэтому речь здесь идет не о способе размещения по слоям единиц выборки фиксированного объема с соблюдением условия минимальности дисперсии оценки, а о распределении по L слоям заданного объема затрат также с соблюдением минимальности дисперсии оценки.

Математическое решение этой экстремальной задачи достигается также с помощью множите пей Лагранжа [5, русский перевод, с. 112—113]. Оптимальные значения определяются по следующей формуле:

    (6.2.60)

Если эти значения подставить в (6.2.59), то получим значение зависящее от способа размещения:

    (6.2.61)

Обе формулы приводят к оценкам с минимальной дисперсией при соблюдении дополнительного условия об неизменности общих затрат С. Применение этих формул, кроме предварительного знания величин средних квадратичных отклонений (об этом упоминалось в предыдущем параграфе), предполагает также, что известны затраты на единицу выборки во всех слоях . Различные расходы на обследование единиц различных слоев могут быть обусловлены, например, различными транспортными расходами (при территориальном расслоении) или различными размерами единиц в различных слоях (например, при расслоении предприятий производственным площадям или школ по числу учащихся).

Стандартные ошибки оценок, найденных с помощью такого способа размещения, рассчитываются по общим формулам (6.2.28) и 6.2.33).

Из равенства (6.2.60) следует, что большее число единиц должно отбираться из тех слоев, в которых расходы на обследование одной единицы меньше, и наоборот. Если расходы одинаковы во всех слоях, то формула (6.2.60) превращается в формулу оптимального размещения (6.2.54) при неизменном объем выборки.

Можно сформировать следующие целесообразные правила отбора единиц выборки из отдельных слоев, которые приводят к уменьшению расходов. Из слоя следует извлечь большую выборку, когда:

а) объем слоя больше;

б) слой неоднороден (значения средних квадратичных Отклонений больше, чем в других слоях);

в) расходы на обследование одной единицы выборки меньше.

6.2.3.5. Размещение единиц выборки по долям суммарных значений признака слоев

Не всегда до проведения выборочного обследования имеется информация о средних квадратичных отклонениях значений признака в слое которая бы позволила провести оптимальное размещение единиц выборки по слоям. Описанный далее способ позволяет вывести правило для получения размещения, близкого к оптимальному. Однако при этом не требуется знаний величин средних квадратичных отклонений или их оценок. Мы заранее предполагаем, что коэффициенты вариации значений признака во всех слоях равны или приблизительно равны:

Оценка суммарного значения признака у единиц слоя при прямом оценивании составляет Поэтому (6.2.62) можно переписать следующим образом:

    (6.2.63)

или

    (6.2.64)

Если это выражение ввести в формулу для оптимального размещения (6.2.54), то получим:

Применение этой формулы предполагает знание долей суммарных значений признака у единиц отдельных слоев в марном значении признака для совокупности (или знание оценок этих долей). Эти доли могут быть приближенно

известны из предыдущих обследований. Стандартные ошибки оценок, полученных по выборкам объемов должны рассчитываться по общим формулам (6.2.28) или (6.2.33).

<< Предыдущий параграф Следующий параграф >>
Оглавление