Главная > Математика > Выборочный метод
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.2.4. ОПРЕДЕЛЕНИЕ ОБЪЕМА ВЫБОРКИ ПРИ ОЦЕНИВАНИИ ДОЛИ И ЧИСЛА ЕДИНИЦ С ОПРЕДЕЛЕННЫМ ПРИЗНАКОМ

В предыдущих параграфах наша цель состояла в том, чтобы по результатам выборки дать оценки характеристик всей совокупности, а также определить количественную меру точности этих оценок. Объем выборки при этом в общем считался фиксированным, хотя и было ясно, что он существенно влияет на точность оценок.

При планировании выборочного обследования задача состоит в том, чтобы избежать как недостаточной для принятия соответствующих решений точности результатов,

так и чрезмерной точности, получение которой связано с большими затратами и которая вовсе не требуется.

В данном параграфе описываются способы определения объема выборки с таким расчетом, чтобы результат (оценки долей и (или) числа единиц с определенным признаком) удовлетворял заранее заданным требованиям и точности.

5.2.4.1. Показатели точности оценивания

Возможность неточности оценки (ее несоответствия действительному значению оцениваемого параметра) вытекает из ее характера как реализации случайной величины. Поэтому в качестве показателя точности оценивания, т. е. количественной меры возможного отклонения оценки от действительного, или истинного, значения параметра, могут рассматриваться показатели рассеяния случайной величины. При этом существенно следующее требование: показатель точности должен быть содержательно интерпретируем. Его численное значение как основа для планирования выборочного обследования устанавливается, как правило, не специалистами по выборочному методу, а потребителями результатов обследования.

Мы обсудим следующие количественные меры точности, в основе которых лежит стандартная ошибка:

а) Стандартная ошибка соответственно Интерпретация: она показывает порядок величины возможного отклонения оценки от параметра; в случаев действительное отклонение оценки меньше стандартной ошибки. Вероятность появления большего отклонения составляет примерно . Стандартная ошибка дает реальное представление о возможной ошибке выборки.

б). Предельная ошибка выборки . Это практически максимальное ожидаемое отклонение оценки от параметра. Только редко, с вероятностью а, может появиться отклонение (ошибка выборки), которое будет больше, чем или . Вероятность а выбирается настолько малой, что при однократной реализации

можно пренебречь возможностью появления отклонения, превышающего предельную ошибку выборки.

в) Величина доверительного интервала соответственно Она представляет собой диапазон, в котором заключен неизвестный параметр.

г) Показатель относительной точности: относительная стандартная ошибка (коэффициент вариации оценки) соответственно

Показатели точности, указанные в пунктах а), б), в), можно разделить на математическое ожидание случайной величины. Таким образом, мы получим меры относительной точности, которые показывают, на сколько процентов оценка вероятно или максимально может отклоняться от параметра.

5.2.4.2. Определение объема выборки при заданной абсолютной точности

Стандартные ошибки оценок рассчитываются соответственно по формулам (5.2.14) и (5.2.15). Если считать величину заранее заданной, исходя из требований к точности, то из этих формул можно определить значение , которое как раз и дает желаемую величину стандартной ошибки.

Действительно, предполагая величины N и Р известными и решая уравнение (5.2.14)

относительно , после некоторых преобразований получим:

Эта формула будет служить исходным пунктом для наших дальнейших рассуждений. Объем выборки зависит от величин Р и N и, кроме того, от стандартной ошибки и увеличивается с ее уменьшением, т. е. с увеличением степени требуемой точности.

Формулу (5.2.32) можно упростить, сделав приемлемое, как правило, предположение о том, что так

как объем совокупности достаточно велик. Тогда получаем:

Чтобы получить формулу для определения необходимого объема выборки в случае, когда требование к степени точности задано в виде предельной ошибки выборки можно воспользоваться равенством

и выразить из него п. После некоторых преобразований получаем:

или при

Эти формулы можно также получить непосредственно из формул (5.2.33), заменяя в них на

Пример. Из совокупностей объема N = 1000, 5000, 10 000, 20 000, 50 000 и , в которых доля единиц с определенным признаком составляет необходимо извлечь выборки такого объема, чтобы стандартная ошибка доли в выборке составляла Каков должен быть объем выборки для разных объемов совокупности, чтобы необходимая степень точности была каждый раз соблюдена?

Решение. Подставляя в формулу (5.2.33), получаем результаты, приведенные в табл. 5.8.

Таблица 5.8

Из этого примера видно, что:

при прочих равных условиях объем выборки, необходимый для соблюдения заданной степени точности, растет с увеличением

увеличение объема выборки непропорционально увеличению объема совокупности; удвоение совокупности, например, не влечет за собой удвоения объема выборки;

объем выборки стремится к некоторому пределу, которого он не может превысить;

подстановка в формулу (5.2.33) приводит к объему выборки, превышающему необходимый. При этом соблюдаются «рамки надежности».

Предельный объем выборки при равен:

Если не учитывать объема совокупности и использовать для расчета объема выборки (5.2.36), то мы всегда получим больший объем, чем по формуле (5.2.33). Однако лишь объем выборки, рассчитанный по формуле (5.2.36), может обеспечить требуемую степень точности при любом объеме совокупности. Соблюдение «рамок надежности» гарантируется. В тех случаях, когда точное значение объема совокупности неизвестно, достаточно оценить его «сверху» («N не больше, чем ...») неиспользованием полученного таким образом значения N рассчитать объем выборки. В исключительных случаях, когда нет никакой информации о величине N, следует применять формулу (5.2.36), т. е. в основу отбора положить предельные значения объема выборки. Однако если N не очень велико, то расчет по формуле (5.2.36) может привести к объему выборки, значительно отличающемуся от действительно необходимого. Иногда это приводит даже к бессмысленным результатам.

Заменяя в формуле (5.2.36) стандартную ошибку предельной ошибкой выборки получим формулу

    (5.2.37)

для определения объема выборки, если требование к степени точности задано в виде предельной ошибки доли и вероятности а.

Пример. Путем выборочного опроса следует среди определенной группы населения определить долю домохозяйств, которые на данный момент не имеют холодильника. Предельная ошибка выборки должна быть не больше 0,01 с вероятностью Можно предполагать (см. далее), что истинная доля Каков должен быть объем выборки?

Получаем:

т. е.

Если же в этом примере не учитывать объема совокупности, то формула (5.2.36) приводит к бессмысленному результату:

При применении формул для расчета объема выборки возникает еще целый ряд проблем. Эти формулы, кроме N и показателя точности (соответственно ), содержат долю Р интересующего пас признака, которая на стадии планирования выборочного обследования, естественно, неизвестна. Кроме того, выборочное обследование, как правило, не предпринимается для изучения одного признака. Напротив, исследуется множество свойств единиц совокупности. С помощью одной выборки определенного объема, таким образом, получают и множество оценок. Не все признаки должны быть обследованы с одинаковой точностью; расчет необходимого объема выборки должен дать поэтому разные результаты для каждого обследуемого признака.

Формулы для объема выборки содержат произведение . Это произведение симметрично относительно и достигает максимума также при (см. табл. 5.9). Если истинное значение Р неизвестно, но на основе предыдущих обследований той же или аналогичной

Таблица 5.9

совокупности имеются оценки величины Р, то в формулы можно вводить значения Р, взятые с некоторым запасом в сторону увеличения к 0,5. Подобная аппроксимация исследуемой доли числом, более близким к 0,5, возможна, как правило, при наличии определенных знании об обследуемой совокупности. Если же никаких сведений о возможной величине параметра Р нет, то в формулу можно подставить значение и получить завышенное (в зависимости от Р) значение ; в этом случае выборочное обследование ни при каких Р не дает точности меньше требуемой.

Часто при планировании выборочных обследований в основу кладут известное значение Р. Тогда требования предъявляются к точности оценки этого параметра. Задача в этом случае формулируется следующим образом: определить объем выборки так, чтобы для некоторого значения Р (например, получить его оценку с заданной точностью (например, ). Для некоторых параметров, оцениваемых с помощью выборки, этот путь приводит к разумным результатам.

Обычно обследуются несколько признаков совокупности. Если для каждого признака рассчитывать необходимый объем выборки (разные признаки обычно оцениваются с различной степенью точности), то поручится набор значений п. В этом случае следует найти некоторый разумный способ согласования этих значений, положив, например, в основу либо максимальное значение (и тогда остальные признаки оцениваются «слишком точно»), либо объем выборки, рассчитанный для главного признака.

5.2.4.3. Определение объема выборки при заданной относительной точности

Иногда бывает целесообразно точность результатов выборки выражать в относительных величинах, это облегчает сравнение различных данных. Нужно, например, по-разному относиться к стандартной ошибке оценки параметра и равной (по абсолютной величине)

стандартной ошибке оценки параметра . В первом случае коэффициент вариации

т. е. стандартная ошибка составляет только 5% оцениваемого параметра, в то время как при том же значении стандартной ошибки во втором случае получаем

Коэффициент вариации оценки числа единиц с определенным признаком совпадает с коэффициентом вариации оценки доли Р, так как поэтому

    (5.2.38)

Аналогично совпадают относительные предельные ошибки выборок для этих оценок:

и

Они показывают, на сколько процентов максимально (при заданном уровне доверительной вероятности) оценка параметра (Р или ) может отклоняться от его истинного значения (математического ожидания).

Легко показать, что

    (5.2.39)

и

Эти равенства при заданном могут использоваться для расчета коэффициента вариации оценок и относительных предельных ошибок (Р и Q в этом случае заменяются их оценками ). Они могут оказаться полезными также и для определения необходимого объема выборки, если заданы желательные значения или .

Из (5.2.39) и (5.2.40) после простых преобразований получают для обеих оценок следующие основные формулы:

b

    (5.2.42)

При n стремится к предельным значениям:

    (5.2.43)

и

    (5.2.44)

Объем выборок, вычисленный по формулам (5.2.43) и (5.2.44), разумеется, больше, чем объем, вычисленный по формулам (5.2.41) и (5.2.42). Для практических расчетов формулы (5.2.41) и (5.2.42) можно преобразовать таким образом, что станет очевидной меньшая стоимость выборочного обследования по сравнению со сплошным. А именно:

    (5.2.45)

соответственно

    (5.2.46)

При заданных требованиях к относительной точности объем выборки а зависит от отношения Чем больше величина этого отношения, тем меньше при прочих равных условиях объем выборки. в свою очередь представляет собой монотонно возрастающую функцию Р. Поэтому если при планировании выборочного обследования хотят получить не слишком малое и удовлетворяющее требованиям к степени точности значение объема выборки, то в формулы вместо неизвестного параметра Р следует подставить число, заведомо меньшее, чем его ожидаемая величина. Тогда мы останемся «в рамках надежности».

Эти замечания показывают, что приведенные выше формулы можно применять для практического определения необходимого объема выборки. Однако в каждом случае после проведения выборочного обследования, при котором объем выборки рассчитывался на основании требований к степени точности, должен быть проведен дополнительный анализ ошибок.

<< Предыдущий параграф Следующий параграф >>
Оглавление