Главная > Математика > Выборочный метод
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.4.3. ОЦЕНИВАНИЕ СРЕДНИХ И СУММАРНЫХ ЗНАЧЕНИИ С ПОМОЩЬЮ ОЦЕНОК ПО ОТНОШЕНИЮ (КОСВЕННОЕ ОЦЕНИВАНИЕ)

Предварительное замечание. Для лучшего понимания вопросов, рассмотренных в данном параграфе, требуется знание материала, изложенного в 5.4.2.

5.4.3.1. Общие замечания о косвенных методах оценивания

При оценивании средних и суммарных значений методами, обсуждавшимися в 5.3, привлекались результаты исследования непосредственно интересовавшего нас в данный момент признака (исследуемого признака), а также объемы и N. В настоящем параграфе, а также в 5.5 и 5.6 обсуждаются способы оценивания (функции оценки) средних и суммарных значений признака через информацию о некотором другом признаке, который мы будем называть факторным признаком. Такие методы называются методами косвенного оценивания. При определенных предпосылках (см. 5.4.4) с помощью таких методов при одинаковом объеме выборки можно добиться повышения эффективности оценок по сравнению с прямым оцениванием. Необходимым (но недостаточным) условием этого является наличие корреляции между интересующими нас результативным и факторным признаками.

Основная идея косвенного оценивания очень проста. Различные свойства единиц совокупности описываются соответствующим количеством числовых характеристик. При этом речь может идти о более или менее важных, о легко

или, напротив, с трудом наблюдаемых и измеряемых признаках. Для некоторых важных признаков определение истинных средних или суммарных значений путем исследования всех единиц сопряжено с чрезмерными трудностями, для других же признаков исследование всех единиц может быть вполне посильной задачей. Если между признаками, совокупный суммарные или средние значения которых известны (факторными признаками), и признаками, которые могут быть оценены лишь с помощью выборочного обследования, существует некоторая связь, что-то вроде определенной пропорции, то знание факторного признака может быть использовано для оценивания исследуемого признака, являющегося результативным. Если, например, известны общие расходы определенной группы домохозяйств за какой-то период времени (факторный признак), то иногда для оценивания расходов на питание достаточно знать, что в среднем 45% расходов идет на эти цели. С помощью оцененной величины 0,45 и известного значения общих расходов (или средних расходов) делают заключение о расходах на питание.

При прямом оценивании для определения характеристик X и X:

    (5.4.49)

необходимой предпосылкой являлось существование (но не знание) N единичных значений При применении косвенных методов оценивания необходимой предпосылкой является знание некоторого другого (факторного) признака для всех единиц совокупности, т. е. сумма

или среднее

факторного признака должны рассматриваться как известные. При этом факторными могут быть следующие признаки.

а) Если речь идет о процессе, повторяющемся во времени (текущая статистика), то результаты полного исследования совокупности можно рассматривать в качестве факторного признака для выборочного обследования этого же признака единиц совокупности в следующий момент времени. Для каждой единицы тогда факторный признак известен. Если, например, по переписи определена численность рогатого скота во всех общинах на 1 января некоторого года, то этот признак может рассматриваться как факторный для выборочного обследования поголовья рогатого скота на 1 июля того же года.

б) Результативный и факторный признаки относятся к одному и тому же моменту (периоду) времени. Тогда факторный признак, как правило, более доступен для изучения или знание его истинного значения все равно является необходимым из содержательных соображений. Результативный признак может быть частью факторного (расходы на питание — общие расходы) или отражать другое свойство единиц совокупности (выручка от продажи зерна некоторого сорта — площадь, занятая этим сортом зерна). Вполне возможно, что с одним факторным признаком могут коррелировать (т. е. могут быть связаны) несколько результативных.

В зависимости от математических методов использования информации о факторном признаке различают три способа косвенного оценивания:

оценивание по отношению;

оценивание по регрессии (см. 5.5);

оценивание по разности (см. 5.6).

5.4.3.2. Функции оценки при оценивании по отношению

В 5.4.2 было определено общее отношение Т и индивидуальные отношения

    (5.4.53)

Если X — урожай пшеницы с поля, площадь этого поля в , то показывает урожай с одного гектара поля, урожай с одного гектара для всех полей (например, одного округа).

— фактический урожай с поля, представленный в виде произведения урожайности одного гектара этого поля на его площадь в гектарах. Произведение напротив, — гипотетический урожай с поля в предположении, что урожай с одного гектара этого поля равен урожаю с гектара по всему округу. как правило, отличаются друг от друга (см. рис. 19). Однако из (5.4.53) следует

    (5.4.55)

или

    (5.4.56)

Величину мы предполагаем известной заранее, Т же, напротив, не известно и должно быть оценено с помощью выборочного обследования. Оценка отношения Т уже рассматривалась в 5.4.2. Она имеет вид:

    (5.4.57)

Заменяя на приближенное значение получают оценку суммы Оценка по отношению суммарного значения признака для совокупности равна:

    (5.4.58)

или

Оценка равна произведению суммарного значения факторного признака Y для совокупности и оценки I отношения Т.

Оценку среднего значения признака получают, заменяя в равенстве

    (5.4.60)

отношение Т функцией выборки

    (5.4.61)

Равенства (5.4.57), (5.4.59) и (5.4.61) — функции оценок при оценивании по отношению. Оценку отношения (5.4.57) получают непосредственно из результата выборки, в то время как для расчета оценки суммарного или среднего значения заранее необходимо знание суммарного или соответственно среднего значения факторного признака.

5.4.2 указывалось на то, что t в общем представляет собой смещенную оценку Т. Поэтому — также смещенные оценки. Однако в практических исследованиях систематическая ошибка, обусловленная выбором функции оценивания, мала но сравнению со случайной ошибкой, мерой которой является стандартная ошибка, и ею можно пренебречь.

Оценки естественно, состоятельны, т. е. функции оценки выбраны «подходящие».

5.4.3.3. Стандартные ошибки оценок и доверительные интервалы

Поскольку

    (5.4.62)

дисперсии и стандартные ошибки оценок легко найти, если принять во внимание, что Y и — постоянные величины, а стандартная ошибка случайной величины t была подробно изучена в 5.4.2.

Используя свойство среднего квадратичного отклонения, а также соотношения (5.4.62), (5.4.59) и (5.4.61), получаем:

    (5.4.63)

и соответственно

    (5.4.64)

Коэффициенты вариации оценок составляют:

    

и аналогично

    (5.5.66)

Таким образом,

    (5.4.67)

Коэффициенты вариации всех трех оценок при оценивании по отношению вычисляются по одной и том же формуле.

Здесь мы приводим лишь некоторые формулы для стандартных ошибок и коэффициентов вариации, которые с учетом (5.4.62), (5.4.63) и (5.4.67) следуют из соответствующих формул из 5.4.2.

Из (5.4.36) следует, что

    (5.4.68)

является стандартной ошибкой оценки суммарного значения для совокупности;

    (5.4.69)

является стандартной ошибкой оценки среднего значения для совокупности;

    (5.4.70)

являются коэффициентами вариации оценок суммарного и среднего значений для совокупности.

В то время как стандартная ошибка оценки суммарного значения для совокупности при также стремится

к стандартная ошибка среднего и коэффициенты вариации при имеют конечные пределы. А именно:

Если ввести обозначения (см. 5.4.2)

и

    (5.4.73)

то для стандартных ошибок получим формулы:

    (5.4.74)

и

При больших N, т. е. при или формула для стандартной ошибки среднего значения принимает вид:

Итак, с помощью результатов вычисления стандартной ошибки и коэффициента вариации оценки (см. 5.4.2) и с учетом (5.4.62), (5.4.63), (5.4.67) мы получили расчетные формулы для определения стандартных ошибок и коэффициентов вариации оценок Выбор соответствующей формулы зависит от того, какие еще статистические показатели, кроме оценок или их стандартных ошибок и (или) коэффициентов вариации, нужны для анализа и описания результатов обследования.

Формулы (5.4.39) и (5.4.40) включают только суммы Статистические характеристики при этом не вычисляются. Формулы (5.4.36) и (5.4.37) содержат характеристики выборки , т. е. выборочные средние квадратичные отклонения признаков и коэффициент

циент корреляции. Формулы (5.4.22), (5.4.23), (5.4.32) и (5.4.33) содержат коэффициенты вариации и коэффициент корреляции . И наконец, формула (5.4.35) содержит коэффициенты вариации числителя и знаменателя функции оценки t (или также или ).

В 5.4.2 были указаны условия или при которых доверительный интервал для отношения Т может быть рассчитан с помощью квантилей нормального распределения по формуле (5.4.24). Доверительные интервалы для суммарного значения X и среднего X при тех же (в общем выполняющихся) условиях получают умножением двойного неравенства (5.4.24) на Y или К соответственно.

Пусть задана вероятность ошибки а. Тогда

    (5.4.77)

есть доверительный интервал для суммарного значения X при уровне доверительной вероятности (1 — а):

    (5.4.78)

есть доверительный интервал для среднего при уровне доверительной вероятности (1 — а).

<< Предыдущий параграф Следующий параграф >>
Оглавление