Главная > Методы обработки данных > Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

11.2. Проверка гипотез однородности и симметрии распределения

Пусть имеется независимых выборок, содержащих соответственно независимых наблюдений:

Гипотеза однородности состоит в том, что генеральные совокупности, из которых извлечены выборки, одинаковы и, значит, им соответствуют одинаковые функции распределения

    (11.14)

где — функция распределения генеральной совокупности. Наиболее частый в приложениях случай, когда

Проверка гипотезы симметрии рассматривается в настоящем параграфе как проверка симметрии распределения относительно заданной точки

    (11.15)

Если распределение имеет плотность, то гипотеза соответствует гипотезе симметричности плотности (относительно точки ).

11.2.1. Критерии однородности, основанные на эмпирических функциях распределения.

Рассмотрим случай двух одномерных выборок . Пусть — вариационные ряды, составленные из элементов первой и второй выборок соответственно. Мы можем теперь определить две эмпирические функции распределения

. Аналогично п. 11.1.4 вводятся следующие статистики:

В случае истинности нулевой гипотезы распределение статистик одинаково, поэтому дальше рассматривается лишь статистика Без ограничения общности можно считать также, что . Предположим теперь, что предельные функции непрерывны и верна гипотеза Пусть Тогда случайные величины умеют те же самые предельные распределения что и их аналоги (11.6). Распределения статистик (11.16) при конечных случая получены Б. В. Гнеденко и В. С. Королюком в [112] (для рациональных значений ):

    (11.18)

Таблицы точных распределений для статистик для общего случая приведены в [16].

На практике для сокращения объема вычислений величины можно находить по формулам:

    (11.19)

Отметим весьма важное свойство критериев однородности, основанных на статистиках (11.17), - они состоятельны против любой альтернативной гипотезы вида

    (11.20)

т. е. при любой альтернативе вида (11.20) вероятность отвергнуть (в данном случае (11.15) при стремится к 1 при в чем бы ни заключалось различие между и как бы мало оно ни было.

Для статистики критической является область больших значений, т. е. гипотеза однородности отвергается, если

где — критическая точка распределения статистики при уровне значимости а.

Большие значения являются критическими и для статистики Однако статистика (равно как и ) может принимать и отрицательные значения. Это означает, что одна из эмпирических функций распределения больше другой на всем интервале наблюдений, что при достаточно больших значениях вряд ли совместимо с нулевой гипотезой о равенстве предельных функций распределения. Так, в случае используя (11.17), имеем

где через обозначена величина При эта вероятность меньше 0,05. Поэтому, если область отрицательных значений соответствующих статистик следует также считать критической для принятия нулевой гипотезы.

Замечание. Распределения статистик критериев получены в предположении, что соответствующие предельные функции распределения непрерывны. В то же время на практике мы часто имеем дело либо с дискретными случайными величинами, либо с сгруппированными данными. Формулы (11.19) для статистик могут использоваться без всякого изменения и в этом случае, однако уровень значимости нулевой гипотезы будет меньше заданного [23]. Это значит, что вероятность

для статистики критерия превзойти -ную точку, вычисленную в предположении непрерывности, будет меньше а и, следовательно, вероятность отвергнуть нулевую гипотезу по сгруппированным данным при том же объеме выборки меньше, чем по несгруппированным.

Когда число выборок и объемы выборок равны может быть использовано следующее обобщение статистик:

    (11.21)

Для случая в [1061 имеются таблицы распределения статистики (11.21).

Пример 11.2. В табл. 11.5 приведены (условные) данные о заработной плате и -служащих двух отраслей народного хозяйства. Проверим с помощью статистик (11.16) гипотезу о том, что распределение заработной платы служащих первой отрасли совпадает с распределением заработной платы служащих второй отрасли

Таблица 11.5

В табл. 11.5 представлены сгруппированные данные. Применение критериев на основе статистик (11.16), (11.19) носит приближенный характер. Взяв значения эмпирических функций распределения в правых концах интервалов, получаем следующие данные для расчета критических статистик (табл. 11.6).

Отсюда

Таблица 11.6

Используя распределение Гнеденко — Королюка (11.17), имеем

т. е. при условии равенства распределений (истинности гипотезы ) вероятность отрицательных значений статистики при будет меньше 0,01 и, следовательно, гипотезу равенства следует отвергнуть при размере критерия 0,01.

Обратимся теперь к статистике

Используя теперь предельное распределение статистики Колмогорова получим

Таким образом, гипотеза о равенстве функций распределения также отвергается при размере критерия 0,025. Этот же результат можно получить и путем сравнения величины с процентными точками точного распределения. Размеры критериев в данном примере не совпадают и согласно критерию гипотеза менее вероятна, чем по критерию

<< Предыдущий параграф Следующий параграф >>
Оглавление