Главная > Методы обработки данных > Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

11.2.8. Критерии однородности нормальных совокупностей (одномерный случай).

Строго говоря, описанные ниже критерии (критерий Стьюдента, или -критерий; критерий дисперсионного отклонения, критерий Бартлетта и др.) применимы только к выборкам (9.3), извлеченным из нормальной генеральной совокупности: в этом случае, как легко понять, неотрицательный результат одновременной проверки однородности средних значений (т. е. гипотезы ) и дисперсий (т. е. гипотезы ) достаточен для неотрицательного вывода по поводу гипотезы об однородности самих законов распределения (т. е. гипотезы ). Специальные исследования показали, однако, что -критерий является (особенно при больших объемах выборок ) весьма устойчивым по отношению к отклонениям исследуемых генеральных совокупностей от нормальных. А это значит, что он может применяться и к выборкам из негауссовских генеральных совокупностей с той лишь оговоркой, что истинные значения уровня значимости и мощности критерия в этом случае будут незначительно отличаться от заданных.

В случае двух выборок критерий их принадлежности к общей генеральной совокупности основан на критической статистике

где — средние арифметические наблюдений соответственно первой и второй выборок, a - «сводная» оценка дисперсии по совокупности двух выборок, т. е.

    (11.49)

Как известно (см. п. 6.2.2), в условиях справедливости гипотезы однородности (9.3 а) статистика подчинена распределению Стьюдента с степенями свободы. Поэтому, чтобы проверить гипотезу однородности,

надо из таблиц процентных точек -распределения (см., например, [16], табл. 3.2) по заданному уровню значимости критерия а найти 100- %-ную точку распределения Стьюдента с степенями свободы. Если окажется, что

    (11.51)

то гипотеза об однородности выборок принимается (и отвергается в противном случае).

Замечание 1. «Слишком большое» значение т. е. такое, при котором нарушается неравенство (11.51), может быть следствием как значимого расхождения средних (т. е. невыполнения гипотезы (9.36)), так и значимого расхождения дисперсий (т. е. невыполнения гипотезы ).

Если мы хотим понять, за счет чего обнаружилась неоднородность рассматриваемых выборок, то необходимо дополнительно произвести проверку однородности дисперсий, т. е. гипотезы (9.3 в) с (иногда статистическая проверка однородности дисперсий является единственной, автономной, целью исследования). Статистический критерий однородности двух выборочных дисперсий основан на критической статистике

которая, как известно (см. п. 6.2.3), в условиях справедливости гипотезы (9.3 а) подчинена закону -распределения с числами степеней свободы числителя и знаменателя, равными соответственно Поэтому если окажется, что

    (11.52)

то гипотеза об однородности дисперсий не отвергается (и отклоняется в противном случае). В неравенствах (11.52)

обозначает точку -распределения с числами степеней свободы числителя и знаменателя соответственно (находится из таблиц, см., например, табл. заданный уровень значимости критерия.

И наконец, возможна такая ситуация, когда дисперсии и а оказались различными (т. е. оказалось нарушенным хотя бы одно из неравенств (11.52)), анас все-таки продолжает интересовать вопрос об однородности средних значений, т. е. проверка гипотезы (9.36). В этом случае удается построить приближенный критерий, основанный на критической статистике

в которой определены по формуле (11.50), а

Зависимость критической статистики t от вспомогательного параметра с учтена при вычислении таблиц процентных точек распределения этой случайной величины. Эти процентные точки можно найти, например, в [16, табл. 4.4] (в этих таблицах обозначена как

Итак, если оказалось, что

то делается вывод об однородности проверяемых средних.

Замечание 2. Во всех случаях, когда различие средних проверяется лишь в одном каком-то направлении (например, проверяется, «можно ли считать, что среднее значение первой выборки статистически значимо превышает среднее значение второй выборки ), в качестве уровня процентной точки надо брать не .

В случае нескольких выборок (т. е. при см. (9.3)) критерий их принадлежности к общей генеральной совокупности

основан на критической статистике

    (11.53)

где

    (11.54)

т. е. — общее среднее арифметическое, подсчитанное по объединению всех k выборок, а выборочные дисперсии подсчитаны по формуле (11.50).

Можно показать, что если справедлива гипотеза (9.3 а), то статистика (11.53) подчиняется закону -распределения (см. п. 6.2.3) с числами степеней свободы числителя и знаменателя соответственно Поэтому если окажется, что

    (11.55)

то гипотеза об однородности выборок (9.3) принимается.

Замечание 3. Как и в случае двух выборок, «слишком большое» значение критической статистики (11.53), т. е. такое, при котором нарушается неравенство (11.55), может быть следствием как значимого расхождения средних (т. е. невыполнения гипотезы (9.36.)), так и значимого расхождения дисперсий (т. е. невыполнения гипотезы (9.3 в.)). Поэтому представляет интерес статистическая проверка однородности ряда (более чем двух) выборочных дисперсий. Эту проверку можно производить, например, с помощью критерия Бартлетта [40, п. 24.9], основанного на критической статистике

в которой определяются формулами соответственно (11.54) и (11.50), а

М. С. Бартлетт показал что при и в условиях справедливости гипотезы о равенстве дисперсий (см. 9.3 в) статистика К распределена приблизительно как -случайная величина с степенью свободы. Поэтому если оказалось, что то гипотеза об однородности выборочных дисперсий принимается, и отвергается в противном случае.

<< Предыдущий параграф Следующий параграф >>
Оглавление