Главная > Методы обработки данных > Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.6.7. Основные характеристики многомерных распределений (ковариации, корреляции, обобщенная дисперсия и др.).

Если при описании поведения одномерных и в какой-то мере двумерных случайных величин исследователь еще имеет практически реализуемые возможности использования подходящих модельных законов распределения (см. гл. 6), то при исследовании признаков размерности большей, чем два приходится ограничиваться лишь той информацией, которую ему доставляет

знание первых двух моментов: вектором средних значений

и матрицей ковариаций

где средние значения компонент определяются в соответствии с формулой (5.25) с использованием одномерных частных плотностей (полигонов) распределения случайных величин , а ковариации подсчитываются с использованием соответствующих двумерных частных плотностей (полигонов) распределения пары случайных величин

Эмпирическими аналогами вектора средних значений и ковариационной матрицы характеристиками, подсчитываемыми непосредственно по выборочным данным

являются соответственно вектор выборочных средних

и выборочная ковариационная матрица

где многомерное наблюдение компоненты выборочных средних подсчитываются по формуле (5.25), а элементы ковариационной матрицы определяются соотношениями

Как и в одномерном случае, вектор средних значении является основной характеристикой центра группирования наблюдений исследуемого многомерного признака (в соответствующем -мерном пространстве ее возможных значений).

Матрица ковариаций 2 характеризует следующие свойства исследуемого многомерного признака.

1. Степень случайного разброса отдельно по каждой компоненте и в целом по многомерному признаку. Легко видеть, что диагональные элементы матрицы S определяют частные дисперсии компонент т. е. степень случайного разброса значений одномерной случайной величины Итак,

Многомерным аналогом дисперсии является величина определителя ковариационной матрицы, называемая обобщенной

дисперсией многомерного случайного признака :

Часто используется и другая характеристика степени случайного рассеяния значений многомерной случайной величины — так называемый след ковариационной матрицы 2, т. е. сумма ее диагональных элементов:

Из неотрицательной определенности матрицы 2 (см. п. 5.6.1) и смысла диагональных элементов он следует, что величины, определенные соотношениями (5.37) и (5.38), всегда неотрицательны.

Эмпирическими аналогами обобщенной дисперсии (5.37) и следа матрицы 2 (5.38) являются соответственно выборочная обобщенная дисперсия

и след выборочной ковариационной матрицы

Поясним геометрический смысл обобщенной дисперсии (см., например, [12, с. 231—235]). Применительно к теоретической обобщенной дисперсии можно сказать, что если, например, исследуемый многомерный признак подчинен нормальному закону распределения (см. гл. 6), то для любого заданного уровня вероятности объем области (окружающей центр группирования ), вероятность попадания в которую значений анализируемой случайной величины равна пропорционален (этот объем пропорционален также некоторому множителю, зависящему от размерности и пропорционален, кроме того, некоторому числу, определяемому в зависимости от заданного уровня вероятности ). Можно дать также геометрическую интерпретацию выборочной обобщенной дисперсии в -мерном пространстве наблюдений Для этого рассмотрим в этом пространстве всевозможные параллелепипеды, обра зованные следующим образом. В качестве образующих

ребер каждого параллелепипеда берутся всевозможные векторов, одними концами которых являются точек из числа а другими концами — точка X. Оказывается, сумма квадратов объемов всех таких параллелепипедов будет пропорциональна величине выборочной обобщенной дисперсии коэффициентом пропорциональности, равным .

2. Характер и структура статистических взаимосвязей, существующих между компонентами анализируемого многомерного признака, также могут быть описаны с помощью ковариационной матрицы. Однако в этом случае удобнее перейти к определенным образом нормированной ковариационной матрице, называемой корреляционной, а именно к матрице

где элементы получаются из элементов с помощью нормировки

Характеристики называются коэффициентами корреляции между случайными величинами являются измерителями степени тесноты линейной статистической связи между этими признаками и обладают следующими свойствами:

а) что следует непосредственно из неравенств

б) максимальная степень тесноты связи соответствует значениям коэффициента корреляции, равным +1 или —1, и достигается либо при измерении связи признака с самим собой (тогда, очевидно, либо при наличии линейной функциональной связи между т. е. в случае

где некоторые постоянные величины (при этом если , то связь называется положительной, а если то связь называется отрицательной);

в) если случайные компоненты и статистически независимы, то (следует непосредственно из того факта, что для независимых случайных величин и ) Обратное утверждение (из следует независимость ) верно лишь для некоторых частных случаев (например, для нормально распределенных пар ) и неверно в общем случае.

<< Предыдущий параграф Следующий параграф >>
Оглавление