Главная > Методы обработки данных > Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.6.2. Характеристики центра группирования значений случайной величины.

В качестве характеристик центра группирования значений исследуемого признака в статистической практике используют несколько видов средних значений, моду и медиану. Опишем эти числовые характеристики.

Теоретическое среднее исследуемой случайной величины определяется как ее первый начальный момент, или, что то же, как ее математическое ожидание (см. (5.18) и (5.20)):

Среднее значение является, пожалуй, основной и наиболее употребительной характеристикой центра группирования значений случайной величины. В статистической практике, т. е. при подсчете ее приближенного значения на основе выборочных данных она заменяется своим эмпирическим аналогом — так называемой выборочной средней (см. (5.20)):

Непосредственно из определения среднего значения легко получить следующие его основные свойства:

а) , где с — любая неслучайная величина;

б)

в)

г) , если случайные величины статистически взаимно независимы (см. п. 5.5.3).

Среднее геометрическое (теоретическое) значение случайной величины определяется (для признаков с положительными возможными значениями) с помощью формулы

где - основание, а — обозначение натурального логарифма. Его эмпирический аналог — средняя геометрическая подсчитывается по выборочным данным по формуле

Можно показать, что геометрическое среднее значение и его эмпирический аналог всегда меньше соответственно теоретического среднего и выборочной средней .

Геометрическое среднее находит применение при расчетах темпов изменения величин и, в частности, в тех случаях, когда имеют дело с величиной, изменения которой происходят приблизительно в прямо пропорциональной зависимости с достигнутым к этому моменту уровнем самой величины (например, численность населения), или же когда имеют дело со средней из отношений, например, при расчетах «индексов цен».

Среднее гармоническое (теоретическое) значение случайной величины задается (лишь для признаков с положительными возможными значениями) соотношением

Его эмпирическое значение вычисляется на основании выборочных данных по формуле

Гармоническое среднее значение ряда чисел всегда меньше геометрического среднего значения тех же чисел, а тем более — их среднего арифметического. Область его применения весьма ограничена. В экономике, в частности, пользуются иногда гармоническим средним при анализе средних норм времени, а также в некоторых видах индексных расчетов.

Медальное значение (или просто мода) случайной величины определяется как такое возможное значение исследуемого признака, при котором значение плотности (в непрерывном случае) или вероятности (в дискретном случае) достигает своего максимума. Таким образом, мода представляет собой как бы наиболее часто осуществляющееся (в экспериментах или наблюдениях), наиболее типичное значение случайной величины, т. е. значение, которое действительно явлется «модным». Практическое отыскание приближенного значения моды по выборочным данным требует построения и анализа соответствующих гистограмм и полигонов частот (см. § 5.5, 10.3).

Медиана исследуемого признака определяется как его средневероятное значение, т. е. такое значение, которое обладает следующим свойством: вероятность того, что анализируемая случайная величина окажется больше равна вероятности того, что она окажется меньше Для обладающих непрерывной плотностью непрерывных случайных величин, очевидно,

и медиану можно определить как такое значение на оси возможных значений (оси абсцисс), при котором прямая, параллельная оси ординат и проходящая через точку Делит площадь под кривой плотности на две равные части (рис. 5.8). В некоторых случаях дискретных распределений может не существовать величины, точно удовлетворяющей сформулированному требованию. Поэтому для дискретных случайных величин медиану можно определить

как любое число , лежащее между двумя соседними возможными значениями такими, что

При определении приближенного (выборочного) значения медианы имеющиеся в нашем распоряжении наблюдения располагают в ряд в порядке возрастания (в так называемый вариационный ряд, см. п. 5.6.4) и определяют в качестве средний (т. е. ) член этого ряда, если нечетно, и любое значение между двумя средними (т. е. между членами этого ряда, если четно.

Рис. 5.8. Характер расположения моды , медианы и среднего значения Е g для некоторой асимметричной плотности распределения

В случае симметричной плотности (или полигона распределения) среднее значение мода и медиана совпадают между собой.

Для асимметричных распределений это не так (см. рис. 5.8).

<< Предыдущий параграф Следующий параграф >>
Оглавление