Главная > Методы обработки данных > Основы моделирования и первичная обработка данных
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

Глава 11. ПРЕДВАРИТЕЛЬНЫЙ АНАЛИЗ ПРИРОДЫ ДАННЫХ

Уже на первых этапах статистической обработки исходных данных

— наблюденных значений исследуемой случайной величины — приходится отвечать на следующие вопросы, от правильного ответа на которые зависит правомерность и эффективность применяемых методов анализа:

можно ли считать имеющиеся в нашем распоряжении данные (11.1) результатами независимых наблюдений некоторой случайной величины?

при наличии нескольких «порций» исходных данных можно ли считать, что все они извлечены из одной и той же генеральной совокупности?

правомерно ли полагать, что закон распределения наблюдаемой случайной величины симметричен относительно центра группирования ее значений?

какая модель больше подходит для описания закона вероятностного распределения обрабатываемых данных и, в частности, как проверить соответствие выбранной модели имеющимся в нашем распоряжении наблюдениям?

как строить обработку данных при наличии отдельных «пропусков» в них (например, в многомерном наблюдении X оказались не измеренными некоторые из его компонент?

как поступать с «подозрительными» наблюдениями, т. е. с данными, резко выделяющимися на общем фоне остальных наблюдений?

Решение этих вопросов достигается с помощью различных статистических критериев и приемов — критериев независимости и стационарности наблюдений, критериев однородности двух или нескольких выборок, критериев симметрии распределения, критериев согласия и т. д. Их описанию и посвящена настоящая глава.

11.1. Проверка соответствия выбранной модели распределения исходным данным (критерии согласия)

Пусть нами высказано предположение, что ряд наблюдений (11.1) образует случайную выборку, извлеченную из генеральной совокупности с некоторой модельной функцией распределения , где общий вид функции (т. е. тип модели) считается известным, а параметры, от которых она зависит, могут быть как известными, так и неизвестными.

Описываемые в данном параграфе критерии согласия предназначены для проверки гипотезы

и основаны на использовании различных мер расстояний между анализируемой эмпирической функцией распределения

(определяемой по выборке (11.1), см. § 5.5) и гипотетической модельной

<< Предыдущий параграф Следующий параграф >>
Оглавление