Главная > Методы обработки данных > Временные ряды. Обработка данных и теория
<< Предыдущий параграф
Следующий параграф >>
<< Предыдущий параграф Следующий параграф >>
Макеты страниц

5.2. Периодограмма

Пусть — стационарный ряд со средним и спектром мощности . Предположим, что имеются значения и нужно построить оценку . Прежде всего мы можем вычислить конечное преобразование Фурье

    (5.2.1)

Из теоремы 4.4.2 следует, что эта переменная имеет следующее асимптотическое распределение:

Эти распределения предполагают рассмотрение статистики

    (5.2.3)

как оценки в случае

Статистика задаваемая равенством (5.2.3), называется периодограммой второго порядка, или, более кратко, периодограммой величин . Эту статистику ввел Schuster (1898) для отыскания скрытых периодичностей случая

    (5.2.4)

когда имеет пики в точках .

Заметим, что , заданная формулой (5.2.3), имеет те же свойства симметрии, неотрицательности и периодичности, как и .

На рис. 5.2.1 представлена диаграмма ежемесячного количества осадков в Ангуши за период с 1920 по конечное преобразование Фурье значений за было вычислено с использованием алгоритма быстрого преобразования Фурье. Вычисленная после этого периодограмма приводится на рис. 5.2.2. Она выглядит довольно нерегулярной функцией X. Эта нерегулярность появляется также на рис. 5.2.3 и 5.2.4, где представлены соответственно нижние и верхние частоты рядов ежемесячных средних чисел солнечных пятен; они содержат каждый по 100 ординат периодограмм (см. рис. 1.1.5 для значений

(см. скан)

Рис. 5.2.1. Составной индекс количества осадков для Англии и Уэльса за 1920-1930 гг.

(см. скан)

Рис. 5.2.2. Периодограмма составного количества осадков для Англии и Уэльса за (логарифмический масштаб). (По горизонтали — частоты в цикл/месяц)

среднегодовых чисел). Wold (1965) приводит некоторые другие примеры периодограмм. В каждом из этих примеров крайне нерегулярна по , несмотря на тот факт, что предположительно достаточно регулярная функция . Из этого заключаем, что является неэффективной оценкой поэтому мы вынуждены перейти к рассмотрению некоторых других оценок. Чтобы попытаться понять причины нерегулярности и таким образом построить лучшие статистики, прежде всего приведем несколько теорем относительно статистического поведения

Рис. 5.2.3. Нижние частоты десятичного логарифма периодограммы месячных средних чисел солнечных пятен за 1750—1865 гг. (По горизонтали—частоты в цикл/месяц.)

Рис. 5.2.4. Верхние частоты десятичного логарифма периодограммы месячных средних чисел солнечных пятен за 1750-1865 гг. (По горизонтали — частоты в цикл/месяц.)

Рассмотрим математическое ожидание «периодограмм.

Теорема 5.2.1. Пусть , есть временной ряд с Предположим, что

    (5.2.5)

тогда

В случае когда последний член в (5.2.6) исчезающе мал, и мы видим, что по существу является взвешенным средним интересующего нас спектра мощности с весом, сконцентрированным в окрестности точки X. Переходя к пределу, получаем

Следствие 5.2.1. При выполнении условий теоремы есть асимптотически несмещенная оценка при

Следующая теорема дает асимптотику смещения

Теорема 5.2.2. Пусть выполнены все условия теоремы 5.2.1 и

тогда

Член равномерен по X.

Заметим, что в том случае, когда — целое, второй член в правой части выражений (5.2.6) и (5.2.8) обращается в нуль, что ведет к полезному упрощению результов. Если рассматривать только в точках - целое, , то множество периодограмм построенных по выборочным значениям со средним

    (5.2.9)

значительно сокращается ввиду равенства

    (5.2.10)

для Сточки зрения основного определения спектра мощности, использующего ковариационную функцию, инвариантную по отношению к среднему, ограничение рассмотрения только для целых , выглядит вполне оправданным. Мы вернемся к этому ниже в теореме 5.2.4.

В § 3.3 и 4.6 мы могли видеть, что временное сглаживание по краям наблюдаемых величин, предшествующее вычислению их преобразования Фурье, дает некоторые преимущества. Вернемся к построению модифицированных периодограмм, соответствующих рядам со сглаженными значениями. Рассмотрим

    (5.2.11)

для некоторого временного окна удовлетворяющего условию 4.3.1. В таком случае из теоремы 4.4.2 следует, что распределение величины асимптотически равно

    (5.2.12)

если . Следовательно, для случая временного сглаживания мы можем рассматривать статистику

    (5.2.13)

в качестве оценки для .

Мы заменили суммой квадратов значений временного окна, так как последняя легко вычисляется. Положим

    (5.2.14)

и

    (5.2.15)

Применим, если это возможно, формулу суммирования Пуассона; тогда последние два выражения связаны соотношением

    (5.2.16)

откуда имеет значительную величину, только если , что будет существенно для нас при рассмотрении выражения (5.2.17). Справедлива

Теорема 5.2.3. Пусть ряд с действительными значениями, удовлетворяющий условиям теоремы удовлетворяет условию 4.3.1, а задано выражением (5.2.13). Тогда справедливо соотношение

    (5.2.17)

Если то последний член формулы (5.2.17) достаточно мал по величине. Первый член правой части (5.2.17)

является взвешенным средним с весовой функцией, сконцентрированной в окрестности, точки интересующего нас спектра мощности с учетом относительного веса временного окна. Это выражение полезно сравнить с формулой (5.2.6), соответствующей несглаженному случаю.

Если имеет значительный пик в окрестности точки а, то математическое ожидание, задаваемое выражениями (5.2.6) и (5.2.17), может значительно отличаться от Отсюда очевидны преимущества в применении сглаживания, с помощью которого можно уменьшить влияние пика в соседних частотах.

Продолжая исследования статистических свойств периодограмм как оценок спектра мощности, приведем теорему 5.2.4, которая описывает ковариационную структуру в точках — целое, для несглаженного случая.

Теорема 5.2.4. Пусть действительный случайный ряд, удовлетворяющий условию . Пусть задано выражением (5.2.3), — целые, Тогда

    (5.2.18)

где член равномерен по всем рассматриваемым

Заметим, что, согласно условиям теоремы, если , т. е. оценки идентичны.

Эта теорема имеет решающее значение для статистической практики. Из нее следует, что, каким бы большим мы не брали Т, дисперсия будет стремиться к постоянному уровню Если мы желаем получить оценку с меньшей дисперсией, то добиться этого простым увеличением длины выборки, по которой строится периодограмма, невозможно. Теорема также вскрывает причины нерегулярности диаграмм 5.2.2 и 5.2.4: а именно, близкие ординаты периодограмм, по всей вероятности, имеют относительно малую ковариацию по сравнению с их дисперсией. Как мы увидим из теоремы 5.2.6, различные ординаты периодограммы асимптотически независимы.

Теорема 5.2.5 описывает асимптотическую структуру ковариаций периодограммы, когда к не обязательно вида

Теорема 5.2.5. Пусть действительный ряд, удовлетворяющий условию Пусть задано

выражением (5.2.3) и . Тогда

причем для данного член равномерен по отличающихся от всех чисел, кратных по крайней мере на е.

Заметим, что выражение (5.2.20) более информативно, чем (5.2.19): в (5.2.20) можно проследить переход , когда . Оно также объясняет, почему малы ковариации в случае, когда принимают частные значения, равные с целыми s и .

Мы заканчиваем исследование элементарных асимптотических свойств периодограмм отысканием их асимптотического распределения в условиях регулярности. В теореме 4.4.1 доказана асимптотическая нормальность для А вида — целое, из которой следует

Теорема 5.2.6. Пусть действительный ряд, удовлетворяющий условию 2.6.1. Пусть - целое, такое, что стремится к когда для всех Предположим, что для Пусть

    (5.2.21)

для всех — . Тогда переменные асимптотически независимые -величины. Если то асимптотически не зависит от предыдущих величин и имеет закон распределения

В теореме означает случайную величину, распределенную по хи-квадрат с v степенями свободы. В частности, соответствует экспоненциальному распределению со средним 1.

Практический вывод теоремы состоит в доказательстве того, что ордината периодограммы приблизительно есть произведение распределений Некоторое эмпирическое подтвержде: ние этого заключения дает рис. 5.2.5, на котором приводится множество значений , ежемесячных средних чисел солнечных пятен, распределенных по хи-квадрат с двумя степенями свободы. Мы выбрали указанные частные значения s потому, что из рис. 5.2.4 и 5.4.3 следует, что приблизительно постоянна на соответствующем интервале частот. Если величины, наносимые на данный график, имеют в

(см. скан)

Рис. 5.2.5. Множество распределенных по ординат верхних частот периодограммы ежемесячных средних чисел солнечных пятен за 1750-1965 гг.

действительности распределение то наносимые точки должны лечь примерно вдоль прямой линии. Именно это с очевидностью демонстрирует рис. 5.2.5. Аналогичные графики приводят Wilk и др. (1962).

Теорема 5.2.6 подтверждает высказанное при обсуждении теоремы 5.2.4 предположение о неэффективности периодограммы как оценки спектра мощности. Для больших Т ее распределение будет приблизительно произведением с двумя степенями свободы и, следовательно, будет крайне неустойчивым. В § 5.4 мы займемся проблемой построения достаточно устойчивых оценок.

Среднее и дисперсия асимптотического распределения как видно, находятся в соответствии с выборочными средним и дисперсией задаваемыми выражениями (5.2.8) и (5.2.18) соответственно.

Теорема 5.2.6 не дает описания асимптотического распределения когда Теорема 4.4.1 отмечает, что таким асимптотическим распределением будет когда . В случае когда теорема 4.4.1 показывает, что приближением выборочного распределения будет где обозначает нецентральное распределение с одной степенью свободы и параметром нецентральности

В случае сглаженных временных рядов справедлива

Теорема 5.2.7. Пусть действительный ряд, удовлетворяющий условию 2.6.1. Предположим, что для . Пусть удовлетворяет условию 4.3.1 и

    (5.2.22)

для Тогда асимптотически независимы и распределены как . Если , то асимптотически независимы от предыдущих переменных и распределены как

Как видно, предельное распределение не изменилось от Процедуры сглаживания временного ряда. Однако мы надеемся, что оценки сглаженных рядов при больших выборках будут давать меньшее смещение. Продолжение теоремы 5.2.5 на случай сглаженных рядов дает

Теорема 5.2.8. Пусть есть действительный ряд, удовлетворяющий условию со средним 0. Пусть удовлетворяет условию 4.3.1 и задано формулой (5.2.22). Тогда

    (5.2.23)

для и ошибка равномерна по

Здесь

    (5.2.24)

Очевидно, зависимость исчезает, как только функция становится достаточно малой.

Bartlett (1950, 1966) получил выражение среднего и ковариации периодограммы в условиях регулярности, ему также принадлежит идея аппроксимации распределения многомерным -распределением с двумя степенями свободы. Материал этого параграфа

построен также на следующих работах: Слуцкий (1934), Grenander, Rosenblatt (1957), Kawata (1959), Hannan (1960), Akaike (1962b), Walker (1965), Olshen (1967).

<< Предыдущий параграф Следующий параграф >>
Оглавление