5.10. Метод наложения эпох

Часто взаимосвязь между двумя временными рядами X (t) и Y (t) исследуют с помощью метода, известного под названием «Метод наложенных эпох». Такой способ анализа данных особенно полезен, если один из рядов состоит из дискретных событий, таких как магнитная буря или отсутствие ее, день прохождения центрального меридиана группой пятен на солнечном диске и т.д. Из таких рядов выбирается ряд «ключевых дат», отражающих случаи, когда рассматриваемое явление произошло. Если обозначить ключевую дату через D0, то последующие за этой датой дни могут быть обозначены D1 D2, D3,…,Dn. Затем для каждого дня последовательности получают средние значения другой переменной. Если таким образом было выбрано k ключевых дней D0 (и поэтому k последовательностей), то затем выписываются k значений величины Y для дней D0 (Y0). Затем находится среднее из этих k значений (Y0). Такое же осреднение величины Y производится для дней D1. Эта процедура повторяется для Dz, D3, ..., Dn. Вполне естественно, что в некоторых случаях нас может интересовать поведение переменной Y для m дней, предшествующих D0. В этом случае мы получаем последовательность средних, соответствующих Dm,Dm+1, …,D–2, D–1

Расчет завершается получением ряда средних величин Y, обозначенных

.

Каждое Y основано на k наблюдениях, и является средним значением для величин Y для ключевых дней D0, которые выбраны на основе ряда X(t). Последовательность Y затем вычерчивается, и изменения в ней изучаются в связи с некоторой априорной гипотезой. Например, исходя из некоторой физической теории, можно предположить, что величина Y должна убывать перед D0 и возрастать в течение периода от 5 до 10 дней после D0. Конечно, количественная оценка результатов затруднена, если не определить их значимость путем сравнения с результатами из другой независимой выборки или с каким–либо случайным распределением.

Применение этого метода может быть проиллюстрировано следующим численным примером. Исследуется вопрос, сопровождается ли увеличение солнечной активности, которая выражается суточным числом солнечных пятен, изменением количества перистых облаков. Было выбрано 20 ключевых дат D0, по одной дате в каждом ноябре за 20–летний период. При этом в качестве D0 выбирается такой день, начиная с которого солнечная активность стала увеличиваться, и это увеличение продолжалось 10 дней и более. Второй из использованных временных рядов Y состоял из общего числа сообщений на сети о наблюдениях в течение суток за перистыми облаками. Эти данные просуммированы для 20 сентябрей в соответствии с D0, D1, Dz и т.д. до D10. Полученные результаты представлены на рис. 5.7.

Если колебания, отраженные кривой а, реальны и обусловлены влиянием солнечной активности, то можно предположить, что соответствующая кривая, полученная по данным другой выборки, будет давать примерно те же колебания. Представленная на рис. 5.7. кривая б получена таким же способом по данным за январь за тот же 20–летний период. Анализ кривых показывает, что взаимосвязь между ними слабая. Коэффициент линейной корреляции составляет 0,25. О значимости этой корреляции можно судить, если составить ряд «бессмысленных» корреляций, основанных на последовательности ключевых дат, выбранных случайно. Такой опыт был выполнен. В нем использовались те же основные данные об облаках, как и в случае, когда ключевые даты выбирались по данным о солнечной активности. Были определены и расположены в возрастающем порядке 20 искусственных корреляций между «бессмысленными» F и наблюденными X: –0,46; –0,46; 3,36; –0,24; –0,23; –0,16; –0,13; 0,01; 0,02; 0,11; 3,17; 0,20; 0,22; 0,22; 0,23; 0,23; 0,30; 0,69; 0,72; 0,72. Так как 4/20, или 20%, этих случайных корреляций больше 0,25, то можно сделать вывод, что не обнаружено никакой заметной связи между солнечной активностью и перистой облачностью. Если какая–либо взаимосвязь такого рода и существует, то она, по–видимому, чрезвычайно слаба, и для того чтобы показать, что она имеется, понадобится значительно большее число данных.

Рис. 5.7. Число сообщений об облачности в ключевые даты и последующие 10 дней