ЛАБОРАТОРНАЯ РАБОТА 1
Первичный анализ структуры временных рядов с данными гидрометеорологических наблюдений

Цель работы. Знакомство с модулем Вasic Statistics/Tables (Основные статистики и таблицы). Вычисление описательных статистик. Стандартизация рядов наблюдений. Сравнение эмпирического распределения с нормальным.



Задание

Для двух рядов с данными наблюдений вычислить описательные статистики и собрать их в 4 отдельные группы: показатели положения, разброса, асимметрии и показатели, описывающие закон распределения. Стандартизовать ряды двумя способами. Проверить ряды на наличие выбросов. Проверить соответствие рядов нормальному закону распределения визуальными и теоретическими методами.


Справочные сведения

Модуль Вasic Statistics/Tables (Основные статистики и таблицы) содержит процедуры вычисления описательных статистик (Desсriptive statistics), построения корреляционных матриц (Correlation matrices), критерий Стьюдента проверки однородности для независимых и зависимых выборок (t-test for independent and dependent groups), построения частотных таблиц (Frеquence tables), вероятностный калькулятор (Probability calculator) и др. Обычно с этого модуля начинают работу в пакете.

Методами описательной статистики принято называть методы описания выборок х1, х2,…,хn, (n - количество наблюдений в ряду) с помощью различных показателей и графиков. Полезность методов описательной статистики состоит в том, что несколько простых и довольно информативных показателей могут дать предварительное представление о выборке. Показатели, описывающие выборку, можно разбить на несколько групп.

Показатели положения описывают положение данных на числовой оси. Примеры таких показателей - минимальный и максимальный элементы выборки, верхний и нижний квартили (они ограничивают зону, в которую попадают 50% процентов центральных элементов выборки). Наконец, сведения о середине совокупности могут дать выборочные среднее значение, медиана и мода, которые еще называют мерами центральной тенденции.

Показатели разброса (меры изменчивости) описывают степень разброса данных относительно своего центра. К ним в первую очередь относятся: дисперсия выборки, стандартное отклонение , размах выборки (разность между максимальным и минимальным элементами), межквартильный размах (разность между верхней и нижней квартилью), коэффициент эксцесса, коэффициент вариации.

В гидрометеорологической практике широко используется относительный показатель изменчивости значений ряда наблюдений - коэффициент вариации Cv, который является более или менее устойчивой величиной и при симметричных распределениях обычно не превышает 0,5, но при сильно асимметричных рядах может достигать 1,0 и даже быть выше. Варьирование считается слабым, если Cv не превосходит 0,1; средним, если составляет 0,1 - 0,25 и значительным при Cv > 0,25 (Берестнева, Муратова, Уразаев, 2003). Эти показатели говорят, насколько кучно основная масса данных группируется около центра.