Pull to refresh

Сезоны сменяют друг друга всё раньше из года в год в Кемерово

Statistics in IT Ecology

В очередной раз поежившись, я полностью застегнул куртку и ускорил шаг, торопясь на работу. На работе горячий кофе, тёплый системный блок и интересные задачи. Но не они крутились у меня в голове, пока холодный ветер шарил у меня за пазухой, а небольшое смутное подозрение относительно смены сезонов. Необходимо было проверить, действительно ли потепление и похолодания приходят вовремя, а не раньше? Может быть сезоны сдвинуты?


Само собой разумеется, по-прибытии на работу я и думать забыл о своем смутном подозрении. Но оно не рассеялось окончательно, а периодически всплывало в голове, когда, например, я страдал от зноя в мае или видел желтеющее дерево в июле.



Итак, толком не следуя принципу, что нужно начать делать задумку в первые 48 часов, спустя много месяцев я таки провел небольшое исследование для проверки своего подозрения. Напоминанием стала статья на Гисметео.


Данные


Первым делом необходимо было раздобыть данные. Как оказалось, найти среднесуточные температуры не так-то просто, как может показаться. После пятиминутного гугления я наткнулся на вопрос на Тостере, откуда попал на сайт www.ncdc.noaa.gov. Но полученные данные меня не удовлетворили (много пропусков в датах), продолжил гугление получил искомое на сайте http://aisori-m.meteo.ru/waisori/.


Кусочек данных:


29645 1955 1 1 "-31.0"
29645 1955 1 2 "-23.8"
29645 1955 1 3 "-18.7"
29645 1955 1 4 "-13.3"
29645 1955 1 5 "-16.8"
29645 1955 1 6 "-16.8"
29645 1955 1 7 "-18.6"
29645 1955 1 8 "-17.0"
29645 1955 1 9 "-6.7"
29645 1955 1 10 "-10.4"

Получение годовых температур со смещением


Первым делом, я преобразовал csv с данными в массив объектов.


Затем написал функцию, которая возвращала из массива год со смещением на некоторое количество дней.
Детальнее, у нас есть такой кусочек массива:


...
1955 12 29 -34.5
1955 12 30 -37.7
1955 12 31 -36.3
1956  1  1 -29.2
1956  1  2 -32.9
1956  1  3 -38.1
1956  1  4 -36.6
...

Если в функции запросить все данные 1956 года, то просто они и вернулся, а если запросить данные со смещение в -1 день, то температура для каждого дня будут браться из предыдущего дня. То есть для 1го января 1956 года, будет браться температура 31 декабря 1955 года


...
1956  1  1 -36.3  ← (из 1955 12 31)
1956  1  2 -29.2  ← (из 1956  1  1)
1956  1  3 -32.9  ← (из 1956  1  2)
1956  1  4 -38.1  ← (из 1956  1  3)
...

Получение среднемесячной температуры


В полученном срезе массива за год, я высчитывал среднемесячные температуры, тем самым получая вектор температур для года.


[
    -16.716129032258067,
    -16.317857142857143,
    -17.690322580645155,
    -11.57333333333333,
    0.3967741935483872,
    9.163333333333332,
    17.845161290322586,
    17.225806451612904,
    15.490000000000004,
    9.922580645161291,
    1.7233333333333334,
    -8.26774193548387
] 

Расстояние между смещенными годами


Если у меня есть вектор температур для года, то я могу сравнить расстояние между векторами.
То есть, если бы погода вообще почти не менялась год от года, то расстояние между векторами было бы равно нулю. Отсюда я решил, что буду сравнивать, к примеру, вектор 2001 года и все вектора 2002 года, полученные смещением.


...
2001 год == 2002 год -2 дня
2001 год == 2002 год -1 дня
2001 год == 2002 год 
2001 год == 2002 год +1 день
2001 год == 2002 год +2 дня
...

После брать смещение того сравнения, где расстояние между векторами минимально. То есть, если окажется, что расстояние между 2001 годом и 2002 годом +2 дня минимально, то значит сезон 2002 года был смещен на 2 дня вперед относительно 2001 года.


Забегая вперед скажу, что я брал за начальный год 1956 и смотрел смещение на 30 дней вперёд и назад.


Оформляем код


Алгоритм я запрограммировал на js и сделал небольшой сайт для удобства проверки.
Исходный код на гитхабе.


Проверяем предположения


Кемерово


Ага! Сезоны стали меняться быстрее с 2013 года на 10 дней, а в среднем с 1956 года на 8 дней!


Москва


Смещения почти нет.


Архангельск



Калининград



Санкт-Петербург



Тюмень



Владивосток



Заключение


Ощущение не обмануло, но ощущения проверять всё же нужно.


P.S. На самом деле я искал Новосибирск. На сайте Новосибирска не оказалось, но Кемерово меня полностью устроило.


P.P.S. Как оказалось немного позже — то в файле не хватало 2018 года, а мне нужен был январь этого года, поэтому недостающий месяц я скачал с сайта pogodaiklimat.ru.

Tags: погодасезонностьстатистикаjavascript
Hubs: Statistics in IT Ecology
Total votes 29: ↑27 and ↓2 +25
Comments 21
Comments Comments 21

Popular right now