All streams
Search
Write a publication
Pull to refresh
38
0

Пользователь

Send message
Это не хрень и не дождь, это граница области видимости радара. Радиус измерений этого инструмента ограничен и для серой области у нас нет данных об осадках. Мы хотим расширить область покрытия осадков, но это происходит постепенно.
Да, для такой карты много хороших применений, работаем над этим.
Мы часто получаем такие запросы и уже работаем над продуктом, который бы их удовлетворил. Оставайтесь с нами :)
Вы удивитесь, но эта информация достаточно ценная в смысле бизнеса, поэтому она много кому в отрасли интересна. Мы ведем такую статистику для себя и для своих партнеров. В США есть сайт www.forecastwatch.com, где можно найти примеры такой статистики (правда по их городам и провайдерам).
Условия доступа к API зависят от целей использования и всегда обсуждаются индивидуально. Напишите нам на api-weather@yandex-team.ru и мы сможем обсудить ваш кейс.

Насчет парсинга хочу отдельно напомнить что EULA еще никто не отменял. Например, в нашем EULA написано, что парсить данные с сайта — незаконно.

Я немного ответил выше про это. Эталоны для обучения в основном — данные с метеостанций или других настолько же надежных приборов. На них происходит обучение, кросс-валидация и валидация на отложенной выборке, все как в обычных data science процессах, с учетом некоторых особенностей. Например, при обучении и тестах важно не «залезть в будущее», чтобы данные о целевых значениях не просочились в факторы.

Все модели, которые работают в продакшене, автоматически и каждый день валидируются по всему набору станций. Мы сравниваем их прогнозы с несколькими моделями-кандидатами, а так же с чистыми прогнозами поставщиков погодных моделей, которые участвуют в формировании факторов.
Да, целью этого поста было описание архитектуры, а не ML части, поэтому этот кусок получился коротким. Попробую тот также коротко ответить.

Наши модели обучаются к показания метеостанций и другим надежным источникам метеорологических наблюдений. При этом вы совершенно правы, плотность таких измерений неравномерна. Однако, первым фактором, который влияет на точность, даже в самых удаленных регионах — это полнота данных, на которых мы обучаемся. Для того, чтобы модель спрогнозировала приход антициклона в деревню Малые Бугры, нужно показать модели много вариантов движения антициклона при определенных локальных особенностях — рельефа, подстилающей поверхности и так далее. При этом необязательно, чтобы примеры, которые видит модель при обучении, находились именно в Малых Буграх. Важно только чтобы пространство факторов было достаточно репрезентативно представлено в обучающей выборке. Так большие данные помогают моделям обобщать ситуацию, не полагаясь только на локальные измерения а-ля «циклон в Гадюкино всегда приходит с запада и уходит на восток».

При этом я нисколько не отрицаю важность локальных наблюдений. Мы много работаем для того, чтобы получать как можно больше достоверных измерений к себе в систему.
Как я написал в тексте, только с сегодняшним релизом в продакшен поехали модели, которые используют ML для прогноза силы и направления ветра. Теперь точность прогнозов
по этим параметрам заметно выросла. Раньше наш прогноз улучшался машинным обучением только в плане температуры и осадков.

В любом случае, буду благодарен за ваш фидбек при дальнейшем использовании сервиса.
Мы получили ваше письмо, спасибо. Некоторое время назад мы действительно испытывали некоторые трудности с прогнозом в вашем регионе, однако теперь ситуация должна нормализоваться. Пожалуйста, посмотрите на сервис в течение нескольких дней — стало ли лучше? Буду благодарен за ваш фидбек.
Поскольку фидбек достаточно однотипный, отвечу всем в общей ветке.

Действительно, анимация частицами ветра — хороший способ показать сразу несколько параметров на одной карте. Собственно, поэтому мы им и воспользовались, сделав самостоятельную реализацию на Яндекс.Картах.

Однако, на этом внешнее сходство заканчивается. Под капотом у нас собственный прогноз, рассчитанный с помощью ML. Наш прогноз значительно более точный, чем сырые модельные данные, показанные на приведенных сервисах. Именно расчету этого прогноза посвящена большая техническая часть статьи.

А кроме полей температуры и ветра, у нас есть наукастинг, которого ни у одного из наших конкурентов нет ;)
Привет!

Хочу внести немного ясности в вопрос о том, зачем нам нужны те или иные разрешения.

Начнем с основного момента — пользовательской геолокации. Это может показаться невероятным, однако мы и правда сделали прогноз погоды, способный показать данные именно для ваших координат. Хорошо известно, что погода может быть очень разной в разных частях города — например, в Бутово идет дождь, а на ВДНХ уже вовсю светит солнце. Для того, чтобы пользователи получали точные гиперлокальные данные о погоде (например, наш прогноз осадков с точностью до минут — наукастинг), мы и спрашиваем их координаты.

Это помогает нам предупредить например о том, что дождь над сквером, где вы сейчас гуляете пойдет через 10 минут. Полезно, правда? Тот же, кто по каким-то причинам не хочет передавать свое местоположение, всегда может отключить функцию геолокации и получат прогноз для центра своего населенного пункта.

Кстати, примерно за этим же мы просим доступ к сотовым данным: у нас есть достаточно много пользователей, которые, отключив геолокацию, жалуются на неправильно определенную позицию. Локация по сотовым вышкам помогает определить положение пользователя чуть более аккуратно, чем с точностью до города.

В посте говорится о том, что мы специально умалчиваем о запрашиваемых разрешениях — это не так. Дело в том, что большинство наших пользователей все еще работают с версиями андроида старше шестой, где нет возможности явно запросить разрешения. Мы обязательно обновим эту часть, как только доля последних версий андроида среди наших пользователей станет чуть больше. Однако, стоит отметить, что ни на одном устройстве приложение Погоды не запускается до тех пор, пока его не запустит пользователь. А как уменьшить количество работающих в фоне сервисов, мы обязательно придумаем.

Про приметы. У нас тоже есть примета — “Медленная загрузка данных в приложении — к письмам в фидбечницу”. В отличии от погоды за окном, на это мы можем повлиять, например попросив наше приложение периодически загружать актуальные данные о погоде. Также эта функция нужна, чтобы отправить нам пользовательские наблюдения за погодой, сделанные в отсутствии подключения к интернету. Эти данные помогают нам улучшать алгоритмы прогнозирования.

Ну а если резюмировать, то мы в Погоде в основном хотим, чтобы у нашей аудитории была возможность в полной мере использовать те технологии, которые мы разрабатываем.
Под долгосрочными прогнозами я имел в виду прогнозы на 5-10 дней, это и правда неточность моей терминологии. Что до наших климатических норм, которыми мы продолжаем прогноз, то имеют они отношение к будущему или нет, покажет время.

Вот вы, как метеоролог-любитель, наверняка знаете какая погода будет, например, во Владивостоке 25 января. Расскажите — сильно она будет отличаться от климатической нормы? Покажите, как говорится, свою точность.
Павел, спасибо за статью. Мне нравится ваш метод сравнения гораздо больше методички Росгидромета, но в реализации есть неточности.

Почему больше нравится — потому, что это реальный юзкейс живого человека. Так нашу погоду смотрят пользователи, так они принимают решения. Поэтому результат для меня в десять раз полезнее, чем доли градуса в среднем отклонении температуры (привет fantast8).

Главная неточность в том, что вы принимаете значение из поля фактической температуры за ground truth. На самом деле это тоже немного прогноз, просто более точный, чем тот, который сделан за 24 часа. Чтобы сравнение было более правильным, нужно сравниваться в точке, которая поближе к метеостанции (сейчас вы савниваете прогнозы и факты на точку, близкую к геометрическому центру Новосибирска).

Теперь о вечном — почему меняются прогнозы. Если коротко, то прогнозы меняются потому, что наши методы несовершенны и потому, что приходят новые данные. Если бы наши прогнозы на горизонт не более чем на 10 дней всегда были идеально точными, мы бы не меняли свои значения никогда, но это увы не так. Однако, мы знаем, что добавив актуальных данных в прогноз, мы повышаем точность на ближних горизонтах, что тоже важно для пользователей. Мы досыпаем новые данные в прогноз до 24 раз за день, поэтому и долгосрочные прогнозы, бывает, меняются. Мы знаем, что это плохо сказывается на нескольких юзкейсах и у нас есть мысли про то, как это полечить.
Нет, ничего такого мы не задумывали. Радар и правда может не видеть мелкие осадки любой фракции, и иногда с этим нельзя ничего поделать.
А давайте-ка я не буду с вами дискутировать, кажется это вполне бессмысленно.

В вашем посте про Метеум, как и в этом комментарии, достаточно много громких заявлений, а с той самой фактурой как-то не очень. Например, на нашем сайте вы смотрите погоду в центре города, но не говорите о том, где находится метеостанция, с которой взялись фактические значения. Да и даже независимо от этого, попытка вычислить «общий уровень точности» по одному прогнозу представляется мне достаточно рискованным статистическим упражнением.

График точности прогнозов в статье у меня, кстати, есть, но оставить только его было бы наверное неправильно, людям ведь и про радары интересно и про то, какой у нас продукт получился… Странно, в общем, что вы выбрали такой стиль общения, вероятно это как-то связано с целью самого комментария.
Я не до конца разобрался к чему у вас вопросы — к объему статей или к лексикону, но в любом случае обсуждать это не готов.
Мы уже начали работать с этими данными. Там достаточно много шума, но есть и сигнал.
Да, у нас есть мысли про то, как отвалидировать выпадение осадков на уровне земли на очень частой сетке. Сейчас мы просто стараемся как можно более точно предсказать следующую последовательность радарных снимков.

А вы — это кто?
Сравнение с AlphaGo ко многому обязывает, придется соответствовать :) Что до понятности описаний, то тут ту хум хау. Кому-то и анонса достаточно, чтобы найти и прочитать статьи в нужном направлении, а кому-то и открытх исходников не хватит.

Information

Rating
Does not participate
Location
Россия
Works in
Registered
Activity