Search
Write a publication
Pull to refresh
17
0
Пётр В @osanwe

Руководитель группы ML Яндекс Погоды

Send message

Мы на регулярной основе оцениваем качество нашего прогноза по радарам, метеостанциям и сообщениям пользователей. Для этого используются как ML'ные метрики, такие как IoU, Precision, Recall, если мы говорим про осадки, так и доменные метрики, например, доля идеальных двухчасовых прогнозов, если мы говорим про наукаст

Собственно данные метеорадаров мы активно и используем в прогнозе на карте осадков

Мы используем как готовые прогнозы от ведущих мировых гидрометцентров, так и считаем свою модель. Далее эти прогнозы учитываются в наших ML-моделях

А в каком районе, если не секрет, и какого типа наблюдались проблемы?
Спасибо, проверим, но так у нас данные те же самые.
Если я правильно понял, то вопрос про добавление единицы в числителе и знаменателе. Это сглаживание Лапласа, которое в данном случае уменьшает вероятность переобучения.
До момента «сейчас» мы показываем снимки с радаров. После этого начинаются предсказания. Таким образом, на моменте «сейчас» чаще всего показывается первый шаг предсказания. Это связано с тем, что имеются накладные расходы на доставку и обработку свежих снимков
Мы использовали оригинальный алгоритм, предложенный NVidia [1], и адаптировали его под специфику радарных и спутниковых данных [2]

[1] arxiv.org/abs/1804.07723
[2] arxiv.org/abs/1812.10915
Всё зависит от потребностей. Базовые функции обеспечиваются. На части девайсов есть поддержка Android-приложений, которыми можно заменить недостающие нативные.
Да, мы рассматривали подобные варианты атаки. В качестве варианта противодействия возможно использование случайных серверов для отправки и получения модели и данных. Также нам не известны случаи успешного извлечения пользовательской информации путём сопоставления нескольких версий рекуррентной модели. Однако эксперименты в данном направлении безусловно необходимы.
Хороший вопрос, которым мы тоже задавались.

При обучении на устройстве используется подход случайного «повторения» уже обработанных данных в дополнение к новым пользовательским (random rehearsal method). Таким образом, текст, набранный пользователем, смешивается со случайным отрывком из начальной тренировочной выборки в пропорции 1 к 1. Как результат, мы выполняем некоторую регуляризацию, которая позволяет нивелировать сильно выраженные персональные особенности набранного пользователем текста.
1) Да, в собственном менеджере Wi-Fi также используется ConnMan.
2) Для работы с кешированными сетями используется SavedServiceModel.

Information

Rating
760-th
Works in
Registered
Activity