Мы на регулярной основе оцениваем качество нашего прогноза по радарам, метеостанциям и сообщениям пользователей. Для этого используются как ML'ные метрики, такие как IoU, Precision, Recall, если мы говорим про осадки, так и доменные метрики, например, доля идеальных двухчасовых прогнозов, если мы говорим про наукаст
Если я правильно понял, то вопрос про добавление единицы в числителе и знаменателе. Это сглаживание Лапласа, которое в данном случае уменьшает вероятность переобучения.
До момента «сейчас» мы показываем снимки с радаров. После этого начинаются предсказания. Таким образом, на моменте «сейчас» чаще всего показывается первый шаг предсказания. Это связано с тем, что имеются накладные расходы на доставку и обработку свежих снимков
Всё зависит от потребностей. Базовые функции обеспечиваются. На части девайсов есть поддержка Android-приложений, которыми можно заменить недостающие нативные.
Да, мы рассматривали подобные варианты атаки. В качестве варианта противодействия возможно использование случайных серверов для отправки и получения модели и данных. Также нам не известны случаи успешного извлечения пользовательской информации путём сопоставления нескольких версий рекуррентной модели. Однако эксперименты в данном направлении безусловно необходимы.
При обучении на устройстве используется подход случайного «повторения» уже обработанных данных в дополнение к новым пользовательским (random rehearsal method). Таким образом, текст, набранный пользователем, смешивается со случайным отрывком из начальной тренировочной выборки в пропорции 1 к 1. Как результат, мы выполняем некоторую регуляризацию, которая позволяет нивелировать сильно выраженные персональные особенности набранного пользователем текста.
Мы на регулярной основе оцениваем качество нашего прогноза по радарам, метеостанциям и сообщениям пользователей. Для этого используются как ML'ные метрики, такие как IoU, Precision, Recall, если мы говорим про осадки, так и доменные метрики, например, доля идеальных двухчасовых прогнозов, если мы говорим про наукаст
Собственно данные метеорадаров мы активно и используем в прогнозе на карте осадков
Мы используем как готовые прогнозы от ведущих мировых гидрометцентров, так и считаем свою модель. Далее эти прогнозы учитываются в наших ML-моделях
[1] arxiv.org/abs/1804.07723
[2] arxiv.org/abs/1812.10915
При обучении на устройстве используется подход случайного «повторения» уже обработанных данных в дополнение к новым пользовательским (random rehearsal method). Таким образом, текст, набранный пользователем, смешивается со случайным отрывком из начальной тренировочной выборки в пропорции 1 к 1. Как результат, мы выполняем некоторую регуляризацию, которая позволяет нивелировать сильно выраженные персональные особенности набранного пользователем текста.
2) Для работы с кешированными сетями используется
SavedServiceModel
.