Comments / Profile of tovbinm / Habr

User

ML на Scala с улыбкой, для тех, кто не боится экспериментов

tovbinm May 23 2019 at 07:40

Если есть необходимость построения моделей для таблиц, то рекомендую ознакомится с TransmogrifAI — github.com/salesforce/TransmogrifAI

«Тайна третьей планеты» с улучшенной нейросетями графикой

tovbinm May 18 2019 at 00:28

Спасибо. Суперски получилось!!!

-1

Как геокодировать миллион точек на Spark по-быстрому?

tovbinm Feb 10 2019 at 07:15

Ага, статья грамотная. Я собираюсь с автором кстати пообщаться в ближайшее время. Есть у меня к нему ряд вопросов.

Как геокодировать миллион точек на Spark по-быстрому?

tovbinm Feb 10 2019 at 07:09

А в чем спорт?

С Lucene заранее например индексируем точки городов мира отсюда, а потом загружаем на каждом Executor в Spark и опрашиваем.

Поиск в радиусе на индексе из ~3 млн точек и точности в ~1 метр берет окоро 2 мс на запрос. А вот поиск топ ближайших городов работает значительно медленнее 700-1000 мс на запрос, т.к. индекс по всей видимости не используется.

Как геокодировать миллион точек на Spark по-быстрому?

tovbinm Feb 10 2019 at 06:10

Вот еще отличный вариант с использованием Lucene — opensourceconnections.com/blog/2014/04/11/indexing-polygons-in-lucene-with-accuracy