Обновить
-1
0

Пользователь

Отправить сообщение
Если есть необходимость построения моделей для таблиц, то рекомендую ознакомится с TransmogrifAI — github.com/salesforce/TransmogrifAI
Спасибо. Суперски получилось!!!
Ага, статья грамотная. Я собираюсь с автором кстати пообщаться в ближайшее время. Есть у меня к нему ряд вопросов.
А в чем спорт?

С Lucene заранее например индексируем точки городов мира отсюда, а потом загружаем на каждом Executor в Spark и опрашиваем.

Поиск в радиусе на индексе из ~3 млн точек и точности в ~1 метр берет окоро 2 мс на запрос. А вот поиск топ ближайших городов работает значительно медленнее 700-1000 мс на запрос, т.к. индекс по всей видимости не используется.
Вот еще отличный вариант с использованием Lucene — opensourceconnections.com/blog/2014/04/11/indexing-polygons-in-lucene-with-accuracy

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность