Обычно я формирую запрос таким образом, чтобы на выходе ошибки и положительные результаты сохранялись в два разных файла.
Адреса которые не были найдены пробую геокодировать обычным геокодером с изменением текста адреса. Например у меня была ситуация когда геокодер не нашел «микрорайон Камвольно-суконный Комбинат», но при небольшой замене на «мкр Камвольно-суконный Комбинат», я получил правильные координаты.
Если имеются исходные координаты и геокодирование выполняется для теста сервиса, то можно легко вычислить расстояние между двумя результатами и разбираться где и почему большие ошибки.
Чаще всего исходных координат нет, поэтому прогоняю результаты через несколько сервисов геокодирования, анализирую результаты.
Согласен есть компании, которые полностью основываются на данных OSM c дополнительной обработкой, другие самостоятельно занимаются сбором, модерацией и интеграцией данных, поэтому тут однозначно утверждать сложно.
К сожалению нет возможности предоставить датасет в общий доступ так как данные не мои и это не уход от вопроса качества. Конечно, результаты варьируется в зависимости от мельчайших неточностей в адресе и тут уже идет речь о синтаксическом анализе исходного набора данных.
Ничего не имею против OSM, сам активно пользуюсь данными.
Абсолютно согласен насчет качества бесплатных сервисов. Тут зависит о задачи, которую требуется решить, для приложений с постоянным потоком пользователей логично использовать обычный прямой и обратный геокодер, тут вопросов нет. Но периодически бывают запросы от специалистов из ГИС отдела — выполнить геокодирование большого датасета и тут уже удобней все данные загрузить в облако и не тратить свое время.
Адреса которые не были найдены пробую геокодировать обычным геокодером с изменением текста адреса. Например у меня была ситуация когда геокодер не нашел «микрорайон Камвольно-суконный Комбинат», но при небольшой замене на «мкр Камвольно-суконный Комбинат», я получил правильные координаты.
Если имеются исходные координаты и геокодирование выполняется для теста сервиса, то можно легко вычислить расстояние между двумя результатами и разбираться где и почему большие ошибки.
Чаще всего исходных координат нет, поэтому прогоняю результаты через несколько сервисов геокодирования, анализирую результаты.
К сожалению нет возможности предоставить датасет в общий доступ так как данные не мои и это не уход от вопроса качества. Конечно, результаты варьируется в зависимости от мельчайших неточностей в адресе и тут уже идет речь о синтаксическом анализе исходного набора данных.
Ничего не имею против OSM, сам активно пользуюсь данными.