Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
… самое важное, чтобы эта информация попала в один (а лучше в несколько) структурированных источников … Единственное известное место, это Google LBC.
Справка: Охтинский вокзал существовал до 1929 года и сейчас на его месте просто набережная
веб-сайты содержащие крупные каталоги компаний; данные с этих сайтов забираются индивидуальным краулером, который регулярными выражениями выпарсивает информацию со страниц каталога
Поэтому, когда для предприятия определены основные поля (название, адрес, номер телефона), осуществляется веб-поиск по запросу:
название_предприятия+адрес_предприятия
и найденные страницы (а главное ключевые слова из найденных страниц) ассоциируются с данными о компании.
«Как ищет и как не ищет Google Maps. Главное заблуждение — в том, что «Google Maps находит информацию о компаниях в интернете». Это не совсем так.»

1. У Яндекса (который покупает базы и указывает поставщика)
есть данные про этот банкомат
2. Страница-источник (http://www.raiffeisen.ru/) указанная Гуглом, напротив, не содержит данных про этот банкомат, (как же гугл с неё взял данные ?)
вместо того, чтобы строить предположения о том как Google «выгрызает» данные из веб страниц
Google или Яндекс в поте лица пишут конвертеры и заключают договора со всевозможными страницами разной степени желтизны, ибо такой процесс не scalable, на это не хватит никаких ресурсов.
Вы утверждаете что Гугл геокодирует все подряд страницы, и если вышло, добавляет в local DB.
Как ищет и как не ищет Google Maps