Комментарии 24
Сколько же весят ваши индексы на устройствах?
Привязаны ли они к георгафии пользователя?
Наши индексы привязаны к конкретным городам-проектам, например есть индексы Москвы, Новосибирска и другие.
Соответсвенно размер индексов разный для каждого города, его можно узнать в списке городов в приложении, например размер индекса Москвы около 300мб, а Омска около 45мб.
Ну только это размер не только поискового индекса, а вообще всех данных города, включая карту, дорожный граф и т.д. Отдельно индекс гораздо меньше занимает.
А цифра в списке городов несколько меньше размера данных на диске, т.к. это размер данных, передаваемых по сети при загрузке, а они пожаты lzma и распаковываются в процессе обновления на устройстве. Плюс часть файлов может шариться между несколькими городами, это тоже очевидным образом может влиять на цифру в списке городов.
Немного не в тему, грамотность постановки примера имеет значение. Если в примере заменить нового сотрудника на путешественника с личным авто тогда поменяется психологический портрет примера. Разъясняю мысль, новый сотрудник боится или стесняется спросить у коллег где можно поесть. Здесь явно что-то не то с новым сотрудником. Да и цифровой поиск выдаст только адреса, а коллеги явно подскажут тонкости кухни конкретного заведения.
До сих пор гораздо проще спросить новых коллег в офисе «где тут у вас обедают» и получить гораздо более подробный и точный ответ.
И только в случае если вы редкостно замкнутый человек, забегались на новой работе настолько, что не у кого спросить — все вышли, только тогда я бы обратился к поиску.
В общем, нафиг их, эти офисные легенды и пересказы пересказов.
Больше половины точек на карте будут нерелевантны.
Эххх, какие на курской раньше креветки варили нажористые к пиву! Народ специально ездил пивка попить туда.
На Курской найти поесть наверно не самая большая проблема в отличии от спальных районов...
Странно это всё. А где морфологический анализ, быстро сводящий "поесть" к другим синонимам? А где анализ кейсов, быстро отличающий "кофе на вынос" от "кофе на Курской" и"Китайскую кухню" от "Белорусских кухонь"? Что-то подобное есть, или вы проблему понимания что механическими методами?
У вас написано, что морфологический анализ ведёт к созданию токенов
[quot]
Так для токенов будут созданы термины:
«поесть»: «поедим», «поели», «поем», «поест», «поесть»
«на»: «на», «na», «nu»
«курской»: «курская», «курский», «курского», «курское», «курской»
[/quot]
То есть просто находятся разные формы слова (кстати, почему nu?), но не находится общий ключ "еда"?
Какая стадия тогда сужает контекст до
"Поесть = (действие, еда)
Курская = (геометка, м. Курская, Москва)"? Или такого нет?
История одного запроса