Тут на самом деле у автора вряд ли стояла цель разобрать полностью всю «Big-Oh notation». Конечно, сравнение верно только начиная с некоторого n, но давайте представим, что тут вместо общего случая тут рассмотрен просто один из примеров, причем учебный, целью которого является лишь поверхностно коснуться «Big-Oh notation» без сильного погружения в математику.
Для вводной статьи это ОК, кто захочет большего, тот найдет.
ИМХО.
Время поиска по snapshot практически не зависит от размера ящика, а от количество слов в запросе зависит линейно.
Время поиска по xlog линейно зависит от его размера (а его максимально допустимый размер — от конкретных настроек демона).
Математическое ожидание времени исполнения поискового запроса — 200мс (посчитано на живом сервере).
Подробные графики покажем в ближайшее время (возможно, это тема для отдельного поста).
Важно, чтобы все записи в словаре имели одинаковую длину. Благодаря этому достаточно легко организовать бинарный поиск по нему.
Кроме того, существуют определенные требования к размеру индекса. Во-первых, таким образом экономится пространство на жестких дисках. Во-вторых, меньший по размеру словарь быстрее читается в память. А CRC32 меньше, чем средней длины слово.
В поиске по почте таких запросов нет. Обычно поисковый запрос представляет собой 1-2 слова, либо e-mail (или его часть). Максимум, чем мы рискуем, это большим количеством результатов, чем могло бы быть при «полном совпадении».
Для вводной статьи это ОК, кто захочет большего, тот найдет.
ИМХО.
Максимально подробно я описывал в своем прошлом посте: habrahabr.ru/company/mailru/blog/167497/
Время поиска по xlog линейно зависит от его размера (а его максимально допустимый размер — от конкретных настроек демона).
Математическое ожидание времени исполнения поискового запроса — 200мс (посчитано на живом сервере).
Подробные графики покажем в ближайшее время (возможно, это тема для отдельного поста).
Кроме того, существуют определенные требования к размеру индекса. Во-первых, таким образом экономится пространство на жестких дисках. Во-вторых, меньший по размеру словарь быстрее читается в память. А CRC32 меньше, чем средней длины слово.