Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
по сравнению с парой тысяч для бинарного поиска — это уже ≈20 раз
Если же использовать не бинарный поиск (а структура индексов завязана сейчас в основном на блоки дисков либо на кластеры ФС) — то оно будет падать гораздо быстрее.
К тому же все эти записи, по сути, будут верными, т.е. вероятность найти коллизию растет пропорционально величине «мусорных» данных.
Мои доводы: хешей едва ли будет 1 штука. Если хешей будет тысяча, 10^3 ≈ 2^10 — придется 10 раз прочитать диск. Т.е. разница между боле-мене реалистичными тысячью и мусорным миллиардом по времени — всего в 3 раза.
Вроде в статье говорится про слабость, что ты можешь подбирать пароль к одному пользователю, но «внезапно» хеш окажется в таблице от другого юзера или еще хуже сгенерированный и пройдешь, но не никак не «любой»!
То есть вместо проверки того, совпадает ли этот хэш с хэшем конкретного пользователя, мы проверяем только то, есть ли такой хэш в системе вообще.
профайлер сообщал, что запрос на существование занимает меньше 1 миллисекунды.
Как лучше хранить хэши паролей