vyacheslav_ka Jun 11 2012 at 14:26

Солим пароли

2 min

93K

Information Security*

+16

Comments 88

grimich Jun 11 2012 at 14:29

Я вот только не очень понимаю как потом с хешем с динамической солью работать. Соль чтоли отдельно придется хранить для каждого пароля?

vyacheslav_ka Jun 11 2012 at 14:31

Да, в таблице теперь будет храниться не только логин/хеш пароля, но и значение динамической соли, сгенерированной, например, при регистрации пользователя. Сейчас добавлю этот момент в пост.

grimich Jun 11 2012 at 14:31

если утекает база целиком, то какая разница динамическая соль у тебя или статическая?

grimich Jun 11 2012 at 14:32

Хотя в случае тупого брутфорса видимо поможет

vyacheslav_ka Jun 11 2012 at 14:35

База утекла, только как теперь пароли подобрать то? В случае использования SHA, подобрать пароли для, хотя бы десятка пользователей, уже будет проблематично.

VolCh Jun 11 2012 at 14:39

Для каждого юзера брутфорсить надо по новому. Если у двух юзеров одинаковый пароль то со статической солью будет и одинаковый хэш, с динамической — разный. Если использовать в качестве динамического ключа не случайную строку, а хэш других уникальных полей (id, login, e-mail, ...) или даже их напрямую, то можно не хранить отдельно, главное не забывать при изменении «ключа» перегенерировать хэш.

grimich Jun 11 2012 at 14:42

А, вот теперь понятно, спасибо :)
И про другие поля сразу не додумался, интересно

zobov Jun 11 2012 at 14:44

Например, можно использовать в качестве динамической соли — кусок от sha1 (айди пользователя ):
$id — id пользователя в базе
$password — его пароль
Тогда, cолью будет $salt=sha1($id), а хэшем пароля — sha1($password. substr($salt,0,6)).

Тогда, утащив базу, злоумышленник получит только базу соленых хэшей без самих солей. А соли высчитываться будут в скриптах. Правда, это будет дополнительная нагрузка, но не об этом разговор.

faiwer Jun 11 2012 at 15:50

Пару раз встречал подобный подход. Всегда удивляло это: substr($salt,0,6). Поясните, пожалуйста, почему не просто $salt? Зачем её ещё обрезать? Дабы уменьшить коллизии? А разве оных будет много при пароле до 20+ символов?

isden Jun 11 2012 at 14:49

Можно определить соль фиксированной длины, и в базе, в поле пароля хранить склейку "<хэш пароля>+<соль>. Ну или склеивать еще более хитрым алгоритмом.
Но это все имеет смысл только если утекла одна только база и неизвестен алгоритм склейки.
Как вариант кстати — использовать бинарную реализацию алгоритма генерации значения поля пароля для базы (например, своим расширением для PHP).

VolCh Jun 11 2012 at 15:03

>Но это все имеет смысл только если утекла одна только база и неизвестен алгоритм склейки.

Известный алгоритм не избавит от необзодимости подбирать каждый хэш.

ngreduce Jun 11 2012 at 18:58

Если база не утекла, то можно и в открытом виде держать.

Elkan Jun 11 2012 at 14:56

эм… немного не понял, ну будет у вас в таблице еще одно боле с солью (обычное нехешированое поле) и в чем тогда выигрыш? т.е. слив базу злоумышленник получает связки пароль + соль для пароля, остается только разгадать алгоритм как соль участвует в получении пароля + сам пароль, разве не так?

VolCh Jun 11 2012 at 15:06

Если соль статическая (одинаковая для всех юзеров), то у всех паролей qwerty в базе будет хэш bdadb0330124cda0e8499c9cd118f7bd, подобрав пароль для одного пользователя мы получим пароли остальных с таким же хэшем. А будет соль у каждого своя — нужно будет подбирать у каждого.

Kolonist Jun 11 2012 at 15:08

Еще раз.

1. Нет соли — используем уже готовые радужные таблицы.
2. Есть одна на всех соль — генерируем одну радужную таблицу и «ломаем» по ней всех пользователей.
3. Есть отдельная соль для каждого пользователя — отдельно брутфорсим каждого пользователя.

Elkan Jun 11 2012 at 15:23

и что дальше? вы радужную таблицу сами будете генерировать? хм, сомневаюсь. пункт 1 ясен всем, пункт 3 — единственное преимущество это только выигрыш времени в брутфорсе каждого отдельно взятого пользователя, т.е. фактически как я и описал выше все сводится к: узнать алгоритм применения соли + сам пароль, так? поэтому как-то совсем не выигрышно, ну будет 2 польз. с разной солью, но одинаковыми паролями и что? зная алгоритм как соль применяется в пароле тут они абсолютно ничем не защищены.

newpavlov Jun 11 2012 at 15:30

Вы в курсе что такое хеш-функция? Зная хеш вы не можете эффективно узнать входное значение, в идеале вы можете сделать это не быстрее чем тупым перебором, это так называемая односторонняя функция, краеугольный камень современной криптографии.
Так что вы знаете алгоритм и соль, но это вам никак не поможет избежать перебора для нахождения пароля. Так что в случае 2 вам достаточно подобрать пароль у одного пользователя и вы автоматически узнаете пароли у всех пользователей использовавших этот пароль. В случае же 3 вам придётся брутфорсить для каждого пользователя отдельно, посему скорость узнавания паролей катастрофически снижается.

Elkan Jun 11 2012 at 15:33

Вы опять отвечаете на то что понятно любому, я рассматриваю ситуацию для разных пользователей у которых разные пароли. поэтому случай 3 странный совсем, хранить соль рядом с паролем. соль лучше вычислять динамически взависимости от каких либо данных, а не хранить рядом в поле, а то смысл 3его пункта тогда совсем теряется, т.к. зная соль и алгоритм можно тупо перебирать по таблицам так же как и всегда.

newpavlov Jun 11 2012 at 15:43

Для полностью скомпрометированной системы (слиты дамп БД и исходники) ваше «динамически вычисляемая» соль не будет ничем отличаться от соли хранимой рядом с результирующим хешем. Тем не менее, да, как дополнительный ступень усложнения жизни злоумышленника это имеет право на жизнь, примерно это я и описывал в идеальной на мой взгляд схеме.

зная соль и алгоритм можно тупо перебирать по таблицам так же как и всегда.

Для вас радужные таблицы это что-ли какая-то магия? Почитайте хотя-бы вот этот раздел на вики. Я посмотрю как вы будете составлять таблицу для строк у которых длина больше 20 символов в которые входит длинное случайное сочетание символов и особенно мне интересно откуда вы достанете столько памяти.

Elkan Jun 11 2012 at 15:50

Нет не магия я про это и говорю, что особого смысла в этом и нет. Там ниже описали как составлять. habrahabr.ru/post/145648/#comment_4894829

newpavlov Jun 11 2012 at 15:59

В чём нет смысла? Процитирую вас:
>поэтому как-то совсем не выигрышно, ну будет 2 польз. с разной солью, но одинаковыми паролями и что? зная алгоритм как соль применяется в пароле тут они абсолютно ничем не защищены.
В среднем пользователи будут защищены лучше, т.к. что бы взломать эти два пароля злоумышленнику придётся брутфорсить в два раза дольше, а значит стоимость взлома одного пароля станет больше, что равнозначно лучшей защищённости паролей в данной схеме.
Упреждая уже приевшуюся риторику: когда говорят о схемах защиты и соления подразумевается что защищается вся база целиком, а не какой-то отдельный пользователь. Для защиты одного пользователя соли мало спасают, в т.ч. и ваши «динамически генерируемые», единственный путь здесь это использовать медленные хеш-функции.

В любом случае, будьте подробны обозначить свою позицию поподробней, иначе мне уже совершенно непонятно что вас не удовлетворяет в обсуждаемых схемах и к чему у вас есть претензии.

Elkan Jun 11 2012 at 16:05

Я ссылку вашу прочитал, решение хорошее да. Я ниже описал, что рассматриваю ситуацию когда нужно взломать 1го конкретного пользователя, тогда особо хранение соли рядом с паролем не поможет, я считаю что соль должна динамически генерироваться. ладно тут и так слишком много моих комментов, мне ваша позиция ясна :)

silentnuke Jun 11 2012 at 17:56

«Мыши плакали, кололись, но продолжали грызть кактус»
>> т.к. зная соль и алгоритм
чтобы узнать алгоритм, нужно глянуть исходники (да, есть вариант самому его подобрать, но мы его опустим). Раз есть исходники, точно также можно посмотреть как «динамически» генерируется ваша соль. Собственно профит сомнительный, кроме как лишняя нагрузка, чтобы каждый раз ее вычеслять

Elkan Jun 11 2012 at 18:02

Ваше мнение очень интересно :)

Kolonist Jun 11 2012 at 15:41

и что дальше? вы радужную таблицу сами будете генерировать? хм, сомневаюсь

Почему сомневаетесь? На моем скромном ноутбуке, скриптом на PHP у меня генерируется примерно 1,7 млн. MD5-хэшей в секунду. Так что сгенерировать радужные таблицы по словарю или перебором коротких паролей с любой солью — задача не такая уж и невыполнимая.

все сводится к: узнать алгоритм применения соли + сам пароль, так?

Нет, не так. По-умолчанию всегда считаем, что алгоритм известен.

и что?

Т.е., по-Вашему, нет разницы, применить ли один раз брутфорс и тем самым получить пароли всех пользователей сразу, или для каждого пользователя запускать брутфорс заново? По-моему, очевидно, что во втором случае хакер потеряет времени больше во столько раз, сколько в базе пользователей!

Т.е. если у нас одна соль на всех, и хакер может генерировать радужную таблицу для словаря и недлинных алфавитно-цифровых паролей за 7 дней, то именно 7 дней у него уйдет на взлом всех пользователей. Если же соль для каждого пользователя разная, то 7 дней (ну чуть меньше) у хакера уйдет на взлом одного пользователя! А если пользователей 1000, то на из взлом потребуется уже 7000 дней, т.е. почти 20 лет!

А если еще и использовать действительно медленный алгоритм для получения хэша пароля, чтобы в секунду хакер мог генерировать не миллионы значений, а сотни или даже десятки, то и одного пользователя таким образом взломать будет за приемлемое время невозможно.

Elkan Jun 11 2012 at 15:45

>>На моем скромном ноутбуке, скриптом на PHP у меня генерируется примерно 1,7 млн. MD5-хэшей в секунду
>>Т.е. если у нас одна соль на всех, и хакер может генерировать радужную таблицу для словаря и недлинных алфавитно-цифровых паролей за 7 дней
что-то как то слабо кореллирует одно с другим. я спрашиваю не про всех пользователей а про одного конктретного, пусть хакере интересует 1 конкретный польз. а не все, выигрыш в хранении в поле БД динамической соли в данном случае сомнителен. Щас опять заминусуют специалисты криптозащиты из школы :D

Kolonist Jun 11 2012 at 15:54

Пример про 7 дней у меня чисто гипотетический, с реальным временем ничего общего не имеет и ни на какие конкретные функции не ориентирован.

Если хакера интересует один конкретный пользователь, то, естественно, выигрыша нет. И если в системе предполагается лишь один пользователь, то соль можно хранить хоть в конфиге, хоть в самом коде (хотя это и не гибко).

Ну а если у вас в системе предполагается много пользователей, то хоть тут-то Вы видите преимущества разной соли для каждого пользователя?

Elkan Jun 11 2012 at 15:56

Естественно, я спорил про ситуацию когда нужено получить пароль конкретного пользователя, а тут сразу «специ криптозащиты» заминусовали, ппц. Редко когда хакеру нужно получить пароли именно _всех_ пользователей, почти всегда интересует кто-либо конкретный скорее всего.

Kolonist Jun 11 2012 at 16:06

Скорее наоборот. Хакеров в большинстве случаев будут интересовать все пользователи, вернее, как можно больше пользователей. Зачем? Потому что есть большая вероятность того, что пароли, украденные с какого-либо сайта, подойдут к email-ам, указанным пользователя на том же сайте. А это спам, это связанные аккаунты в социальных сетях, в которых, опять же, спам.

А вот ситуацию, при которой с сайта крадут базу данных, чтобы найти пароль какого-то одного пользователя, мне как-то сложно представить — цель не оправдывает средства.

impfromliga Jan 25 2023 at 12:10

можно еще чуть-чуть приподнять сложность дополнив последний вариант до
4. дополнительная глобальная соль всасывается сервом из внешнего репозитория секретов

тогда не только пароль прийдется для каждого брутить но и соль придеться брутить (т.к. соль обычно лежит вместе с хешем она и утекает из базы вместе с ним) (хотя аналогичного результата можно добиться увеличив длинну хеша, но это делает медленнее ваш сервер, так что все хотят экономить)

Keyten Jun 11 2012 at 20:19

А нельзя использовать в качестве соли уже существующие данные? Например, логин

alisey Jun 11 2012 at 20:27

Можно, используют. Но лучше всего случайные числа. Так даже удобнее, хранятся с хешем одной строкой.

MuLLtiQ Jun 11 2012 at 14:35

Чаще используется «засаливание» не самого пароля, а хэша от него:

password = md5(md5(password) + salt)

vyacheslav_ka Jun 11 2012 at 14:37

С точки зрения брутфорса нет разницы как засаливать. Также, насколько я помню, брать хеш из хеша — плохо, добавляет коллизий.

MuLLtiQ Jun 11 2012 at 14:55

Ну вероятность коллизии будет одинаковая, сколько вложенных хэшей не делай. А вот если злоумышленнику известна соль — то со вложенным md5, по-моему, сложнее — надо 2 раза перебирать хэши — сначала чтобы вычислить md5(password) + salt, затем сам password.

yeputons Jun 11 2012 at 15:12

Это почему она будет одинаковая? При каждом применении функции хэширования множество значений неувеличивается. Остаётся прежним оно только тогда, когда коллизий нет вообще. Коллизии md5(<some_hash>) не изучены, поэтому считать, что их нет было бы странно. В результате чем больше применяем, тем меньше множество значений и тем больше вероятность коллизии.

MuLLtiQ Jun 11 2012 at 15:14

А с чего вы взяли что чем больше мы применяем, тем меньше множество значений?

yeputons Jun 11 2012 at 15:26

Оно не больше по очевидным причинам. А так как вопрос «остаётся ли оно таким же (т.е. нет коллизий при применении функции ко всем возможным хэшам» открыт и неизучен, было бы странно надеяться на то, что их нет. Тут пишут.

С другой стороны, я действительно не понимаю, как это может помочь при взломе и подборе.

MuLLtiQ Jun 11 2012 at 15:23

Не забывайте, что там не md5(), а md5( + salt), причем salt — динамическое значение.

yeputons Jun 11 2012 at 15:27

А вот про это забыл, извиняюсь. Может стать сильно лучше.

VolCh Jun 11 2012 at 15:14

Не будет она одинаковая в общем случае. Может быть несколько паролей, которые дадут одинаковый внутренний хэш, и может быть несколько сочетаний этого хэша с солью, которые дадут одинаковый итоговый хэш.

Lockal Jun 11 2012 at 15:23

Скорее всего это историческое прошлое конкретных продуктов. Конкретный пример: в MediaWiki используется два вида хэшей: «:A:md5(password)» и «:B:salt-md5(salt-md5(password))». Первый вариант — исторический, когда ещё радужные таблицы не были в обиходе. Потом до разработчики сообразили, что нужна соль, но что делать сайтам, где уже зарегистрированы тысячи пользователей, а в базе данных только хэши? Пришлось хэшировать хэши.

А брутфорсить такие хэши (и то только такие) умеет John the Ripper community-enhanced version.

Lockal Jun 11 2012 at 15:25

*и не только такие

david_mz Jun 11 2012 at 18:57

> но что делать сайтам, где уже зарегистрированы тысячи пользователей, а в базе данных только хэши

Взять эти _хэши_ да просолить. То есть вообще никаких проблем…

BeLove Jun 11 2012 at 14:41

Так же, как вариант, чтобы отдельно не хранить соль:

sha1($login.":".$password);

leviathan Jun 11 2012 at 14:43

Или номер ID пользователя — юзернейм иногда может меняться, тогда хеш нужно будет генерировать заново, а ID обычно постоянен.

VolCh Jun 11 2012 at 15:15

ID плохо для атак по словарю, по-моему.

DeusModus Jun 11 2012 at 14:49

Неожиданно врывается в тред.

kriptomen Jun 11 2012 at 14:50

А стоит ли использовать sha1? На php.net — не рекомендуют, также, как md5.

Kolonist Jun 11 2012 at 15:02

Стоит использовать специально для этого предназначенные функции, например, PBKDF2 или Bcrypt.

alisey Jun 11 2012 at 15:16

> Вот здесь и кроется минус статической соли: злоумышленник сможет сгенерировать свою таблицу хешей со статической солью

Минус не в этом. Минус в том, что хеши для разных пользователей будут совпадать если у них одинаковый пароль. Ломать их становится проще, так как пароль явно словарный.

SHA* не подходят для хеширования паролей. Автор заметки плохо осведомлен. Годные алгоритмы — это PBKDF2, bcrypt и scrypt.

vyacheslav_ka Jun 11 2012 at 15:19

> Минус не в этом.
Нет, в этом. С одной статической солью мы можем сгенерить для данной базы свою таблицу.
Насчет SHA поясните, почему нет?

Kolonist Jun 11 2012 at 15:21

Слишком быстрый.

alisey Jun 11 2012 at 15:43

Да, согласен, и то и другое.

SHA задуман быть быстрым, брутфорсится он тоже быстро. scrypt задуман как алгоритм с регулируемой скоростью (чтобы замедлять его с ростом производительности процессоров), требованиями к памяти, и невозможностью распараллелить на GPU.

vvzvlad Jun 11 2012 at 15:31

неделя засолки на хабре.

Just123i Jun 11 2012 at 16:48

А если динамическую соль не хранить в базе, а генерировать каждый раз при необходимости? Это разве не лучше, чем хранить в одной таблице хеши паролей и соль?

Kolonist Jun 11 2012 at 17:07

Вы опять пытаетесь прятать алгоритм.

Just123i Jun 11 2012 at 17:32

Но ведь если у злоумышленника будут хеши паролей и соли, то потеряется сама суть соли, разве нет? Или я что-то не так понимаю?

Kolonist Jun 11 2012 at 17:39

Вы не так понимаете. Суть соли не в том, что ее никто не знает. Напротив, соль не следует прятать. Соль нужна для того, чтобы сделать невозможным применение заранее сгенерированных радужных таблиц, а также для того, чтобы максимально усложнить жизнь хакеру, если он решит сбрутить пароли пользователей.

Посмотрите вот этот комментарий: habrahabr.ru/post/145648/#comment_4894759 и дискуссию, возникшую на его основе.

Just123i Jun 11 2012 at 20:10

Все, теперь понял. Большое спасибо.

Imposeren Jun 11 2012 at 17:43

грубо говоря что бы проверить правильно ли пользователь ввёл пароль нужно дописать к нему соль и взять от суммы хеш. Что бы хеши совпали, нужно что бы совпадал и пароль и соль. Т.е. брать соль наугад каждый раз нельзя.

d00kie Jun 11 2012 at 17:40

Еще для «торможения» процесса брутфорса или усложнения генерации таблицы рекомендуется прогонять хеш функцию не один раз, а так с тысячу другую. Типа «key stretching».

anor Jun 11 2012 at 18:00

И при хорошей посещаемости убить на это все ресурсы)

barmaley_exe Jun 11 2012 at 18:44

Насколько, интересно, должна быть хорошей посещаемость, чтобы процедура авторизации вызывалась столь часто?

anor Jun 11 2012 at 19:19

Даже при авторизации в 10 человек в секунду, при тысяче-другой прогонов мы получим — 10-20 тысяч прогонов хеш функции в секунду.

Нужно конечно делать исследования, но думаю, ресурсы это нормально кушает)

anor Jun 11 2012 at 19:27

Хотя, конечно, нужно тестировать.

d00kie Jun 11 2012 at 19:44

Хотя я был не совсем корректен, так как проверял Си'шным брутером, а не php'ным вызовом. PHP тормознее, не спорю… но вот у товарища выше, MD5 через PHP — 1,7 лямов в секунду. Что так же намного больше чем 20 тысяч. Соответственно, по любому — 20 тыщ в секунду не сильно уронит CPU, тем более на сервере 8)

d00kie Jun 11 2012 at 19:31

Нет, пример у меня ноут 3 ляма в секунду генерит (SHA1) при этом забирая 14% времени CPU (i7 2,6ггц). Так что 20 тыщ хэшиков в секунду для серванта…

d00kie Jun 11 2012 at 19:35

На том же ноуте — SHA2(516) — Работает 900 тысяч хэшей в секунду, при тех же 14% CPU.

d00kie Jun 11 2012 at 19:36

MD5 — 7 лямов в секунду…

d00kie Jun 11 2012 at 18:45

спорно…

d00kie Jun 11 2012 at 18:48

И вообще, все это уже было и обсуждалось — habrahabr.ru/post/130965/

avknsk Jun 11 2012 at 18:50

Кол-во пользователей начинающих сессию в каждый момент времени будет не очень велико. Для юзера задержка, скажем в секунду, при логине не имеет значения, а вот злоумышленник уже не сможет эффективно подбирать пароль.

newpavlov Jun 11 2012 at 18:28

Лучше тогда сразу использовать предназначенные для этого средства, а не мастерите велосипед.

d00kie Jun 11 2012 at 18:52

Верно)

avknsk Jun 11 2012 at 18:44

Есть какие — нибудь среднестатистические данные о том, сколько по времени займет подбор пароля по его хэшу для разных хэш-функций на среднестатистическом ПК?

barmaley_exe Jun 11 2012 at 18:59

Есть немного данных для размышления:
В интернетах говорят, что MD5 на GPU можно перебирать со скоростью в 200-500 миллионов хешей в секунду.
Немногим выше говорится о 1.7 млн./сек на ноутбуке и php.

d00kie Jun 11 2012 at 19:39

У меня MD5 — 7 лямов в секунду, без ГПУ на ноуте.

d00kie Jun 11 2012 at 19:45

ах да… он на пхп это делал… ) Все, понял-понял…

Kolonist Jun 11 2012 at 20:29

Ага, у меня это был PHP-скрипт, процессор: core i3. Так что о реализациях на компилируемых языках с применением GPU и говорить не приходится — 200-500 млн. вполне реальная цифра.

sic Jun 11 2012 at 18:53

Вот вы написали статью, и людей вводите в заблуждение, подумайте, и исправьте пожалуйста:

Вот здесь и кроется минус статической соли: злоумышленник сможет сгенерировать свою таблицу хешей со статической солью и получить значения большинства паролей

Что это дает: теперь нельзя будет сгененерировать одну таблицу хешей, для нахождения значения хеша с динамической солью придется генерировать заново.

У вас, и у многих, какая-то чудодейственная вера в то, что таблицы ускоряют перебор. Но это не так.
В ряде случаев, это не верно, даже для готовых таблиц или при отсутствии соления.

Радужная таблица — это всего-то способ time-memory trade-off хранения предвычисленных хешей. Для того чтобы, найти в таблице один хеш, нужно выполнить O(chain_length) операций хеширования, и затратить до O(log(tables_size)*chain_length) операций сравнения на поиск значения. chain_length обычно варьируется от 2000 до 10000, размер таблиц — сотни гигабайт соответственно. Поиск, обычно, занимает больше времени, чем хеширование, поэтому позволим себе пренебречь временем хеширования.

Пусть у нас есть 10 миллионов слитых хеш-значений. И таблицы на 100Гб при длине цепочки в 5000 (реальная «емкость» таких таблиц едва ли позволит с достаточной вероятностью содержать комбинации диапазона 1-7 алфавитно-цифровых + спец-символов). Для того чтобы проверить всю коллекцию хешей придется совершить
10 000 000 * O(5000 * log(100Gb)) ~= 10e+13 операций. Плюс считывание с диска. И здесь поиск почти никак не ускорить, ибо 100Gb не влезают в разумный размер памяти.

При брутфорсе же, по тому же диапазону, соответственно
100Gb * 5000 * log(log(10 000 000)) ~= 5e+12 операций. То есть, грубо говоря, в два раза меньше. при этом log(log()) для поиска — не самый оптимальный вариант, есть возможность выполнить поиск в пределах O(1) (например хеш-поиск).

Считал в уме, возможны ошибки. Но мораль в том, что таблицы для массового взлома дают худший результат, чем брутфорс — и по времени и по вероятности.

А если еще и добавить время на генерацию таблицы… Никто и никогда, в здравом уме, не станет генерировать таблицу для статической соли.

Статические соли плохи тем, и только тем, что никак не мешают массовому взлому. Ну а динамические — соответственно делают его очень невыгодным.

vyacheslav_ka Jun 11 2012 at 19:00

Я не ввожу людей в заблуждение. Радужные таблицы хешей для паролей без соли _уже_ сгенерированы, надо только найти это значение. В случае применения соли таблицу необходимо генерировать заново.

sic Jun 11 2012 at 19:10

по поводу «только найти» я уже написал — обычно это дольше чем просто массовый брутфорс. Поэтому и начинать заметку следует с того, что мы пытаемся не «защищаться от таблиц», а усложнить массовый перебор. Таблицы здесь не причем.

«необходимо генерировать заново» — вот именно это
1) не необходимо
2) не разумно
3) и, соответственно, никто так делать не будет.

alisey Jun 11 2012 at 19:28

В фразе «сгенерировать свою таблицу хешей со статической солью» есть доля истины. Если соль одна — мы можем брутфорсить по словарю все аккаунты сразу. Клеим соль к слову «123456», получаем 4000 попаданий. Клеим к «qwerty», еще 3000. То есть это упрощает нам перебор.

sic Jun 11 2012 at 19:44

да, мы и будем брутфорсить по словарю все аккаунты сразу.

а таблицы же, работают для каждого хеш-значения последовательно. если у нас их миллионы, то это миллионы прогонов по табилцам соответственно.

а количество попаданий — вообще не очень существенная величина, ведь набор хешей на перебор разумно сначала почистить от дубликатов. и да, именно с разными солями этих дубликатов и не будет. (но это никак к таблицам не относится, о чем я и писал)

alisey Jun 11 2012 at 20:10

Э. Как последовательно? А бинарные деревья зачем?

Если соль уникальна для каждого, то набор неразумно чистить от дубликтов, не будет их там. А если соль одинакова для всех, то вопрос «подходит ли пароль 123 юзеру asdf» " превращается в «продходит ли пароль 123 кому-нибудь из пользователей», а это уже куда более высокие шансы на успех. Затраты — сгенерить один хеш, и найти его в дереве за O(log n)

alisey Jun 11 2012 at 20:16

Или даже лучше, раз все данные помещаются в память можно использовать тупо хеш-таблицу, поиск за O(1).

sic Jun 11 2012 at 20:28

у нас есть n — хеш значений, и таблица на m — элементов.
грубо говоря, нужно сделать (n*chain_length) * m операций сравнения, и, конечно бинарный поиск позволяет ускорить правую часть: O(n*chain_length * log(m)) операций, но не левую. Если не очевидно, почему так, посмотрите habrahabr.ru/post/82941/