k06a 18 июн 2011 в 23:43

Анализ реальных паролей пользователей и улучшенный полный перебор

3 мин

8.2K

Информационная безопасность*

+68

Комментарии 44

ArtemSmirnov 18 июн 2011 в 23:50

Вот еще анализ 62k паролей добытых LulzSec, но там информация совсем скудная.

k06a 19 июн 2011 в 01:44

Зато там автор пытался классифицировать пароли по тем или иным признакам. Например, 12к паролей из 62к полностью состоят из цифр — это значительный процент. Все остальные обобщения плавают на уровне 3-5%. С точки зрения перебора по словарю они представляют интерес. С точки зрения брута я думаю столь малые доли не имеет смысла рассматривать.

romeo_ordos 18 июн 2011 в 23:55

Судя по вашему анализу, мои пароли не пользуются популярностью, и это радует)

+21

SADKO 19 июн 2011 в 00:37

Научный подход.

Traveler 19 июн 2011 в 01:20

Можно существенно ускорить перебор паролей брутфорсом, хотя… с таким бэкграундом брутфорсом этот метод уже не назовешь)

k06a 19 июн 2011 в 01:29

Можно назвать статфорсом. На основе статистик же))

sic 20 июн 2011 в 17:54

в свое время, когда занимался UDC тоже использовал статистические методы. Считал декомпозицию паролей из большой базы (20 миллионов) на комбинации символов, идущие подряд, в зависимости от позиций, грубо — в начале, в середине, в конце.
затем перебирал словарь_начальных_комбинаций x словарь_средних_комбинаций^n x словарь_конечных_комбинаций. какие-то оптимизации, чтобы выкидывать повторные проверки не проводил, но в целом это позволяло «восстанавливать» до 75% паролей меньше чем за час.

k06a 20 июн 2011 в 18:01

Если я правильно понял за час перебора вы получали 75% исходных паролей? Или нет? Это на одной персоналке?

sic 20 июн 2011 в 18:15

да, перебирал на одной машине (причем лет 5 назад было, так что мощности соответствующие), а проценты от слитой, например с форума базы хешей. причем половина паролей подбирались буквально за пару минут.

Noospheratu 25 авг 2011 в 17:00

смартфорс

solarfly 19 июн 2011 в 04:12

Тема интересна, развивайте. Еще бы увидеть алгоритм на языке программирования.

-1

kaaquantum 19 июн 2011 в 04:44

Тема очень интересная, но возник иной вопрос: чем анализировали базу паролей и чем создавали графики? Как раз ищу удобный инструмент для последнего.

Hurd 19 июн 2011 в 07:01

Не знаю, что использовал автор, но в любом случае рекомендую посмотреть в сторону R.

k06a 19 июн 2011 в 07:24

Извините, но аббревиатура слишком коротка, чтобы искать её в интернете))

Hurd 19 июн 2011 в 07:29

Эмм… в википедии поиск отрабатывает на раз.
«R — язык программирования для статистической обработки данных и работы с графикой, а также свободная программная среда вычислений с открытым исходным кодом в рамках проекта GNU.»

Сайт проекта тут

k06a 19 июн 2011 в 07:01

Анализ производил самописной программой на плюсах. Графики их MS Excel.

kaaquantum 19 июн 2011 в 17:18

хех, давно видно я в Excel не заглядывал, раз у них уже такие неплохие графики отрисовываются.

Ну а я бы тогда порекомендовал использовать матлаб, тк он как раз под эти задачи, а R для новика мозгодробителен.

Wott 19 июн 2011 в 07:18

ага, научный подход :)
а нормализовать по частотам для обычного языка? и что-то мне подсказывает что после нормализации будет более случайное распределение. А следовательно перебор по словарю будет гораздо успешней.

k06a 19 июн 2011 в 07:35

Сегодня вечером просто для интереса прогоню обычный текст и построю графики. Всё-таки пароли пользователей мне кажется более специфичны, чем просто текст. Чаще используются звонкие слова, например.

darkfrei 19 июн 2011 в 13:22

Не обычный текст, а только существительные и имена :)

k06a 19 июн 2011 в 13:27

Где такой взять?) Словарь туда загнать?

darkfrei 19 июн 2011 в 14:10

Собственно да, подвергнуть статистике словарный поиск паролей.

iximiuz 19 июн 2011 в 17:55

Тут вопрос более глубокий. Если использовать полученные статистические данные для атаки на пользователей из приблизительно той же языковой и социальной группы, то никакая нормализация не нужна и использование результатов статистики даст выигрыш при переборе. Но вот если есть желание воспользоваться данной статистикой, как универсальной — то тут можно уже говорить о нормализации, но при этом полученные данные скорее всего приведут к мысли, что статистика бесполезна, что Вы и утверждаете. Следовательно, не стоит пользоваться конкретными результатами как неким плацебо, а нужно взять на вооружение сам механизм анализа и применять его к конкретным ситуациям. Но в любом случае практика — критерий истины, так что хорошо бы теперь посмотреть статистику получения выигрыша от использования буквенно-частотной статистики =)

Neofant 19 июн 2011 в 08:32

Судя по количественному анализу букв, у многих пароль должно быть: reason :) И кстати, биграммы интересные получились.

alexey_uzhva 19 июн 2011 в 08:48

Что-то мне подсказывает что существует 2 принципиально разных варианта:

1) Осмысленный пароль (фраза, комбинация, или еще что-то)
2) Сгенерированный пароль

Для сгенерированных паролей частотные анализы — заведомо ересь, потому как они случайны. Для осмысленных же перебор слов по словарю будет гораздо эффективней чем попытка эти слова сгенерировать.

k06a 19 июн 2011 в 09:17

Я думаю сгенерированных паролей не так много, чтобы они значительно повлияли на статистику.

VolCh 19 июн 2011 в 10:29

Есть пароли осмысленные для создающего, но случайные на первый взгляд — генерируемые не по случайному алгоритму.

Bright 19 июн 2011 в 11:28

Есть не осмысленные «случайные» пароли и при этом не сгенерированные программами. Лично мне проще запомнить последовательность символов, которую я придумал сам, чем ту, которую выдала какая-то программа.

pechlambda 19 июн 2011 в 09:11

Простите за занудство, но я уже не первый раз в топиках подобного содержания встречаю утверждения вроде «как видим, биграммы совсем не случайны».

Будем рассуждать по порядку. Строго говоря, пароль вообще нельзя считать случайной последовательностью символов (если речь о придуманных пользователями, таких большинство). Но в контексте брутфорса каждый конкретный пароль для конкретного логина можно считать случайным.

Далее, каждая случайная величина (возвращаясь к нашим ~~баран~~ биграммам, случайной величиной будет являться дискретная случайная величина со значениями в виде всевозможных биграмм) обладает своим законом распределения! И то, что очень и очень многие тут называют «случайно» на самом деле приравнивают по смыслу к «равновероятно». Закон распределения может быть каким угодно, вообще любым, и величина от этого случайной быть не перестанет. Закон распределения (для дискретной величины) есть множество значений величины и соответствующие им вероятности. Равномерный закон распределения — это очень частный случай! Давайте будем грамотнее.

P.S.: пока писал комментарий, увидел, что тоже относится и к комментарию выше от товарища alexey_uzhva. Конечно, сгенерированные пароли случайны, однако закон распределения символов по их местам в пароле нам неизвестен. Ведь очевидно, что генератор вряд ли допустит последовательности «ааа» или «111», значит он уже не равномерный для каждой позиции. А проведенные в этом и предыдущем (а он как раз рассматривал только пароли, не подобравшиеся по словарю!) топиках исследования показывают, что он довольно интересный и может облегчить брут.

VolCh 19 июн 2011 в 10:33

Конечно, сгенерированные пароли случайны, однако закон распределения символов по их местам в пароле нам неизвестен. Ведь очевидно, что генератор вряд ли допустит последовательности «ааа» или «111», значит он уже не равномерный для каждой позиции.

Однажды, когда военный генератор пароля случайно выдал осмысленную фразу, подтверждая древний тезис об обезьяне, которая способна сочинить «Войну и мир», паника поднялась на весь бывший СССР...

Andrew1000000 19 июн 2011 в 14:11

Почему же не допустит последовательности «ааа» или «111»? Они могут сгенерироваться случайно.

Wolong 20 июн 2011 в 19:11

я думаю практически все на хабре знакомы с основами основ теории вероятности, и знают хотябы приблизительно, что такое функция распределения

k06a 20 июн 2011 в 19:32

Всё дело в том, что я проводил анализ не с точки зрения теории вероятности, а с точки зрения математической логики, дискретной математики и комбинаторики.

miwa 19 июн 2011 в 09:17

Прочитал как «Анализ анальных паролей...». Не понял. Прочитал повторно — «Ректальный анализ паролей». Нажал на ссылку. Прочитал в третий раз. Окончательно проснулся.
Мне пора к доктору, да?

-2

k06a 19 июн 2011 в 09:25

Воскресенье. 9 утра.

НЛО прилетело и опубликовало эту надпись здесь

Vasily_Pupkin 19 июн 2011 в 12:24

Это все конечно мило и познавательно, но неплохо было бы посмотреть на реальные оценки и испытания. Ведь нерабочие часы тоже показывают два раза в день правильное время

k06a 19 июн 2011 в 13:19

В следующей статье будет и код и результаты и оценки ускорения перебора.

sic 20 июн 2011 в 17:59

может с кодом поможет, реализация переборщика и генератора rainbow tables по частотным таблицам,

sic 20 июн 2011 в 17:59

habrahabr.ru/blogs/personal/88939

k06a 20 июн 2011 в 18:21

Не найдется у вас ссылки на описание этой техники. Было бы интересно почитать.

darkfrei 19 июн 2011 в 13:21

– Учитель, я подобрал хороший пароль, которого не может быть в словарях.
Инь Фу Во кивнул.
– Я ввёл его в Гугле, – продолжал Сисадмин, – и убедился, что в Сети такого сочетания нет.
– Теперь есть.

+12

Vidmak 20 июн 2011 в 21:44

Коллеги, может я не в теме, но о каких атаках идет речь? И какая практическая польза от словарей?

а) после неправильного ввода добавляем задержку (0.1 секунды, 0.2 секунды, 0.4 секунды, 0.8 секунда, 1.6, 3.2)
б) на 3-й неправильный ввод присылаем каптчу на вход
в) на 10-й неправльный вход блокируем вход в аккаунт.

k06a 20 июн 2011 в 22:47

Никто этого не написал ни в комментариях ни в статье но подразумевается, что есть хэш пароля и к нему надо подобрать пароль. Сервер то понятное дело так не брутануть, да и скорость подбора была бы крайне низкой.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Анализ реальных паролей пользователей и улучшенный полный перебор

Комментарии 44

Публикации

Истории