Отключение гибернации оставляет спящий режим, так что такого как вы написали не будет. Ну и из спящего режима ноут выходит мгновенно даже с HDD: ведь вся инфа остаётся в памяти.
Кстати, несмотря на то, что OpenCL запускается и там, и там, ядра часто пишутся отдельные для CPU и GPU (если вообще используется CPU). Это связано с различными оптимизациями для этих устройств, код написанный для GPU будет значительно медленнее работать на CPU (по сравнению с оптимизированным для CPU). Ну а раз всё равно писать отдельный код, то можно воспользоваться и (субъективно) более удобными инструментами, чем OpenCL.
ATI Stream всё-таки достаточно устарел, сейчас развивается OpenCL, и лучше использовать именно его. Причём это будет работать практически везде: CPU, GPU разных производителей в отличие от CUDA и ATI Stream.
А что питон?) Вычисления-то всё равно на видеокарте, а питон только управляет ими. С md5 думаю будет порядка 300 миллионов для простого брутфорса, а при использовании многобуквенных слов большого прироста не должно быть. Надо будет проверить.
Ещё md5 можно более эффективно реверсить (предпосчитать несколько шагов в обратном направлении с конца для всех хэшей), а вот для случая SHA1 это вообще никак не повлияло на скорость (пробовал убрать последние 2 или 3 шага и сложение после них).
Ещё md5 можно более эффективно реверсить (предпосчитать несколько шагов в обратном направлении с конца для всех хэшей), а вот для случая SHA1 это вообще никак не повлияло на скорость (пробовал убрать последние 2 или 3 шага и сложение после них).