Как стать автором
Обновить

Комментарии 18

также можно использовать Java scripting, либо просто дернуть сервис EvalCode передав туда скрипт

Не знал про EvalCode, хороший сервис. Теперь даже ставить ничего на FreeBSD не надо.
Я в свое время тоже писал автоматическую качалку с rapidshare — там URL кодировался urlencode, кажется
А потом они поставили капчу — видимо таких умников было слишком много :)
На сколько я знаю, сейчас rapidshare.com опять без капчи. Давно уже качаю с нее все подряд простеньким скриптом, который перебирает 128 IP адресов моего сервера :)
128 айпишников? о_О Зачем вам столько? У нас на проекте с 400к пользователями и 20 внешними запросами в секунду 50 айпишников хватает с головой.
Исторически так сложилось. Было время, лет 5 назад, сети в РТКомм'е давали бесплатно в нагрузку к серверу, если есть конкретное обоснование.
НЛО прилетело и опубликовало эту надпись здесь
Вы еще думаете?:)
Так а чем отличалась настоящая ссылка от ложных? Тем что для ее формирования скрипт использовал getElementById?
Ссылки ничем не отличаются, все они записываются в разные , но только один из показывается пользователю остальные остаются display:none. Поэтому без знания, какой включили в display:block нельзя понять какая ссылка настоящая.
парсер сожрал div
О… месяц назад писал нечто похожее (тоже со spiderMonkey) на питоне правда для другого известного сайта.

А сейчас волею судеб сам пишу динамический генератор запутанных JS… Весьма увлекательное занятие надо сказать!
А есть ли какое-то откомпилированное бинарное решение для выполнения Javascript?
типо: processjs.exe html_with_javascript.htm pure_html.htm, где
html_with_javascript.htm — это html файл с js кодом внутри, а
pure_html.htm — это обработанный файл, в котором все js вставки выполнены и преобразованы в Html.
Под Unix, к примеру, nodejs.org/

Для Windows в комплект поставки входит wscript.exe
Нашел вот такую штуку wxJavascript (http://www.wxjavascript.net/), даже работает из командной строки. Однако немного не то.

Она позволяет лишь выполнять js код, а у меня есть куча html файлов, с таблицами сформированными javascript-ом (при помощи функций и document.write), при чем код бывает разным.
Необходимо из них вытащить данные, сохранив целостность структуры. Теоретически конечно задача решаема, но хотелось бы 100% метод, чтобы без костылей.
Если вывод HTML только через document.write, то просто добавляешь в код конструкцию вида:

var document = new Object()
document.write = function theWrite(x) {print(x);};

и запускаешь скрипт.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории