Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Оказалось, что preg_match некорректно работает с очень большими скрытыми полями.
Хорошо хоть не пришлось учить еще и css
Вообще-то я верстальщик
По приведенной вами же ссылке ясно сказано о количестве символов. Скрытые поля тут непричем, функция тупо работает с ХХХ символами текста.
Верстальщик не знающий CSS?!
В целом статья неочем. Поток создания с кусами внеконтекстного кода.
function curlFunction($url, $postdata=false) {
$uagent = "Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; .NET CLR 1.1.4322)";
$ch = curl_init($url);
curl_setopt($ch, CURLOPT_URL, $url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); // возвращает веб-страницу
curl_setopt($ch, CURLOPT_HEADER, 0); // не возвращает заголовки
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1); // переходит по редиректам
curl_setopt($ch, CURLOPT_ENCODING, ""); // обрабатывает все кодировки
curl_setopt($ch, CURLOPT_USERAGENT, $uagent); // useragent
curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 120); // таймаут соединения
curl_setopt($ch, CURLOPT_TIMEOUT, 120); // таймаут ответа
curl_setopt($ch, CURLOPT_MAXREDIRS, 10); // останавливаться после 10-ого редиректа
curl_setopt($ch, CURLOPT_POST, 1);
curl_setopt($ch, CURLOPT_POSTFIELDS, $postdata);
curl_setopt($ch, CURLOPT_COOKIEJAR, "cookie/route_cookie.txt");
curl_setopt($ch, CURLOPT_COOKIEFILE,"cookie/route_cookie.txt");
$content = curl_exec( $ch );
curl_close( $ch );
return $content;
}
История о парсинге одного aspx сайта