Комментарии 15
Один мой друг интересуется, нет ли такого же, но для порнолаба и с сохранением скриншотов?
+19
Нету, подправить скрипт не сильно сложно, но:
1) Из-за более низкого числа сидеров, раздачи, удаленные с сайта, будут быстрее умирать.
2) В текущей версии с сайта тянется только исходный код описания, ссылки на внешние хостинги останутся ссылками и их (пока они не умрут) можно будет посмотреть из просмотрщика.
3) Если вы хотите сохранять все скриншоты с внешних сервисов, вам понадобится уметь парсить еще и их.
1) Из-за более низкого числа сидеров, раздачи, удаленные с сайта, будут быстрее умирать.
2) В текущей версии с сайта тянется только исходный код описания, ссылки на внешние хостинги останутся ссылками и их (пока они не умрут) можно будет посмотреть из просмотрщика.
3) Если вы хотите сохранять все скриншоты с внешних сервисов, вам понадобится уметь парсить еще и их.
+1
Просто видеть html страницы as is было бы достаточно ;)
+1
В общем я посмотрел, спарсить порнолаб можно, нужна минимальная переделка скрипта.
Основная выявленная проблема: на странице не публикуется хэш раздачи, необходимо качать torrent-файл и вытаскивать из него.
Для нового пользователя ограничение — 5 торрентов в сутки. А без хэшей база и не особо нужна.
Основная выявленная проблема: на странице не публикуется хэш раздачи, необходимо качать torrent-файл и вытаскивать из него.
Для нового пользователя ограничение — 5 торрентов в сутки. А без хэшей база и не особо нужна.
0
Положим, пользователь не новый )
0
Максимум 100 торрентов в день: pornolab.net/forum/viewtopic.php?t=980552#4
Даже с такой скоростью всю базу выкачивать сильно затратно по времени.
Можно выкачивать только определенные разделы, или только наиболее популярные раздачи.
Например, сейчас только 400 раздач имеют > 200 сидов.
Даже с такой скоростью всю базу выкачивать сильно затратно по времени.
Можно выкачивать только определенные разделы, или только наиболее популярные раздачи.
Например, сейчас только 400 раздач имеют > 200 сидов.
0
Для одного моего знакомого делал функцию для телеграм-бота, чтобы по определенному запросу боту он отвечал случайной ссылкой с порнолаба, но не осилил отделить ссылки именно на раздачи от ссылок на разделы и прочих ссылок. Нет мыслей как там всё это реализовано? В каких диапазонах лежат айди раздач?
0
Идентификатор просто икрементируется, разделения по типам нет. Для такой задачи нужно пройти по всем id и сохранить тип.
0
>>На момент начала работы над скриптом, rutracker еще не выкладывал свою базу
А можно др.линк на базу или MD5 от файла?
А можно др.линк на базу или MD5 от файла?
0
Кхм, простите не сведущего в этих делах, но зачем всё-таки это было сделано? Нет, я прочитал секцию «зачем» и всё равно не понял, зачем это делать при работающем сайте.
0
Пытался починить parser, но все равно не хочет. Выдает free cookie not available, хотя ссылки и пути верные...видимо. что еще мешает.
Тем не менее, удалось починить viewer.py (см. github проекта) в issues.
0
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Оффлайн база rutracker с описаниями раздач и возможость поиска по категориям