Articles / Profile of evil

evil_factory Mar 25 2014 at 02:45

Учимся бороться с ëÒÁËÏÚÑÂÒÙ

1 min

32K

Недавно у меня возникла потребность скачивать кучу всяких документов из веба. Естественно не ручками, а питонячими скриптами. Но вот беда — довольно часто странички содержат кракозябры ~~какую-то хрень~~.

Читать дальше →

+24

evil_factory Nov 4 2013 at 01:47

Экстрактор контента из веб-документов

3 min

24K

Python*Data Mining*Qt*

Здравствуй, Хабр!

Это мой первый пост, в котором я хочу поделиться своей наработкой в решении такой задачки, как выделение контента на странице. Собственно, задачка давно висела в голове в фоновом режиме. Но так сложилось, что именно сейчас мне самому понадобился инструмент, кроме того наткнулся на статейку на хабре: habrahabr.ru/company/mailru/blog/200394 и решил — пора. Ладно, поехали.

Читать дальше →

+31