Комментарии 14
Во-первых, я начинающий программист.
Хм. Ну давайте без обид, но это — в десятых.
Во-первых, нужно бы пояснить, что вы понимаете под лучшими статьями (строго говоря, это вообще субъективно, если от статьи с высоким рейтингом лично меня тошнит — она плохая или хорошая?). Вы, кстати, вообще не описали как следует, как отбираются именно лучшие статьи, и почему получается именно за день. Неявно, из URL, можно догадаться, что вы отбираете топ Хабра. То есть своего критерия лучшести у вас нет. И судя по всему, вы даже рейтинги статей, авторов, их карму, и т.п. показатели не вытаскивали. И своего анализа провести не сможете.
Во-вторых, стоило бы пояснить, зачем вам это, то есть какова цель упражнения. Возможно это даже первый пункт, потому что понимание качества статьи может исходить из декларируемых целей.
Ну и в третьих, это настолько рутинная задача, что для ее решения (в намного более сложных форматах, а аутентификацией, капчей и прочим) придумано масса инструментов. И подобные задачи тут описаны тысячи раз. Так что третьим пунктом должна бы быть причина, почему именно вам нужно написать еще одну статью не эту изъезженную тему? То что вы начинающий — не повод сразу начинать публиковать свои решения, даже если для вас они новые и интересные. Читателям-то почему это должно быть интересно?
Спасибо, за комментарий! Я учту моменты и постараюсь исправиться и становиться лучше, если ответить на первое, то это выбираю не я, а есть раздел на Хабре, где можно посмотреть лучшие статьи за день, а насчет цели, она была в том, чтобы собрать все статьи вместе и проанализировать какие статьи тебе интересны, возможно перейти и прочитать. Ещё раз благодарю вас за потраченное время!
Не очень корректный комментарий.
Есть категория читателей Хабра, которым это действительно может быть важно, полезно и интересно.
По Вашему, публикацией статей необходимо заниматься исключительно после того как разработаешь собственную ОС? В заголовках статей есть критерий сложности, который стоит учитывать при прочтении и комментировании
А хорошо было бы, если бы на Хабре появился отдельный проект (или раздел) «для новичков и начинающих». Чтобы молодые таланты могли тоже постить не сложные, но полезные и хорошие технические статьи при этом не ловя из минусомета за простоту.
А может попробовать нащупать API?
Статья просто отличная Вы молодец. Очень подробно все описали. На этом примере становится многое понятно. Мне очень понравилось, спасибо Вам большое!
soup = BeautifulSoup(req, "lxml")
Если я правильно помню, для использования lxml его надо отдельно установить (pip install lxml). Чем не угодил html.parser?
Неплохо, но использование RSS гораздо проще, чем парсить всё DOM дерево
Парсер лучших за сутки статей habr(а) на Python. Очень подробно и просто