Как стать автором
Обновить
0
@warlockkzomread⁠-⁠only

Пользователь

Отправить сообщение

Web Scraping

Время на прочтение4 мин
Количество просмотров45K

Введение


Всем привет. Недавно у меня возникла идея о том, чтобы поделиться с интересующимся кругом лиц о том как пишутся скраперы. Так как большинству аудитории знаком Python все дальнейшие примеры будут написаны на нём.


Данная часть рассчитана для того, чтобы познакомить тех, кто ещё не пробовал себя в данной сфере. Если вы уже продвинутый читатель, то можете смело листать дальше, но для сохранения закономерности я бы посоветовал уделить немного внимания данной статье.


print('Part 1. Get started')

Инструменты


  • Язык программирования и соответствующие библиотеки
    Конечно, без него никуда. В нашем случае будет использован Python. Данный язык является довольно сильным инструментом для написания скраперов, если уметь правильно пользоваться им и его библиотеками: requests, bs4, json, lxml, re.
  • Инструменты разработчика
    Каждый современный браузер имеет данную утилиту. Лично мне удобно пользоваться Google Chrome или Firefox. Если вы пользуетесь другим браузерами, рекомендую попробовать один из вышеперечисленных. Здесь нам понадобятся практически все инструменты: elements, console, network, application, debuger.
  • Современная IDE
    Здесь выбор остаётся за вами, единственное, что хотелось бы посоветовать — наличие компилятора, debuger'a и статического анализатора в вашей среде разработке. Я отдаю своё предпочтение PyCharm от JetBrains.
Читать дальше →
Всего голосов 15: ↑10 и ↓5+10
Комментарии23

Открытый курс машинного обучения. Тема 1. Первичный анализ данных с Pandas

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров1.1M


Открытый курс машинного обучения mlcourse.ai сообщества OpenDataScience – это сбалансированный по теории и практике курс, дающий как знания, так и навыки (необходимые, но не достаточные) машинного обучения уровня Junior Data Scientist. Нечасто встретите и подробное описание математики, стоящей за используемыми алгоритмами, и соревнования Kaggle Inclass, и примеры бизнес-применения машинного обучения в одном курсе. С 2017 по 2019 годы Юрий Кашницкий yorko и большая команда ODS проводили живые запуски курса дважды в год – с домашними заданиями, соревнованиями и общим рейтингом учаcтников (имена героев запечатлены тут). Сейчас курс в режиме самостоятельного прохождения.

Читать дальше →
Всего голосов 44: ↑43 и ↓1+42
Комментарии61

Хотите стать «учёным по данным»? Тогда не начинайте с машинного обучения

Время на прочтение4 мин
Количество просмотров9.4K

Самое большое заблуждение начинающих data scientist'ов, или что лучше стоит делать вместо изучения машинного обучения.

Читать далее
Всего голосов 12: ↑8 и ↓4+8
Комментарии22

Как с помощью хакатона столкнуть математиков и ML–щиков, и кто тогда победит

Время на прочтение10 мин
Количество просмотров3.5K

Введение


Эта статья о том, как мы совместно с роснефтёвой «дочкой» «Самаранефтехимпроект» и Казанским Федеральным Университетом в сентябре 2020 года провели «Хакатон трёх городов», на котором предложили студентам решить классическую задачу сейсмической корреляции отражающих горизонтов. С такими задачами постоянно сталкиваются специалисты по сейсморазведке по всему миру. Для участников задачу решили преподнести как «задачу поиска оптимального пути», чтобы не отпугнуть студентов страшными словами. В статье расскажем подробнее про задачу и разберём интересные решения участников. Это будет увлекательно для специалистов как по прикладному математическому моделированию, так и машинному обучению и анализу данных.
Читать дальше →
Всего голосов 16: ↑16 и ↓0+16
Комментарии0

Прогнозирование обводнённости скважин с помощью методов машинного обучения

Время на прочтение9 мин
Количество просмотров15K

Привет Хабр! По основной профессии я инженер по разработке нефтяных и газовых месторождений. Я только погружаюсь в Data Sciense и это мой первый пост, в котором хотел бы поделиться опытом применения машинного обучения в нефтяной сфере.

Читать далее
Всего голосов 5: ↑5 и ↓0+5
Комментарии12

Постоянно инвестируйте в свое образование

Время на прочтение4 мин
Количество просмотров30K
image

Несколько лет назад я понял, что сыт учебой по горло. На получение 2 дипломов я потратил 6 лет. Сразу после этого я занялся бизнесом. И первые два года предпринимательства я тоже активно учился. Но спустя какое-то время я подумал: «Да кому нужно это образование? Просто начни свой бизнес или устройся на работу и получай деньги. Образование — это потеря времени и средств». Так ли это на самом деле?
Читать дальше →
Всего голосов 25: ↑18 и ↓7+11
Комментарии15

30 толковых книг по бизнесу, саморазвитию и творчеству, которые изменили мою жизнь

Время на прочтение5 мин
Количество просмотров190K


Полтора года назад я принял вызов прочитать 100 книг за год. Авантюра полностью себя не оправдала, так как некоторые книги я перечитывал, но однозначно оказалась полезной. По итогам последних двух лет я составил список книг, которые каким-то образом повлияли на мою жизнь. Составлял я его для себя, но позже решил, что он пригодиться и вам.
Читать дальше →
Всего голосов 44: ↑33 и ↓11+22
Комментарии49

9 вещей, которые я узнал, будучи программистом, и которые я хотел бы знать, поступая в магистратуру

Время на прочтение9 мин
Количество просмотров69K
Три года тому назад я работал в лаборатории нейробиологии в Барселоне, занимаясь тем, что ставил на людей различные электроды и вел курсы по когнитивным системам. А сегодня я проектирую и пишу программное обеспечение для жизни.

В рамках науки я много писал о программном обеспечении, что-то вроде — если вы хотите разобраться в 40 гигабайтах данных, полученных при сканировании мозга, вы должны закатать рукава и написать парочку сортировочных скриптов. И я всегда был действительно неплохим программистом, хотя и не осознавал этого, пока не выпустился из академии и не начал работать над одним небольшим и очень амбициозным стартапом, — именно тогда я узнал всю правду о разработчиках программного обеспечения и — что еще более важно — о том, что значит, быть в этом бизнесе. Разработка программного обеспечения — это не просто знание языков, библиотек, алгоритмов и проектировочных шаблонов. Это — особый образ мышления.
Читать дальше →
Всего голосов 108: ↑82 и ↓26+56
Комментарии33

7 вещей о книгах и жизни, которые я узнал, прочитав 100 книг за год

Время на прочтение5 мин
Количество просмотров69K


Прочитав сотую книгу, я понял, что чтение — не только возможность получить новые навыки. Чтение может изменить жизнь. И я не говорю о списках книг, которые меняют жизни людей. Я говорю о деятельности, которая незаметно проникает во все сферы нашей жизни и понемногу преображает их. Тот год сильно повлиял на мое развитие. Я решил разобраться почему и выделил 7 основных моментов, которыми и поделюсь с вами.
Читать дальше →
Всего голосов 38: ↑22 и ↓16+6
Комментарии50

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность