Как стать автором
Обновить
144
0
Давид Дале @cointegrated

Разработчик / Аналитик / Data Scientist / NLPшник

Отправить сообщение

Весь Хабр в одной базе

Время на прочтение7 мин
Количество просмотров17K

Добрый день. Прошло уже 2 года с момента написания последней статьи про парсинг Хабра, и некоторые моменты изменились.


Когда я захотел иметь у себя копию хабра, я решил написать парсер, который бы сохранил весь контент авторов в базу данных. Как это вышло и с какими ошибками я встретился — можете прочитать под катом.

Читать дальше →
Всего голосов 27: ↑24 и ↓3+36
Комментарии51

Генерируем заголовки фейковых новостей в стиле Ленты.ру

Время на прочтение11 мин
Количество просмотров31K
Сравниваем 2 подхода к генерации текста c помощью нейронных сетей: Char-RNN vs Word Embeddings + забавные примеры в конце.
Читать дальше →
Всего голосов 55: ↑51 и ↓4+47
Комментарии39

Профилирование и отладка Python, инструменты

Время на прочтение14 мин
Количество просмотров109K
В предыдущей статье мы на практике разобрались, где и в каких случаях можно использовать ручное профилирование, а так же познакомились со статистическими профайлерами.

Сегодня мы познакомимся с основной и самой многочисленной группой инструментов — событийными профайлерами.

Приступим!
Всего голосов 72: ↑69 и ↓3+66
Комментарии9

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность