Articles / Profile of kayak116 / Habr

Олег Замощин @kayak116

User

Profile Publications 4Comments 36Bookmarks 11

kayak116 Oct 26 2019 at 20:45

Анализируем тональность текстов с помощью Fast.ai

6 min

7.2K

Python*Machine learning*Artificial Intelligence

Tutorial

В статье пойдет речь о классификации тональности текстовых сообщений на русском языке (а по сути любой классификации текстов, используя те же технологии). За основу возьмем данную статью, в которой была рассмотрена классификация тональности на архитектуре CNN с использованием Word2vec модели. В нашем примере будем решать ту же самую задачу разделения твитов на позитивные и негативные на том же самом датасете с использованием модели ULMFit. Результат из статьи (average F1-score = 0.78142) примем в качестве baseline.

Читать дальше →

+11

kayak116 Oct 13 2019 at 11:02

Ищем пневмонию на рентгеновских снимках с Fast.ai

3 min

14K

Python*Machine learning*Artificial Intelligence

Tutorial

Наткнулся на статью в блоге компании Школа Данных и решил проверить, на что способна библиотека Fast.ai на том же датасете, который упоминается в статье. Здесь вы не найдете рассуждений о том, как важно своевременно и правильно диагностировать пневмонию, будут ли нужны врачи-рентгенологи в условиях развития технологий, можно ли считать предсказание нейронной сети медицинским диагнозом и т.д. Основная цель — показать, что машинное обучение в современных библиотеках может быть довольно простым (буквально требует немного строчек кода) и дает отличные результаты. Запомним пока результат из статьи (precision = 0.84, recall = 0.96) и посмотрим, что получится у нас.

Читать дальше →

+28

kayak116 Nov 22 2017 at 19:37

RNN: может ли нейронная сеть писать как Лев Толстой? (Спойлер: нет)

16 min

27K

Python*Data Mining*Machine learning*

Tutorial

При изучении технологий Deep Learning я столкнулся с нехваткой относительно простых примеров, на которых можно относительно легко потренироваться и двигаться дальше.

В данном примере мы построим рекуррентную нейронную сеть, которая получив на вход текст романа Толстого «Анна Каренина», будет генерировать свой текст, чем-то напоминающий оригинал, предсказывая, какой должен быть следующий символ.

Структуру изложения я старался делать такой, чтобы можно было повторить все шаги новичку, даже не понимая в деталях, что именно происходит внутри этой сети. Профессионалы Deep Learning скорее всего не найдут тут ничего интересного, а тех, кто только изучает эти технологии, прошу под кат.

Читать дальше →

+32

kayak116 Jan 24 2015 at 17:00

Data tidying: Подготовка наборов данных для анализа на конкретных примерах

5 min

18K

Data Mining*R*

From sandbox

Данная статья возникла в результате переработки и перевода информации на русский язык, взятой из двух источников:

из статьи «Tidy Data»
из соответствующего swirl урока по tidyr package

Для профессионалов в области анализа данных это, возможно, выглядит как давно выученная таблица умножения — вряд ли они найдут здесь что-то новое. А тех, кто как и я только знакомится с данной областью и возможностями языка R, приглашаю продолжить чтение.

Читать дальше →