Статьи / Профиль kayak116 / Хабр

Олег Замощин @kayak116

Пользователь

Профиль Публикации 4Комментарии 36Закладки 11

kayak116 26 окт 2019 в 20:45

Анализируем тональность текстов с помощью Fast.ai

6 мин

7.1K

Python*Машинное обучение*Искусственный интеллект

Туториал

В статье пойдет речь о классификации тональности текстовых сообщений на русском языке (а по сути любой классификации текстов, используя те же технологии). За основу возьмем данную статью, в которой была рассмотрена классификация тональности на архитектуре CNN с использованием Word2vec модели. В нашем примере будем решать ту же самую задачу разделения твитов на позитивные и негативные на том же самом датасете с использованием модели ULMFit. Результат из статьи (average F1-score = 0.78142) примем в качестве baseline.

Читать дальше →

+11

kayak116 13 окт 2019 в 11:02

Ищем пневмонию на рентгеновских снимках с Fast.ai

3 мин

14K

Python*Машинное обучение*Искусственный интеллект

Туториал

Наткнулся на статью в блоге компании Школа Данных и решил проверить, на что способна библиотека Fast.ai на том же датасете, который упоминается в статье. Здесь вы не найдете рассуждений о том, как важно своевременно и правильно диагностировать пневмонию, будут ли нужны врачи-рентгенологи в условиях развития технологий, можно ли считать предсказание нейронной сети медицинским диагнозом и т.д. Основная цель — показать, что машинное обучение в современных библиотеках может быть довольно простым (буквально требует немного строчек кода) и дает отличные результаты. Запомним пока результат из статьи (precision = 0.84, recall = 0.96) и посмотрим, что получится у нас.

Читать дальше →

+28

kayak116 22 ноя 2017 в 19:37

RNN: может ли нейронная сеть писать как Лев Толстой? (Спойлер: нет)

16 мин

27K

Python*Data Mining*Машинное обучение*

Туториал

При изучении технологий Deep Learning я столкнулся с нехваткой относительно простых примеров, на которых можно относительно легко потренироваться и двигаться дальше.

В данном примере мы построим рекуррентную нейронную сеть, которая получив на вход текст романа Толстого «Анна Каренина», будет генерировать свой текст, чем-то напоминающий оригинал, предсказывая, какой должен быть следующий символ.

Структуру изложения я старался делать такой, чтобы можно было повторить все шаги новичку, даже не понимая в деталях, что именно происходит внутри этой сети. Профессионалы Deep Learning скорее всего не найдут тут ничего интересного, а тех, кто только изучает эти технологии, прошу под кат.

Читать дальше →

+32

kayak116 24 янв 2015 в 17:00

Data tidying: Подготовка наборов данных для анализа на конкретных примерах

5 мин

18K

Data Mining*R*

Из песочницы

Данная статья возникла в результате переработки и перевода информации на русский язык, взятой из двух источников:

из статьи «Tidy Data»
из соответствующего swirl урока по tidyr package

Для профессионалов в области анализа данных это, возможно, выглядит как давно выученная таблица умножения — вряд ли они найдут здесь что-то новое. А тех, кто как и я только знакомится с данной областью и возможностями языка R, приглашаю продолжить чтение.

Читать дальше →