Статьи / Закладки / Профиль Djkostya / Хабр

Костя Носорев @Djkostya

Domclick

Профиль Публикации 1Комментарии 1Закладки 2

Russell_Zab 16 апр 2020 в 10:50

Использование алгоритмов ML для классификации многостраничных документов: опыт ВТБ

10 мин

7.3K

Машинное обучение*Блог компании ВТБФинансы в ITIT-компании

В рамках кредитных конвейеров юридических лиц банки запрашивают у компаний оригиналы различных документов. Зачастую сканы этих документов поступают в виде единого многостраничного файла – «потока». Для удобства использования потоки нужно сегментировать на отдельные документы (одностраничные или многостраничные) и классифицировать их. Под катом мы расскажем о применении алгоритмов машинного обучения в классификации уже сегментированных документов.

Читать дальше →

cointegrated 3 авг 2019 в 01:11

Создание простого разговорного чатбота в python

7 мин

50K

Python*Data Mining*Машинное обучение*Natural Language Processing*

Туториал

Как вы думаете, сложно ли написать на Python собственного чатбота, способного поддержать беседу? Оказалось, очень легко, если найти хороший набор данных. Причём это можно сделать даже без нейросетей, хотя немного математической магии всё-таки понадобится.

Идти будем маленькими шагами: сначала вспомним, как загружать данные в Python, затем научимся считать слова, постепенно подключим линейную алгебру и теорвер, и под конец сделаем из получившегося болтательного алгоритма бота для Телеграм.

Этот туториал подойдёт тем, кто уже немножко трогал пальцем Python, но не особо знаком с машинным обучением. Я намеренно не пользовался никакими nlp-шными библиотеками, чтобы показать, что нечто работающее можно собрать и на голом sklearn.

Читать дальше →

+28

Использование алгоритмов ML для классификации многостраничных документов: опыт ВТБ

Создание простого разговорного чатбота в python

Информация

Специализация