Обновить
4
0

Пользователь

Отправить сообщение

Векторизация текста в NLP: от слов к числам

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели2.8K

Перед началом работы с NLP-моделями текст нужно преобразовать в понятный модели вид. Этот процесс называется векторизацией, и без него невозможно представить современный NLP. По сути, мы превращаем слова, предложения или целые документы в векторы — наборы чисел, которые отражают определенные характеристики текста. 

Рассказываем о векторизации подробнее вместе с экспертом.

Читать далее

Алгоритм k-means и метод локтя: кластеризация данных с примерами на Python

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели14K

Кластеризация данных — одна из ключевых задач машинного обучения. Она позволяет группировать объекты в однородные кластеры на основе их характеристик. Один из самых популярных, простых и эффективных методов кластеризации — это алгоритм k-means. 

Рассмотрим, как работает k-means, познакомимся с методом локтя для определения числа кластеров и проиллюстрируем их применение на реальных данных с помощью языка программирования Python.

Читать далее

«Все сходится» — лучший комплимент дата-сайентисту

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели1.1K

Алгоритмы и модели машинного обучения оценивают по разным параметрам: от них зависит, насколько быстро и точно работает модель. Один из таких параметров — сходимость, или конвергенция алгоритма. Сходимость показывает, насколько быстро модель достигает «оптимума» — точки, за которой меньше ошибается и делает более точные прогнозы. 

Читать далее

Фрактальная размерность: что это и как вычислить

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели4.2K

Фрактальная размерность описывает сложность объектов, которые нельзя измерить обычными параметрами, такими как длина или площадь. Например, снежинка при увеличении не становится проще — каждая ее деталь открывает еще более мелкие элементы. Разбираем, что такое фрактальная размерность и основные методы ее вычисления. 

Читать далее

Переобучение моделей: гайд и советы для начинающих

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели3.6K

С развитием нейросетей появляются новые вызовы. Один из них — переобучение моделей. Совместно с Александром Рыжковым, ментором Skillfactory, руководителем команды LightAutoML и 4х Kaggle Grandmaster, разбираемся, что такое переобучение, хорошо ли это и как его избежать.

Читать далее

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность