Обновить

Комментарии 2

"""Представь, что нужно разложить тысячи статей по категориям без единого человека.

Звучит как магия?""". Трудно сказать как звучит, но написано не на русском языке. Уважаемый Автор! На Хабре на тему эмбеддингов опубликовано несколько десятков нормальных статей. Пожалуйста начните вторую часть с обзора, что уже опубликовано и что нового Вы расскажите миру. Иначе вторая часть, также как и первая, превратиться в шум. И еще, поясните пожалуйста, зачем в заголовке присутствует слово "машина", например, с точки зрения векторизации этого слова. Можно также предварительно подумать для какой аудитории Вы все это пишите. Ждем вторую часть.

Спасибо за обратную связь.

Статья задумывалась именно как научпоп для начинающих (студенты, джуны, все кто интересуется ML), а не как исследовательская работа или исчерпывающий гайд. Цель - на пальцах объяснить, как слова превращаются в векторы, и показать это на живом примере с кластеризацией. Поэтому я сознательно упростил некоторые формулировки ради доступности.

Согласен, на Хабре есть отличные материалы по эмбеддингам. Но в этой статье я хотел сделать акцент не на теории, а на практике и визуализации - показать весь путь от One-Hot до кластеризации новостей

Про "машину" в заголовке:
Использовал слово в бытовом смысле ("компьютер/алгоритм"), чтобы заголовок был понятен широкой аудитории.

По второй части:
Обязательно добавлю ссылки на ключевые статьи по теме, чтобы материал был полезнее.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации