Статья задумывалась именно как научпоп для начинающих (студенты, джуны, все кто интересуется ML), а не как исследовательская работа или исчерпывающий гайд. Цель - на пальцах объяснить, как слова превращаются в векторы, и показать это на живом примере с кластеризацией. Поэтому я сознательно упростил некоторые формулировки ради доступности.
Согласен, на Хабре есть отличные материалы по эмбеддингам. Но в этой статье я хотел сделать акцент не на теории, а на практике и визуализации - показать весь путь от One-Hot до кластеризации новостей
Про "машину" в заголовке: Использовал слово в бытовом смысле ("компьютер/алгоритм"), чтобы заголовок был понятен широкой аудитории.
По второй части: Обязательно добавлю ссылки на ключевые статьи по теме, чтобы материал был полезнее.
Не вижу ничего плохого, мне интересно почитать фидбек и разобраться, что лучше использовать. А заказчику это наоборот в плюс, ведь он увидит, что я сделал не так. Ведь я не просто написал систему и исчез, я в долгосрок над ней буду работать
Честно: хотелось попробовать MongoDB в деле и разделить ответственность (операционка отдельно, логи отдельно). Документная модель казалась удобнее для разношерстных логов - не нужно думать о структуре таблиц
Но согласен: PostgreSQL с JSONB справился бы не хуже, а архитектура была бы проще. Для текущего масштаба - да, возможно, оверхед. Но для опыта - полезное решение
Готовые решения смотрели, но для небольшого ресторана они оказались оверхедом. А голые технологии выбрал осознанно - хотел не просто настроить CRM, а глубоко разобраться, как работают вебхуки, транзакции и идемпотентность изнутри
Если проект вырастет - точно посмотрим в сторону фреймворков
Спасибо за обратную связь.
Статья задумывалась именно как научпоп для начинающих (студенты, джуны, все кто интересуется ML), а не как исследовательская работа или исчерпывающий гайд. Цель - на пальцах объяснить, как слова превращаются в векторы, и показать это на живом примере с кластеризацией. Поэтому я сознательно упростил некоторые формулировки ради доступности.
Согласен, на Хабре есть отличные материалы по эмбеддингам. Но в этой статье я хотел сделать акцент не на теории, а на практике и визуализации - показать весь путь от One-Hot до кластеризации новостей
Про "машину" в заголовке:
Использовал слово в бытовом смысле ("компьютер/алгоритм"), чтобы заголовок был понятен широкой аудитории.
По второй части:
Обязательно добавлю ссылки на ключевые статьи по теме, чтобы материал был полезнее.
Спасибо за обратную связь. Учту, при написании следующей статьи. Только набиваю руку
Ну увидит и что?
Не вижу ничего плохого, мне интересно почитать фидбек и разобраться, что лучше использовать. А заказчику это наоборот в плюс, ведь он увидит, что я сделал не так. Ведь я не просто написал систему и исчез, я в долгосрок над ней буду работать
Окей, посмотрю
Привет! Вопрос справедливый
Честно: хотелось попробовать MongoDB в деле и разделить ответственность (операционка отдельно, логи отдельно). Документная модель казалась удобнее для разношерстных логов - не нужно думать о структуре таблиц
Но согласен: PostgreSQL с JSONB справился бы не хуже, а архитектура была бы проще. Для текущего масштаба - да, возможно, оверхед. Но для опыта - полезное решение
Спасибо за фидбек
Привет! Спасибо за вопрос
Готовые решения смотрели, но для небольшого ресторана они оказались оверхедом. А голые технологии выбрал осознанно - хотел не просто настроить CRM, а глубоко разобраться, как работают вебхуки, транзакции и идемпотентность изнутри
Если проект вырастет - точно посмотрим в сторону фреймворков