Модель fastText — одно из самых эффективных векторных представлений слов для русского языка. Однако её прикладная польза страдает из-за внушительных (несколько гигабайт) размеров модели. В этой статье мы показываем, как можно уменьшить модель fastText с 2.7 гигабайт до 28 мегабайт, не слишком потеряв в её качестве (3-4%). Спойлер: квантизация и отбор признаков работают хорошо, а матричные разложения — не очень. Также мы публикуем пакет на Python для этого сжатия и примеры компактной модели для русских слов.
@DerigIzmailovread-only
User
Как Yahoo убила Flickr и потеряла интернет
19 min
26KTranslation

Веб-стартапы состоят из двух компонентов: людей и кода. Люди делают код, а код делает людей богатыми. Код – он как поэма: ему приходится удовлетворять определённым структурным требованиям, однако на основе этой структуры может появиться искусство. Однако код – это искусство, делающее что-то полезное. Это собрание чего-то нового на основе одной лишь идеи.
И вот история одной чудесной идеи. Чего-то такого, что никто раньше не делал, момента изменения, сделавшего интернет таким, каким мы его знаем сегодня. Это история Flickr. И того, как Yahoo купила его, убила и одновременно лишила саму себя значимости.
Помните девиз Flickr? «Почти наверняка лучшее онлайн-приложение для управления и распространения фотографий в мире». Эпическое в своей нескромности хвастовство, серьёзно-ироническое заявление.
+25
Information
- Rating
- Does not participate
- Registered
- Activity