Search
Write a publication
Pull to refresh
0
@DerigIzmailovread⁠-⁠only

User

Send message

Как сжать модель fastText в 100 раз

Reading time12 min
Views22K

Модель fastText — одно из самых эффективных векторных представлений слов для русского языка. Однако её прикладная польза страдает из-за внушительных (несколько гигабайт) размеров модели. В этой статье мы показываем, как можно уменьшить модель fastText с 2.7 гигабайт до 28 мегабайт, не слишком потеряв в её качестве (3-4%). Спойлер: квантизация и отбор признаков работают хорошо, а матричные разложения — не очень. Также мы публикуем пакет на Python для этого сжатия и примеры компактной модели для русских слов.


Читать дальше →

Как Yahoo убила Flickr и потеряла интернет

Reading time19 min
Views26K


Веб-стартапы состоят из двух компонентов: людей и кода. Люди делают код, а код делает людей богатыми. Код – он как поэма: ему приходится удовлетворять определённым структурным требованиям, однако на основе этой структуры может появиться искусство. Однако код – это искусство, делающее что-то полезное. Это собрание чего-то нового на основе одной лишь идеи.

И вот история одной чудесной идеи. Чего-то такого, что никто раньше не делал, момента изменения, сделавшего интернет таким, каким мы его знаем сегодня. Это история Flickr. И того, как Yahoo купила его, убила и одновременно лишила саму себя значимости.

Помните девиз Flickr? «Почти наверняка лучшее онлайн-приложение для управления и распространения фотографий в мире». Эпическое в своей нескромности хвастовство, серьёзно-ироническое заявление.
Читать дальше →

Information

Rating
Does not participate
Registered
Activity