AloneCoder 11 дек 2019 в 18:14Индексируем миллиарды текстовых векторовВремя на прочтение9 минКоличество просмотров8.5KБлог компании VKNatural Language Processing*Алгоритмы*Анализ и проектирование систем*Поисковые технологии*ПереводВсего голосов 52: ↑52 и ↓0+52Добавить в закладки89Комментарии2
ideological 25 дек 2019 в 10:41Возможно глупый вопрос — но зачем использовать готовые библиотеки? Можно же было пройтись по базе или pyspark. Для уменьшения памяти можно использовать простейший подход LabelEncoder.
Индексируем миллиарды текстовых векторов