AloneCoder Dec 11 2019 at 18:14Индексируем миллиарды текстовых векторовReading time9 minViews8.9KVK corporate blogNatural Language Processing*Algorithms*System Analysis and Design*Search engines*TranslationTotal votes 52: ↑52 and ↓0+52Add to bookmarks89Comments2
ideological Dec 25 2019 at 10:41Возможно глупый вопрос — но зачем использовать готовые библиотеки? Можно же было пройтись по базе или pyspark. Для уменьшения памяти можно использовать простейший подход LabelEncoder.
Индексируем миллиарды текстовых векторов