Comments 2
<offtop>
Один из моих коллег сказал когда-то, что "база данных - это хранилище, а не считалище!".
Очень жаль. Нет, когда кто-то имеет эффективный инструмент, но не использует его по привычке/незнанию/прочему, это ещё можно как-то принять, но вот гордиться этим - такое даже понять невозможно.
описание практического опыта эффективного решения одной из задач ML на существующих аппаратных ресурсах
Ну тут вы (если эта ваша фраза связана с предыдущей процитированной) всё-таки немножко лукавите. Если считать на стороне СУБД, используются только ресурсы сервера БД. Когда вы считаете это на стороне клиента, то добавляются ещё и ресурсы клиентского компьютера. Так что "на существующих аппаратных ресурсах" - выражение не во всех смыслах верное.
Очень жаль. Нет, когда кто-то имеет эффективный инструмент, но не использует его по привычке/незнанию/прочему, это ещё можно как-то принять, но вот гордиться этим - такое даже понять невозможно.
Очень сложно масштабировать хранилища, что бы они выполняли работу "считалища". Особенно, если это все связано с высокими нагрузками. Другой вопрос, когда у тебя нет больших нагрузок снаружи, а нужны агрегации и манипуляции данными, которые вполне возможны текущими ресурсами - тут инструменты из БД как раз очень подходят.
Clickhouse в машинном обучении без использования GPU. Часть 1