Комментарии / Профиль iayakunin / Хабр

@iayakunin

Пользователь

ПрофильСтатьи1ПостыНовостиКомментарии7

Как я поднял AmneziaWG 2.0 на роутере ASUS: DPI, GeoIP и веб-интерфейс

iayakunin 5 апр в 16:27

Посмотрите routerich, вроде ценник гуманный и нужная прошивка для мирных целей стоит уже сразу

На что способна новая видеокарта NVIDIA с 72 ГБ VRAM

iayakunin 27 янв в 21:24

Забыли о том что в России научились расширять 4090 до 48гб) Такая карточка обойдется в 200-250 тысяч, если покупать ее БУ на Авито и относить в сервис который может сделать такую переделку. Да, это Франкенштейн, но работает и недорого.

Рабочие станции для ML и Data Science — как собрать сервер под столом

iayakunin 7 янв в 09:52

Собирал себе простенькую систему для небольших домашних экспериментов пару лет назад. Старенький Xeon + 64гб ОЗУ + 3060 12гб. Я не сталкивался с тем что описано в статье, но пошел чуть другим путем и настроил на нем полностью серверный Linux, без интерфейса и подключался к нему по SSH. Вот там тоже начинаются свои танцы с бубном. Настроить ГПУ в докере было тем еще приколом, нормальных инструкций в интернете не нашел, только кусками. Сервер это всегда весело)

Trino в Авито два года спустя: от движка к полноценной экосистеме

iayakunin 28 дек 2025 в 12:05

Как аналитик из Авито вставлю еще одну интересную особенность которая была вскользь упомянута в статье. После перехода на Trino аналитикам гораздо проще стало получать доступ к архивным данным. Раньше в Vertica у витрин имелась глубина в зависимости от ее размера, и чтобы получить доступ в архиву приходилось писать запросы к архивной схеме которые очень долго работали. После переезда на Trino и актуальные данные и архивные стали одними и теми же файлами на Ceph, это позволило нам удобно рассчитывать признаки для МЛ-моделей, например. Если получаем от партнера выгрузку за 2023 год, то больше не страдаем, а просто запускаем регламентный расчет признаков на Trino ничего не меняя в запросах и через небольшое время получаем свои признаки на старые даты чтобы делать аналитику)

Проекции в Vertica: что это, как использовать, и почему не стоит создавать их под каждый запрос

iayakunin 19 апр 2024 в 13:30

Сейчас все аналитические базы это MPP. Не до конца понимаю как кодирование и сжатие данных на диске связано с проекциями, у проекций другое назначение. Сегментирование в статье было специально опущено, чтобы примеры получились максимально понятными.

Проекции в Vertica: что это, как использовать, и почему не стоит создавать их под каждый запрос

iayakunin 19 апр 2024 в 13:21

Спасибо за уточнения, это действительно важно. Про сегментирование в статье я уточнил что проекция может иметь отличное от супер-проекции сегментирование, а примеры таблиц специально были упрощены, чтобы все внимание сместить на проекции.

Проекции в Vertica: что это, как использовать, и почему не стоит создавать их под каждый запрос

iayakunin 19 апр 2024 в 09:36

Если запросить GET_PROJECTIONS по таблице (в статье есть), то можно посмотреть на значение UpToDate.