Search
Write a publication
Pull to refresh
6
0
Рома Филонов @boterxxx

User

Send message

Готовимся к собесу: positional encodings в 2025 году

Level of difficultyEasy
Reading time9 min
Views3.8K

Если вы до сих пор считаете, что positional encoding в трансформерах — это знаменитые sin/cos из статьи 2017 года, то боюсь, что собеседование для вас закончится автоматическим реджектом.

Позиционное кодирование заметно эволюционировало с момента появления оригинальной статьи о трансформерах. В современных LLM и моделях компьютерного зрения, таких как FLUX, уже давно не используется классическое sin/cos-кодирование.

Читать далее

Что бы я сделал, если бы сегодня начинал учить Data Science / ML?

Level of difficultyEasy
Reading time7 min
Views36K

Machine Learning и Data Science — это одни из самых популярных и востребованных направлений в IT. Но вместе с этим — они и одни из самых сложных для входа. Здесь огромное количество тем, инструментов, библиотек, подходов и постоянно появляющихся технологий.

Из-за этого многие новички начинают обучение с энтузиазмом, но через пару месяцев теряют интерес. Причины могут быть разные: слишком много теории, мало практики, нет чёткого плана или понимания, зачем вообще всё это нужно.

Эта статья — не очередной «гайд по ML для новичков». Это мой личный взгляд на то, как бы я подошёл к обучению, если бы начинал с нуля уже сегодня, учитывая свой опыт работы в крупных компаниях, проваленные проекты, ошибки и победы.

Читать далее

Как обойти детекторы текста, сгенерированного ИИ

Level of difficultyEasy
Reading time7 min
Views7.2K

Провел небольшой ресерч как быстро хакнуть детекторы плагиата / детекторы текста написанного ChatGPT/LLM. Если вкратце, то 100% рабочего варианта нет, существует масса различных сервисов, которые под собой использую нейросетки обученные классифицировать текст на степень его "человечности"

Читать далее

Генерация видео: Обзор интересных подходов | Text-2-video | Part 2

Level of difficultyEasy
Reading time6 min
Views2.3K

Освечу базовые концепты из области генерации видео, в этой части разберем уже более современные модели 2025 года, и парочку моделей, с которых все начиналось. Все кратко и четко, только самое основное.

Посмотрим на устройство современных топовых SOTA моделей для генерации видео: Wan2.1, Hunyuan video, недавно вышедший подход к облегчению вычислетильных требования FramePack.

Читать далее

Собеседования без шансов: как менторы формируют неравные условия

Level of difficultyEasy
Reading time3 min
Views20K

Прохождение собеседований всё больше напоминает «Голодные игры». Не буду тут подробно затрагивать тему накрутки опыта и обхода HR-фильтров — на рынке де-факто сложилась ситуация, при которой массовая накрутка опыта стала нормой. Это вынуждает всех делать то же самое, иначе ваше резюме с нулём лет стажа просто не пройдёт отбор: его не увидят из-за фильтров и конкуренции с сотнями таких же анкет.

Читать далее

Генерация видео: Обзор интересных подходов | Text-2-video | Part 1

Level of difficultyEasy
Reading time4 min
Views3.1K

Разберу кратко основные подходы к генерации видео и историю их развития. Начнём с AnimateDiff — подхода, который позволяет превратить любой генератор изображений на основе Stable Diffusion в генератор видео. Будет интересно специалистам в ML и Computer Vision, а также всем, кто интересуется нейросетями и искусственным интеллектом.

Читать далее

CLIP или SigLIP. База по Computer vision собеседованиям. Middle/Senior

Level of difficultyEasy
Reading time5 min
Views4.4K

Вопросы о CLIP-моделях встречаются почти на каждом техническом собеседовании.
Неважно, занимаетесь ли вы видеоаналитикой, создаёте генеративные модели или работаете над поиском по изображениям — CLIP и его потомки (BLIP , SigLIP ) стали стандартом де-факто в задачах связи визуальных и текстовых данных. Почему? Потому что они позволяют решать задачи, которые ранее требовали значительных усилий

Читать далее

Яндекс vs Сбер: где быстрее поймешь смысл фразы «держись брат»? Глазами ML-разработчика

Level of difficultyEasy
Reading time4 min
Views5K

К сожалению или счастью, был я и там, и там:‑) Поэтому ловите внутрянку, как на самом деле выглядит работа линейного ML‑щика/Дата саентиста. Стоит ли оно того, что происходит внутри и почему я все‑таки ушел из обеих компаний. (кормили прост невкусно)

Еще студентом я стремился в бигтех: именно там самые сильные специалисты, лучшие условия труда и перспективы. Ну, по большей части так и было — ничего не умеющего доходягу там редко встретишь (хотя в одной из двух этих компаний раз на раз проскакивает — не будем показывать пальцем🤫).

Читать далее

Information

Rating
370-th
Location
Москва, Москва и Московская обл., Россия
Date of birth
Registered
Activity