Search
Write a publication
Pull to refresh
70.42

Лето, наука, Томск: о школе «Лето с AIRI» 2025

Level of difficultyEasy
Reading time15 min
Views596

Привет, Хабр. Меня зовут Анастасия Янке, я учусь на 2 курсе на направлении «Информатика и вычислительная техника» в Высшей Школе Экономики. Недавно я вернулась из Томска, где принимала участие в летней школе AIRI по искусственному интеллекту, которая прошла на базе ТГУ.

Накопленные там эмоции и впечатления побудили меня рассказать о том, как это было. Ну, а если после прочтения вам тоже захочется принять участие в школе в следующем году, в конце вас ждёт несколько советов по тому, как увеличить свои шансы попасть туда.

Приятного чтения!

О летней школе AIRI x ТГУ я узнала случайно, когда до дедлайна на подачу оставалось всего несколько дней. На раздумья оставалось мало времени, поэтому, срочно отодвинув все дела, я начала снимать мотивационное видео и писать Research Proposal.

Исследования у меня не было, зато был интерес к теме управления инсулином с помощью Reinforcement Learning. За пару вечеров я подготовила обзор статьи и провела мини‑эксперименты. Так начался мой путь в самую необычную школу, в которой я когда‑либо участвовала.

С первых дней стало ясно: эта школа не из легких. Программа охватывала широкий круг тем от биоинформатики до мультиагентных систем, а лекции были на уровне, который редко встретишь даже в старших курсах университета. Многие из них были настолько насыщенными, что казались мини‑курсом за полтора часа. Например, лекция «Reinforcement Learning: A Bird's‑Eye View» от Владислава Куренкова объединила основы RL, стабильную оптимизацию политик, обучение без взаимодействия и многие современные направления — и всё это за раз.

Школа оказалась очень интенсивной, и свою роль в этом сыграла не только плотная лекционная программа, но и тщательно продуманная среда для научного роста. В этом и заключалась главная цель организаторов школы: погрузить участников в исследовательскую культуру и дать возможность попробовать себя в науке на практике.

Мы создали школу, чтобы вырастить новое поколение учёных. Здесь нет «звёзд» и аутсайдеров, только любознательность и совместные проекты.

Александра Бройтман

Директор по маркетингу и коммуникациям AIRI

Среди открывавших школу был CEO AIRI Иван Оселедец
Среди открывавших школу был CEO AIRI Иван Оселедец

Почему Томск?

Многие удивляются: почему школа проводится в Томске, а не в Москве или Петербурге? Но для команды AIRI это был осознанный выбор. «У нас есть миссия: мы хотим показывать ребятам, какая у нас прекрасная страна, а также находить новые таланты не только в Москве, но и в регионах, — объясняет Александра Бройтман. — Для этого мы каждый год мы проводим небольшой конкурс среди университетов. Томск нам приглянулся благодаря мощному научному ядру, университетской среде и классной молодёжи.

В городе, где легко забыть о рутине, участники погружаются в работу с головой — без суеты и отвлекающих факторов. Таким образом, Томск стал подходящим местом, чтобы на 11 дней стать точкой сборки молодого научного сообщества.

Источник: пресс-служба Авито 
Источник: пресс‑служба Авито 

А ещё во время школы прошло открытие совместной лаборатории искусственного интеллекта в химии и молекулярной инженерии Томского государственного университета и AIRI. Лаборатория займется разработкой и внедрением методов ИИ для создания новых материалов и лекарств на основе анализа химических, биологических и медицинских данных.

Источник: пресс-служба Авито
Источник: пресс‑служба Авито

Что было на школе?

Школа, фактически, состояла из четырёх типов активностей:

  • Два потока лекций и семинаров от исследователей AIRI, ТГУ, МГУ, МФТИ и других научно‑исследовательских организаций, а также приглашённых спикеров из Авито, фонда «Интеллект» и Сбера. Программа была построена так, чтобы можно было выбрать наиболее подходящий для себя поток: погружаться ли в Reinforcement Learning или разбираться с биоинформатикой и системной биологией.

  • Проектная работа — выделялось время, когда участники решали реальные исследовательские задачи под менторством профессионалов.

  • Постерная сессия — мы рассказывали, над какой научной задачей трудимся в данный момент.

  • Неформальные активности по вечерам: настольные игры, экскурсии, «Что? Где? Когда?» за пределами лекционного зала и многое другое.

Программа школы каждый год обновляется, но главный принцип остаётся неизменным — дать студентам не просто знания, а доступ к исследовательскому мышлению.

Сначала мы выбираем научные направления, которые хотим осветить. Потом руководители этих направлений ищут лекторов — это непростая задача, учитывая, что иногда учёные любят всё делать в последний момент. Но, несмотря ни на что, им удалось подготовить классные лекции по своим направлениям!

Александра Бройтман

Директор по маркетингу и коммуникациям AIRI

Случались во время школы и непредвиденные ситуации: отмена рейсов, смена площадок и даже пожар в отеле — но команда школы со всем справилась, не теряя юмора.

Особую атмосферу школы помогли создать её партнёры. Сотрудники Авито не только поддержали лекционную программу, но и устроили раздачу мороженного, подарили участникам мерч, а также помогли организаторам школы провести яркий выпускной вечер, который оставил ощущение, что завершилось большое приключение.

А ещё HR Авито провела с каждым из нас персональную консультацию по профессиональному росту. Когда пришла моя очередь, мы разобрали ключевые моменты подготовки к стажировке и устройству в компанию. Акцент был сделан на том, что резюме нужно адаптировать под каждую вакансию, выделяя релевантные проекты и технологии. Полезными мне показались советы оформлять проекты по STAR‑методу, уделять внимание сопроводительным письмам, поизучать матрицы требований к разным должностям.

Помимо резюме и подготовки к интервью, мы обсудили направления внутри DS в Авито, включая AI Lab и команды, работающие над рекомендациями. Менеджер рассказала о процессе стажировок: минимальная нагрузка — 25 часов, но чаще ждут полного дня, при этом гибкость по задачам сохраняется. В начале формируется индивидуальный план развития, а результат оценивается не по часам, а по выполнению задач. В целом впечатление от разговора положительное: было много конкретики и полезных практических советов.

Источник: пресс-служба Авито
Источник: пресс‑служба Авито

Тематика лекций и семинаров

Несмотря на июльскую жару, во время лекций царили полная сосредоточенность и вовлечённость. Иногда приходилось буквально заставлять себя отрываться от науки, чтобы успеть на обед. Виной тому — широта тем, по которым были лекции: от компьютерного зрения и обучения с подкреплением до молекулярной генерации и мультиагентных LLM.

Лично меня особенно зацепили следующие направления:

  • Компьютерное зрение — от чистого CV до обработки видео в VLLM

Меня всегда завораживала задача научить машины не просто «видеть», а по‑настоящему понимать визуальную информацию. Современные Video‑LLM совершили настоящий прорыв в этом направлении — теперь они не только детектируют объекты в кадре, но и анализируют динамику сцен, предсказывают развитие событий и даже ведут осмысленные диалоги о происходящем.

На лекции Матвея Скрипкина «Восприятие видео в современных VLLM» был дан впечатляющий разбор того, как мультимодальные модели работают с временной природой видео. Оказывается, ключевой вызов — научить ИИ учитывать долгосрочные зависимости между событиями, для чего используются сложные механизмы памяти: от внешних key‑value хранилищ (вроде ReQV) до темпорального сжатия токенов.

Но самое интересное — практические применения этой технологии. Представьте систему, которая в реальном времени анализирует видео и отвечает на вопросы вроде «Почему этот человек побежал?» или «Что забыл взять покупатель?». Такие решения уже тестируют в розничной аналитике, автономном вождении и даже медицине. Однако с ростом возможностей возникает и этический вопрос: как предотвратить злоупотребление столь мощными инструментами генерации и анализа видеоконтента? Технологии video‑perception открывают фантастические перспективы, но требуют ответственного подхода к их внедрению.

  • Оптимизация и RL – много интересной теории и актуальных исследований

Обучение с подкреплением давно перестало быть просто про алгоритмы — теперь это целая философия создания интеллектуальных систем, способных накапливать и использовать опыт. На лекции Алексея Ковалёва «Агенты с памятью в обучении с подкреплением» я по‑новому взглянула на то, как ИИ‑агенты запоминают информацию. Оказывается, их память устроена удивительно похоже на человеческую: есть кратковременная память для оперативных задач (например, запомнить последние несколько действий в лабиринте) и долговременная — для сохранения фундаментальных навыков вроде управления роботом в разных условиях.

Особенно впечатлил разбор тестовых сред вроде MemoryBench и POPGym, где агенты должны демонстрировать настоящую осведомлённость — запоминать расположение объектов, цвета или последовательности действий. Например, в задаче Re‑open Drawer робот должен сначала запомнить, в каком ящике лежал предмет, а потом вернуться к нему после долгого перерыва. Такие сценарии показывают, что современный RL — это уже не просто оптимизация политик, а создание по‑настоящему адаптивных систем, способных учиться на собственном опыте и применять его в новых условиях.

  • LLM и агенты – что будет, если GPT сделать многопоточными и разумными

Современные мультиагентные системы совершают революцию в подходе к сложным задачам — вместо одной мощной LLM мы получаем целый коллектив узкоспециализированных агентов. Как показала Алсу Сагирова в своей лекции, такие системы работают по принципу «разделяй и властвуй»: задача декомпозируется между агентами‑специалистами (аналитик, решатель, валидатор), каждый из которых вносит свой вклад в общее решение. Особенно впечатляют фреймворки вроде AutoGen и LangGraph, где агенты не просто выполняют отдельные роли, но и ведут полноценные «переговоры» — например, математический агент решает уравнение, в то время как критик проверяет его выводы.

Главное преимущество такого подхода — возможность решать комплексные проблемы, которые не под силу даже самым продвинутым одиночным моделям, от научных исследований до бизнес‑аналитики. Однако нужно как‑то организовать эффективное взаимодействие между агентами — обеспечить их автономность, минимизировать конфликты и при этом сохранить вычислительную эффективность системы в целом.

  • Биоинформатика – deep learning, который помогает создавать лекарства

Современные языковые модели прямо сейчас превращают анализ ДНК из трудоемкого лабораторного процесса в увлекательную задачу в духе компьютерной лингвистики. На лекции Алёны Аспидовой «Языковые модели ДНК» я с удивлением узнала, что генетический код можно анализировать теми же методами, что и человеческую речь — токенизировать последовательности нуклеотидов, обучать трансформеры предсказывать «пропущенные слова» в геномных «предложениях» и даже генерировать новые регуляторные элементы. Особенно впечатлил подход с k‑mer токенизацией, где ДНК разбивается на перекрывающиеся «слова» из нескольких нуклеотидов, позволяя моделям вроде DNABERT улавливать сложные биологические паттерны.

Но настоящим откровением стало применение этих технологий на практике. Оказывается, ИИ уже сегодня может предсказывать последствия мутаций в промоторах (регуляторных участках ДНК), аннотировать гены с точностью, превосходящей традиционные методы, и проектировать искусственные последовательности для управления экспрессией генов в конкретных тканях. Это открывает фантастические перспективы — от персонализированной медицины до создания новых биотехнологий. Хотя остаются и сложные вопросы: как учитывать клеточную специфику или избегать «утечки информации» при анализе гомологичных последовательностей. Языковые модели ДНК — это не просто новый инструмент биологов, а принципиально новый способ понимания языка жизни.

Но если бы нужно было выбрать одну лекцию, которая изменила мой взгляд на какую‑то область науки, это была бы лекция «Генерация малых молекул: от вариационных автоэнкодеров до диффузионных моделей», которую прочитал Александр Телепов.

До неё мне казалось, что разработка лекарства — это что‑то из разряда многолетних экспериментов в лабораториях с белыми халатами и мышами. Теперь же я знаю, что часть этой работы теперь делают нейросети, да ещё и быстрее, чем статья успевает пройти рецензирование.

В целом, лекции на «Лето с AIRI» были не про «вот вам формулы, держите», а про погружение в живые задачи — и это то, что делает школу особенной. Даже если ты пришёл с ML‑бэкграундом и впервые слышишь слово «докинг», через час уже обсуждаешь, стоит ли использовать AutoDock или гибкую симуляцию с AlphaFold‑предсказанным белком.

Постерная сессия выдалась очень атмосферной и продуктивной
Постерная сессия выдалась очень атмосферной и продуктивной

Проекты и их защита

Помимо лекций и семинаров участникам школы предстояло собрать команду и погрузиться в реальные исследовательские задачи в работе над проектами — обычно на это выделяли конец дня. Темы проектов были на любой вкус: от молекул и мембран до reasoning в латентном пространстве. Каждый отбирал себе три проекта по приоритету, но в итоге почти всех определили по первой заявке. Всего вышло 28 проектов.

Работа над ними длилась несколько дней под руководством экспертов школы. В конце команды должны были представить свои результаты на защите. Впоследствии специальное жюри определило три лучших решения.

Кто выиграл?

1 место — анализ изображений питомцев

Лучшую оценку научной комиссии получил социально‑ориентированный проект студентов из Москвы, Воронежа и Нижнего Новгорода по анализу изображений домашних питомцев с помощью алгоритмов искусственного интеллекта. Крутой baseline и потенциал для реальных приложений.

2 место — агенты с памятью в RL

Трансформеры, память, куча запусков и тысячи визуализаций. Даже при 1% памяти агенты сохраняли вектор цели. Но эмбеддинги были шумные — и это открывает путь к новым архитектурам (например, Hadamard Memory или Fast & Forgetful). Если вам интересен RL с когнитивным уклоном, вы оцените эту работу.

3 место — восстановление SMILES‑записей молекул из их конформаций

Ребята сравнили 4 метода преобразования 3D‑структур молекул в SMILES. MolT5 дал 99.9% точности восстановления, а вот Random Forest, увы, сильно проиграл. Вывод: языковые модели умеют в химию, особенно если их немного доучить. В перспективе — генерация молекул с учетом стереохимии, заряда и даже шума в данных.

Моя же команда исследовала, как сжимать длинные контексты, не теряя смысла. Идея проста: LLM всё ещё ограничены по их длине, а хочется больше. Мы пробовали разные методы, однако baseline побил самый простой способ — добавление слоя MLP к [mem]‑векторам, что повысило стабильность и ёмкость сжатия.

Наша команда по проекту
Наша команда по проекту

Досуг и атмосфера

На буднях развлекаться было некогда, но выходные были очень разнообразными: то караоке с опенингом из «Наруто», то вылазка к живописному озеру, то экскурсия на местное производство «Территория тайги», где нам рассказывали, как из сосны делают косметику и чай.

В памяти участников навсегда останется легендарное место силы, где все готовили свои проекты — круглосуточное кафе «Кафедра», в котором команды писали код до самого утра. В 3 ночи кто‑то спорил про структуры белков, кто‑то пытался зафиксить attention‑mask, а кто‑то… просто отжимался, чтобы не уснуть.

А в завершении нас ждал просто бомбический выпускной. Плов, который готовился на костре прямо на площадке (с мастер‑классом!), кавер‑группа, танцы, костры и самая тёплая традиция AIRI — благодарности и браслетики: каждый вручал «спасибо» тем, с кем особенно сошлись за эти дни. Маленькие нитяные браслеты, но с огромным зарядом.

Источник: пресс-служба Авито
Источник: пресс‑служба Авито
Источник: пресс‑служба Авито
Источник: пресс‑служба Авито

Что говорят лекторы?

Написанное выше — взгляд участника. А что думают те, кто нас учил и наставлял? Я решила узнать это напрямую.

Матвей Скрипкин (лекции по Video‑LLM) сразу признался: пришёл в AIRI не только делиться опытом, но и прокачиваться сам. Работать с ребятами, которые задают нетривиальные вопросы и отлавливают баги в продакшн‑коде — редкий кайф. Особый инсайт, который он вынес из школы: окружение влияет на модели не меньше, чем архитектура — один и тот же код может сожрать видеопамять, а может полететь. Его совет:

Не бойтесь сложностей — ошибаться нормально, особенно если вы исследователь.

Алёна Аспидова (лекция про LLM на ДНК) столкнулась с задачей, знакомой каждому технарю: как объяснить сложную биологию людям с ML‑бэкграундом так, чтобы те не скучали. Спойлер — получилось. Самым приятным сюрпризом для неё стали участники, которые после лекции просили объяснить тонкости транскрипции и обсуждали потенциал языковых моделей для расшифровки генома. Вот её совет:

Важно не просто знать инструменты, а сохранять гибкость мышления. И не бояться пробовать — даже если не получится.

Айдар Булатов (лекции по моделям обработки последовательностей) выделил главное: школа не просто дала знания она зажгла огонь. Участники ночами копались в коде трансформеров, выкидывали слои, оптимизировали пайплайны и… находили баги в ресерче. Один из неожиданных финалов проекта: модель с упрощённой архитектурой, которая показывает сравнимые с бейзлайном результаты.

Нужно понимать, что у нейросети внутри, а не только как нажимать кнопку «Train». Ищите, что вас качает, и не бойтесь туда нырять с головой.

Айдар Булатов
Айдар Булатов

Чему мы научились в школе

Если лекции дают нам знания, то работа над проектами — навыки. Без приобретения последних, едва ли их защита может быть успешной. Я узнала у тех, кто участвовал со мной в школе, какие навыки они посчитали самыми важными.

1. Работа с научной литературой

Участники ежедневно анализировали статьи по теме проекта, учились быстро оценивать новизну подхода, вычленять главное и адаптировать чужие идеи к своим задачам. Это отличалось от типичного «академического» чтения — акцент был на практическое применение и критическое мышление.

2. Презентация научных результатов

Проекты завершались защитой перед экспертами. Здесь пригодился опыт, полученный на мастер‑классе по публичным выступлениям от Александры Бройтман. Она объяснила участникам, как чётко формулировать цель презентации, учитывать аудиторию и справляться с волнением.

Вот что запомнилось с мастер‑класса по публичным выступлениям:

  • Определите цель. Вдохновить? Убедить? Рассказать?

  • Поймите, кто ваша аудитория. Студенты? Учёные? Организаторы?

  • Напишите текст, отрепетируйте минимум 5 раз, уберите воду и добавьте паузы.

  • Настройтесь: дыхание, физическая разминка, любимый трек в наушниках — всё идёт в дело.

  • Главное — контакт: взгляд, интонация, живой голос.

Хорошее выступление — это не когда тебя не прерывают. А когда после него к тебе подходят с вопросами.

Александра Бройтман

Директор по маркетингу и коммуникациям AIRI

3. Умение работать в команде и презентовать себя

Помимо проектной части, участники регулярно презентовали прогресс, собирали обратную связь и учились позиционировать свои идеи. Это ценный навык, особенно если вы планируете карьеру в науке, стартапе или крупной AI‑компании.

Советы будущим участникам

Если вы никогда не ездили на «Лето с AIRI», но теперь задумались, следующая часть текста для вас.

Отбор в школу проходил по результатам заявки, которая включала резюме, research proposal и мотивационное видео.

Резюме, традиционно, описывает ваш опыт, включая публикации. Это общий навык, который пригодится не только при подачу на школу, поэтому рекомендуется его освоить, об этом написано много гайдов. Research Proposal — это, по сути, рецензия на статью ранга A*, которая продемонстрирует ваше умение разбираться с научной литературой.

А вот с видео всё несколько сложнее. По словам Екатерины Мамонтовой, организатора школы, ключевым критерием была искренность мотивации, а не количество публикаций или академических регалий:

Важно понять, зачем человек хочет участвовать. Кто‑то только начинает путь в ИИ, кто‑то уже пишет статьи — но всех объединяет желание разбираться глубже.

Екатерина Мамонтова

Ведущий специалист команды маркетинга и коммуникаций AIRI

Какие советы здесь можно было бы дать?

  • Будьте честны в мотивации – это чувствуется

  • Четко следуйте требованиям заявки (длина видео, формат proposal)

  • Не бойтесь подавать заявку, даже если вы только начинаете

Заключение

Школа «Лето с AIRI» — это не просто набор лекций и проектов. Это история про среду, где хочется учиться, спорить, предлагать, ошибаться и начинать заново. Здесь встречаются люди, которым действительно интересно не просто «делать ИИ», а понимать, как он работает, зачем он нужен и к чему всё это ведёт.

Многие участники уехали со школы с чётким пониманием того, куда двигаться дальше. Кто‑то продолжает начатый проект в виде научной работы, кто‑то подаётся в исследовательские стажировки. Школа помогает не только узнать больше об ИИ, но и понять, какая роль тебе интересна в этой экосистеме — от научных исследований до построения продуктов.

А некоторые уезжают с мыслью: «Хочу в AIRI». И это вполне закономерно.

Хочется сказать отдельное спасибо организаторам школы, спонсорам, преподавателям, тьюторам и всем, кто помогал сделать эти две недели насыщенными и по‑настоящему живыми.

Школа закончилась, но проекты — продолжаются. Как и обсуждения в Telegram, пост‑школьные коллаборации и идеи для статей. И, конечно, будет следующий набор — так что, если вы интересуетесь ИИ, наукой и хотите стать частью сильного комьюнити, обязательно следите за новостями на сайте AIRI и в соцсетях.

В следующем году будет новый формат — но останется главное: люди, которые горят наукой

Александра Бройтман

Директор по маркетингу и коммуникациям AIRI

Телеграм

Tags:
Hubs:
+6
Comments0

Articles

Information

Website
airi.net
Registered
Employees
101–200 employees