Как стать автором
Обновить
4
0
Александр Никулин @Howuhh

Research Scientist @ AIRI, Phd @ MIPT

Отправить сообщение

XLand-100B: первый в мире большой датасет для контекстного обучения с подкреплением

Уровень сложностиСложный
Время на прочтение11 мин
Количество просмотров1.8K

Хабр, привет! Меня зовут Александр Никулин, я аспирант МФТИ и один из исследователей научной группы «Адаптивные агенты» в Институте AIRI.

Как можно понять из названия, наша группа заинтересована в создании адаптивных агентов, способных обобщаться на новые задачи после обучения. Направление это относительно новое и в литературе именуется как контекстное обучение с подкреплением (далее in‑context RL). И мы активно двигаем его вперед! Совсем недавно выпустили две статьи, обе приняты на ICML 2024, а ещё среду на JAX со множеством задач для мета‑обучения. Мы обязательно расскажем о них чуть позже (подписывайтесь!), а в этой статье хочется затронуть наш недавний препринт. В нем мы представили и выложили в open‑source огромный (по меркам RL) и пока единственный датасет для in‑context RL. На сбор траекторий для 40к задач и 130B транзиций потребовалось 50 000 GPU‑часов. Эту работу мы проделали совместно с коллегами из лаборатории T-Bank AI Research.

Датасетом уже можно пользоваться, так что рассказываем и надеемся на будущий акцепт статьи! Ну а начнем чуть издалека, расскажу что такое in‑context learning, как он появился в RL и почему нам понадобился собственный датасет.

Читать далее
Всего голосов 10: ↑10 и ↓0+12
Комментарии4

Как построить географическую панель наблюдения с данными в реальном времени

Время на прочтение3 мин
Количество просмотров9.2K
В этом посте покажу, как построить интерактивную географическую панель наблюдения с Displayr, Plotly и R. Особенно интересно, что она отслеживает позицию военных самолетов в реальном времени. Для этого я собираюсь взять данные из двух разных источников (регионы на основании размера ВВС и отслеживание позиции самолетов в реальном времени). Панель наблюдения отображает динамические данные двумя способами: оттенок региона (чтобы показать численность ВВС в стране) и точки-маркеры (для позиций самолетов). Потом я построю карту, чтобы аккуратно и красиво отобразить все эти данные.
Читать дальше →
Всего голосов 14: ↑14 и ↓0+14
Комментарии0

Почему компания меня потеряла

Время на прочтение7 мин
Количество просмотров66K
Когда деревья были только бинарными, а дешевая чашка кофе стоила дороже, чем час программиста, автор делал первые попытки программирования. Не существовало «айтишников», «дизайнеров», «js-ников», и даже «прогеров» — ты либо был на «ты» с железками, всем софтом и программированием, либо нет. Время ушло, пришла специализация, выросли оклады, потом еще раз, а потом помножились на два. И теперь мы охеревшие настолько специализированы, что…

Автор — из старой школы. По разным причинам. Мне нравится заниматься «всем», помогать себе и компании, и я рассчитываю на отдачу — не только, и не столько, на финансовую. Я постоянно учусь. Но не только своей «основной», узкой специальности (=программирование), за которую платят, и ниже объясню, почему…

Недавно я столкнулся с проблемой, известной как «переученность». Такое бывает, когда ты переростаешь вакансию «вширь», а компания не может никак это использовать. Тогда ты ломишься в стартапы, стараясь самовыразиться, ищешь варианты, разговариваешь с руководством (тут мне повезло), или просто уходишь.

Дальше я постараюсь обобщить личный и известный мне опыт по этой проблеме.

Тем, кто вдруг узнает меня по этой публикации
Пожалуйста, не показывайте, что читали это, ведь опыт может помочь нам всем, а каких-либо обид на вас у меня нет.
Читать дальше →
Всего голосов 169: ↑134 и ↓35+99
Комментарии412

Обзор литературы по языку Python для начинающих

Время на прочтение4 мин
Количество просмотров131K
Очень часто можно увидеть вопросы на том же тостере: «А какую книгу взять книгу, чтобы выучить технологи Х», и естественно в комментариях идет большое число мнений и большое число различных книг. В данной теме, я сделаю обзор самых популярных книг по Python для начинающих программистов, и дам четкое мнение – нужно ли их читать или нет (субъективно).

Нужно ли читать книги. Изучая новые технологии, я люблю читать книги по данной технологии, так как я получаю не только сухую информацию, но и субъективное мнение автора по пригодности данных технологий. И в отличие от видео-курсов, мне не приходится ждать, пока автор из себя выдавливает мысль. Да и читаю, я быстро.
Читать дальше →
Всего голосов 20: ↑18 и ↓2+16
Комментарии41

Введение в обучение с подкреплением: от многорукого бандита до полноценного RL агента

Время на прочтение11 мин
Количество просмотров37K
Привет, Хабр! Обучение с подкреплением является одним из самых перспективных направлений машинного обучения. С его помощью искусственный интеллект сегодня способен решать широчайший спектр задач: от робототехники и видеоигр до моделирования поведения покупателей и здравоохранения. В этой вводной статье мы изучим главную идею reinforcement learning и с нуля построим собственного самообучающегося бота.


Читать дальше →
Всего голосов 8: ↑7 и ↓1+6
Комментарии0

Системы ИИ научились создавать умные модели для ML: дайджест для начинающих

Время на прочтение5 мин
Количество просмотров14K
В ноябре участники исследовательского проекта Google Brain опубликовали результаты эксперимента AutoML. Им удалось создать систему, которая порождает новые ИИ-модели, используя метод обучения с подкреплением. Реализованный таким образом алгоритм уже справляется с задачей лучше решений, полностью написанных человеком.

В этой статье мы расскажем об особенностях работы системы AutoML, а также приведем подборку книг и курсов по машинному обучению, которые помогут поближе познакомиться с технологиями искусственного интеллекта.

Читать дальше →
Всего голосов 19: ↑17 и ↓2+15
Комментарии7

Как ИИ совершает тайную революцию в медицине

Время на прочтение13 мин
Количество просмотров16K


«The Artificially Intelligent Doctor Will Hear You Now»


Нынешний этап массового интереса к нейросетям во многом связан с возможностями сеток по обработке изображений. Улучшить качество фотографии, стилизовать селфи под картину известного художника, выявить объект в кадре и запустить каскад внешних событий — все эти наглядные примеры сегодня доступны в различных продуктах: от приложения для обработки фотографий до сложной системы дорожного автопилота.


Есть еще одна важная сфера применения нейросетей и других технологий, близких к ИИ, — это медицина. Если речь не идет об IBM Watson, то новости из сложного мира высокотехнологичной борьбы за здоровье человека редко просачиваются в СМИ. А тем временем происходит настоящая революция — оказалось, что система автоматизированной обработки изображений не только может стать мощным инструментом анализа и помощи для врача, но и в некоторых случаях заменить самого специалиста.


И не только нейросети питают новый технологический рывок. Бигдата, машинное обучение в целом и даже блокчейн становятся основой для медицинских стартапов, вносящих вклад в борьбу с болезнями и старением.

Читать дальше →
Всего голосов 21: ↑21 и ↓0+21
Комментарии4

Врачи должны назначать сон: чего вам может стоить недосыпание

Время на прочтение12 мин
Количество просмотров48K
Ведущий нейробиолог Мэтью Уокер – о том, почему недосыпание увеличивает риск рака, инфаркта и болезни Альцгеймера, и что с этим можно сделать



Мэтью Уокер научился бояться вопроса «Чем занимаетесь?» На вечеринках он знаменует конец приятного вечера; после этого его новые знакомые начинают цепляться к нему, как плющ. В самолёте он обычно означает, что в то время, как все остальные смотрят фильмы или читают остросюжетные романы, он оказывается в центре многочасовой встречи интересующихся его работой пассажиров и работников авиакомпании. «Я уже начал врать, – говорит он. – Серьёзно. Я говорю людям, что дрессирую дельфинов. Так лучше для всех».

Уокер — сомнолог. Точнее, он директор Центра исследований человеческого сна в Калифорнийском университете в Беркли, исследовательского института, цель которого – возможно, недостижимая – понять весь спектр способов влияния сна на нас, с рождения до смерти, в болезни и в здравии. Неудивительно, что люди начинают с ним советоваться. Размытию границы между работой и отдыхом способствует ещё и то, что мало кто не испытывает волнений по поводу собственного сна. Но большинство людей, разглядывая круги под глазами, не знают и половины всего – и, возможно, именно поэтому он перестал рассказывать незнакомцам о своей работе. Когда Уокер рассказывает про сон, он не может, конечно же, ограничиться банальностями типа ромашкового чая и тёплой ванны. Он убеждён, что у нас вовсю идёт «катастрофическая эпидемия потери сна», последствия которой гораздо хуже, чем кто-либо может представить. И эта ситуация, по его мнению, сможет измениться только после вмешательства властей.
Читать дальше →
Всего голосов 30: ↑29 и ↓1+28
Комментарии58

О сборе данных. Как собирать данные, анализировать их и грабить корованы

Время на прочтение8 мин
Количество просмотров23K

В предыдущей статье мы рассматривали вопросы качества данных («О качестве данных и распространенных ошибках при их сборе» на Хабре).
Сегодня я хочу продолжить разговор о качестве данных и обсудить их сбор: как правильно расставить приоритеты при выборе источника, как и какие данные собирать, оценка ценности данных для компании и другое.

Собирайте всё


Вы решили улучшить оформление и оплату товара на сайте?
Отлично, а как проходит процесс формирования корзины покупателем? В какой момент он делает окончательный выбор товаров: до добавления в корзину или перед оплатой покупки?
На каждом сайте может быть по разному, но как ведет себя клиент у вас?
При обладании данными об оформлении заказа их можно проанализировать и определиться с вектором обновления, который будет удобен не только вам, но и пользователям.
Читать дальше →
Всего голосов 15: ↑13 и ↓2+11
Комментарии16

Подробности разработки генной терапии старения в интервью с «Fight Aging!»

Время на прочтение14 мин
Количество просмотров11K
image

Как я неоднократно говорил и писал (1, 2), эпигенетический откат видится мне наиболее перспективным, а то и вообще единственным подходом, способным существенно продлить нам жизнь. Почему? Потому что эпигенетика играет ключевую роль в выполнении всей программы развития организма — от эмбриогенеза до танатогенеза. И пока мы не в силах остановить этот процесс, мы можем хотя бы попробовать его периодически откатывать назад. Именно такой подход продлил жизнь прогерийным мышам на 33-50% в опытах группы Бельмонте.

Верю я в этот подход настолько, что решил организовать проект по его трансляции из научной плоскости в прикладную. Своё видение того, как это реализовать я тоже уже описывал (1, 2). Наиболее оптимальным способом привлечения финансирования на такой проект мне видится краудфандинг. Блокчейн и криптовалюты за последний год вывели возможности краудфандинга на новый уровень, и те проекты, которые раньше не могли и надеяться на привлечение необходимого объема средств, с помощью ICO смогли собрать даже избыточные для их реализации суммы.

Да, пик сборов в ICO, скорее всего, уже позади, но видя, насколько сырые проекты продолжают привлекать значительные объемы финансирования, мне кажется, у нас есть все шансы собрать достаточную сумму для того, чтобы значительно продвинуться в нашей задаче. Подробно обо всём этом, наших целях и стратегии их достижения я рассказал весьма уважаемому в кругах борцов со старением сайту «Fight Aging!». Привожу перевод этого интервью здесь.
Читать дальше →
Всего голосов 15: ↑15 и ↓0+15
Комментарии33

Является ли межплеменная вражда естественным сбоем?

Время на прочтение7 мин
Количество просмотров19K

Чему учат нас компьютеры по поводу того, как ладить друг с другом




В нашем офисе в университете Карнеги-Мэллон мы с моим коллегой Джоном Миллером создали компьютерную программу, склонную к геноциду.

Мы к этому точно не стремились. Мы не изучали соперничество или войны. Нас интересовало зарождение примитивных форм сотрудничества. Так что мы создавали машины, живущие в воображаемом обществе, и заставляли их играть друг с другом в игру – она известна тем, что порождает сложное социальное поведение не хуже, чем гнилой банан порождает плодовых мушек.

Игра называется "Дилемма заключённого". У неё есть много разновидностей, но по сути – это история о двух людях, выбирающих, сотрудничать им или обманывать друг друга. Если оба обманывают, страдают оба. Если оба сотрудничают, обоим будет лучше. Но если один сотрудничает, а второй обманывает – обманщику будет ещё лучше.
Читать дальше →
Всего голосов 36: ↑35 и ↓1+34
Комментарии37

Вечные студенты: когда программирование — это постоянная «учеба»

Время на прочтение7 мин
Количество просмотров23K

Если вы выбрали для себя профессию программиста, учеба, как правило, становится вашим постоянным спутником, хотите вы этого или нет. В этой области «выучить что-то раз и навсегда» маловероятно — постоянно появляются новые решения, новые фреймворки, в конце концов, новые языки. В сегодняшнем материале расскажем, почему разработчикам важно оставаться «вечными студентами», что говорит об изучении новых языков статистика Stack Overflow и почему программирование постепенно превращается в метод изучения других дисциплин.

Читать дальше →
Всего голосов 19: ↑15 и ↓4+11
Комментарии12

Почему DataScientist-ы не используют ошибки первого и второго рода

Время на прочтение6 мин
Количество просмотров21K

Вчера мне в очередной раз пришлось объяснять почему DataScientist-ы не используют ошибки первого и второго рода и зачем же ввели полноту и точность. Вот прямо заняться нам нечем, лишь бы новые критерии вводить.


И если ошибка второго рода выражается просто:


$O_2 = 1 - \Pi$


где Π — это полнота;


то вот ошибка первого рода весьма нетривиально выражается через полноту и точность (см.ниже).


Но это лирика. Самый важный вопрос:


Почему в DataScience используют полноту и точность и почти никогда не говорят об ошибках первого и второго рода?

Кто не знает или забыл — прошу под кат.

Дальше читать
Всего голосов 16: ↑13 и ↓3+10
Комментарии6

Машинное обучение — это легко

Время на прочтение7 мин
Количество просмотров346K
В данной статье речь пойдёт о машинном обучении в целом и взаимодействии с датасетами. Если вы начинающий, не знаете с чего начать изучение и вам интересно узнать, что такое «датасет», а также зачем вообще нужен Machine Learning и почему в последнее время он набирает все большую популярность, прошу под кат. Мы будем использовать Python 3, так это как достаточно простой инструмент для изучения машинного обучения.
Читать дальше →
Всего голосов 51: ↑44 и ↓7+37
Комментарии20

Демонстрационная база данных для PostgreSQL

Время на прочтение7 мин
Количество просмотров65K

В этой заметке я расскажу о нашей демонстрационной базе данных для PostgreSQL: почему она важна для нас и как может пригодиться вам, как устроена схема и какие данные в ней содержатся.


Сразу приведу ссылку на полное описание (там же написано, где взять демо-базу и как ее установить).


image

Читать дальше →
Всего голосов 38: ↑38 и ↓0+38
Комментарии32

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

Research Scientist
Senior