Статьи / Закладки / Профиль Howuhh / Хабр

Александр Никулин @Howuhh

Research Scientist @ AIRI, Phd @ MIPT

Профиль Публикации 1Комментарии 4Закладки 16

Howuhh 29 июл в 13:01

XLand-100B: первый в мире большой датасет для контекстного обучения с подкреплением

Сложный

11 мин

1.8K

Блог компании AIRIАлгоритмы*Big Data*Машинное обучение*Искусственный интеллект

Кейс

Хабр, привет! Меня зовут Александр Никулин, я аспирант МФТИ и один из исследователей научной группы «Адаптивные агенты» в Институте AIRI.

Как можно понять из названия, наша группа заинтересована в создании адаптивных агентов, способных обобщаться на новые задачи после обучения. Направление это относительно новое и в литературе именуется как контекстное обучение с подкреплением (далее in‑context RL). И мы активно двигаем его вперед! Совсем недавно выпустили две статьи, обе приняты на ICML 2024, а ещё среду на JAX со множеством задач для мета‑обучения. Мы обязательно расскажем о них чуть позже (подписывайтесь!), а в этой статье хочется затронуть наш недавний препринт. В нем мы представили и выложили в open‑source огромный (по меркам RL) и пока единственный датасет для in‑context RL. На сбор траекторий для 40к задач и 130B транзиций потребовалось 50 000 GPU‑часов. Эту работу мы проделали совместно с коллегами из лаборатории T-Bank AI Research.

Датасетом уже можно пользоваться, так что рассказываем и надеемся на будущий акцепт статьи! Ну а начнем чуть издалека, расскажу что такое in‑context learning, как он появился в RL и почему нам понадобился собственный датасет.

+12

qc-enior 5 янв 2018 в 15:20

Как построить географическую панель наблюдения с данными в реальном времени

3 мин

9.2K

Визуализация данных*R*

Перевод

В этом посте покажу, как построить интерактивную географическую панель наблюдения с Displayr, Plotly и R. Особенно интересно, что она отслеживает позицию военных самолетов в реальном времени. Для этого я собираюсь взять данные из двух разных источников (регионы на основании размера ВВС и отслеживание позиции самолетов в реальном времени). Панель наблюдения отображает динамические данные двумя способами: оттенок региона (чтобы показать численность ВВС в стране) и точки-маркеры (для позиций самолетов). Потом я построю карту, чтобы аккуратно и красиво отобразить все эти данные.

Читать дальше →

+14

swh 15 дек 2017 в 14:56

Почему компания меня потеряла

7 мин

66K

Управление персоналом*

Из песочницы

Когда деревья были только бинарными, а дешевая чашка кофе стоила дороже, чем час программиста, автор делал первые попытки программирования. Не существовало «айтишников», «дизайнеров», «js-ников», и даже «прогеров» — ты либо был на «ты» с железками, всем софтом и программированием, либо нет. Время ушло, пришла специализация, выросли оклады, потом еще раз, а потом помножились на два. И теперь мы ~~охеревшие~~ настолько специализированы, что…

Автор — из старой школы. По разным причинам. Мне нравится заниматься «всем», помогать себе и компании, и я рассчитываю на отдачу — не только, и не столько, на финансовую. Я постоянно учусь. Но не только своей «основной», узкой специальности (=программирование), за которую платят, и ниже объясню, почему…

Недавно я столкнулся с проблемой, известной как «переученность». Такое бывает, когда ты переростаешь вакансию «вширь», а компания не может никак это использовать. Тогда ты ломишься в стартапы, стараясь самовыразиться, ищешь варианты, разговариваешь с руководством (тут мне повезло), или просто уходишь.

Дальше я постараюсь обобщить личный и известный мне опыт по этой проблеме.

Тем, кто вдруг узнает меня по этой публикации

Пожалуйста, не показывайте, что читали это, ведь опыт может помочь нам всем, а каких-либо обид на вас у меня нет.

Читать дальше →

+99

412

hatman 8 дек 2017 в 04:40

Обзор литературы по языку Python для начинающих

4 мин

131K

Учебный процесс в ITPython*Django*

Очень часто можно увидеть вопросы на том же тостере: «А какую книгу взять книгу, чтобы выучить технологи Х», и естественно в комментариях идет большое число мнений и большое число различных книг. В данной теме, я сделаю обзор самых популярных книг по Python для начинающих программистов, и дам четкое мнение – нужно ли их читать или нет (субъективно).

Нужно ли читать книги. Изучая новые технологии, я люблю читать книги по данной технологии, так как я получаю не только сухую информацию, но и субъективное мнение автора по пригодности данных технологий. И в отличие от видео-курсов, мне не приходится ждать, пока автор из себя выдавливает мысль. Да и читаю, я быстро.

Читать дальше →

+16

a-pichugin 4 дек 2017 в 13:23

Введение в обучение с подкреплением: от многорукого бандита до полноценного RL агента

11 мин

37K

Блог компании New Professions LabМашинное обучение*Python*Data Mining*Big Data*

Перевод

Привет, Хабр! Обучение с подкреплением является одним из самых перспективных направлений машинного обучения. С его помощью искусственный интеллект сегодня способен решать широчайший спектр задач: от робототехники и видеоигр до моделирования поведения покупателей и здравоохранения. В этой вводной статье мы изучим главную идею reinforcement learning и с нуля построим собственного самообучающегося бота.

Читать дальше →

1cloud 3 дек 2017 в 15:32

Системы ИИ научились создавать умные модели для ML: дайджест для начинающих

5 мин

14K

Блог компании 1cloud.ruМашинное обучение*Программирование*Читальный зал

В ноябре участники исследовательского проекта Google Brain опубликовали результаты эксперимента AutoML. Им удалось создать систему, которая порождает новые ИИ-модели, используя метод обучения с подкреплением. Реализованный таким образом алгоритм уже справляется с задачей лучше решений, полностью написанных человеком.

В этой статье мы расскажем об особенностях работы системы AutoML, а также приведем подборку книг и курсов по машинному обучению, которые помогут поближе познакомиться с технологиями искусственного интеллекта.

Читать дальше →

+15

randall 28 ноя 2017 в 16:26

Как ИИ совершает тайную революцию в медицине

13 мин

16K

Блог компании VKЗдоровьеНаучно-популярное

«The Artificially Intelligent Doctor Will Hear You Now»

Нынешний этап массового интереса к нейросетям во многом связан с возможностями сеток по обработке изображений. Улучшить качество фотографии, стилизовать селфи под картину известного художника, выявить объект в кадре и запустить каскад внешних событий — все эти наглядные примеры сегодня доступны в различных продуктах: от приложения для обработки фотографий до сложной системы дорожного автопилота.

Есть еще одна важная сфера применения нейросетей и других технологий, близких к ИИ, — это медицина. Если речь не идет об IBM Watson, то новости из сложного мира высокотехнологичной борьбы за здоровье человека редко просачиваются в СМИ. А тем временем происходит настоящая революция — оказалось, что система автоматизированной обработки изображений не только может стать мощным инструментом анализа и помощи для врача, но и в некоторых случаях заменить самого специалиста.

И не только нейросети питают новый технологический рывок. Бигдата, машинное обучение в целом и даже блокчейн становятся основой для медицинских стартапов, вносящих вклад в борьбу с болезнями и старением.

Читать дальше →

+21

SLY_G 11 окт 2017 в 13:31

Врачи должны назначать сон: чего вам может стоить недосыпание

12 мин

48K

МозгЗдоровье

Перевод

Ведущий нейробиолог Мэтью Уокер – о том, почему недосыпание увеличивает риск рака, инфаркта и болезни Альцгеймера, и что с этим можно сделать

Мэтью Уокер научился бояться вопроса «Чем занимаетесь?» На вечеринках он знаменует конец приятного вечера; после этого его новые знакомые начинают цепляться к нему, как плющ. В самолёте он обычно означает, что в то время, как все остальные смотрят фильмы или читают остросюжетные романы, он оказывается в центре многочасовой встречи интересующихся его работой пассажиров и работников авиакомпании. «Я уже начал врать, – говорит он. – Серьёзно. Я говорю людям, что дрессирую дельфинов. Так лучше для всех».

Уокер — сомнолог. Точнее, он директор Центра исследований человеческого сна в Калифорнийском университете в Беркли, исследовательского института, цель которого – возможно, недостижимая – понять весь спектр способов влияния сна на нас, с рождения до смерти, в болезни и в здравии. Неудивительно, что люди начинают с ним советоваться. Размытию границы между работой и отдыхом способствует ещё и то, что мало кто не испытывает волнений по поводу собственного сна. Но большинство людей, разглядывая круги под глазами, не знают и половины всего – и, возможно, именно поэтому он перестал рассказывать незнакомцам о своей работе. Когда Уокер рассказывает про сон, он не может, конечно же, ограничиться банальностями типа ромашкового чая и тёплой ванны. Он убеждён, что у нас вовсю идёт «катастрофическая эпидемия потери сна», последствия которой гораздо хуже, чем кто-либо может представить. И эта ситуация, по его мнению, сможет измениться только после вмешательства властей.

Читать дальше →

+28

Knjazh 6 ноя 2017 в 05:38

О сборе данных. Как собирать данные, анализировать их и грабить корованы

8 мин

23K

Статистика в ITЧулан

В предыдущей статье мы рассматривали вопросы качества данных («О качестве данных и распространенных ошибках при их сборе» на Хабре).
Сегодня я хочу продолжить разговор о качестве данных и обсудить их сбор: как правильно расставить приоритеты при выборе источника, как и какие данные собирать, оценка ценности данных для компании и другое.

Собирайте всё

Вы решили улучшить оформление и оплату товара на сайте?
Отлично, а как проходит процесс формирования корзины покупателем? В какой момент он делает окончательный выбор товаров: до добавления в корзину или перед оплатой покупки?
На каждом сайте может быть по разному, но как ведет себя клиент у вас?
При обладании данными об оформлении заказа их можно проанализировать и определиться с вектором обновления, который будет удобен не только вам, но и пользователям.

Читать дальше →

+11

YuriDeigin 7 ноя 2017 в 05:26

Подробности разработки генной терапии старения в интервью с «Fight Aging!»

14 мин

11K

ИнтервьюЗдоровьеБиотехнологииНаучно-популярное

Как я неоднократно говорил и писал (1, 2), эпигенетический откат видится мне наиболее перспективным, а то и вообще единственным подходом, способным существенно продлить нам жизнь. Почему? Потому что эпигенетика играет ключевую роль в выполнении всей программы развития организма — от эмбриогенеза до танатогенеза. И пока мы не в силах остановить этот процесс, мы можем хотя бы попробовать его периодически откатывать назад. Именно такой подход продлил жизнь прогерийным мышам на 33-50% в опытах группы Бельмонте.

Верю я в этот подход настолько, что решил организовать проект по его трансляции из научной плоскости в прикладную. Своё видение того, как это реализовать я тоже уже описывал (1, 2). Наиболее оптимальным способом привлечения финансирования на такой проект мне видится краудфандинг. Блокчейн и криптовалюты за последний год вывели возможности краудфандинга на новый уровень, и те проекты, которые раньше не могли и надеяться на привлечение необходимого объема средств, с помощью ICO смогли собрать даже избыточные для их реализации суммы.

Да, пик сборов в ICO, скорее всего, уже позади, но видя, насколько сырые проекты продолжают привлекать значительные объемы финансирования, мне кажется, у нас есть все шансы собрать достаточную сумму для того, чтобы значительно продвинуться в нашей задаче. Подробно обо всём этом, наших целях и стратегии их достижения я рассказал весьма уважаемому в кругах борцов со старением сайту «Fight Aging!». Привожу перевод этого интервью здесь.

Читать дальше →

+15

SLY_G 20 окт 2017 в 13:31

Является ли межплеменная вражда естественным сбоем?

7 мин

19K

Искусственный интеллект

Перевод

Чему учат нас компьютеры по поводу того, как ладить друг с другом

В нашем офисе в университете Карнеги-Мэллон мы с моим коллегой Джоном Миллером создали компьютерную программу, склонную к геноциду.

Мы к этому точно не стремились. Мы не изучали соперничество или войны. Нас интересовало зарождение примитивных форм сотрудничества. Так что мы создавали машины, живущие в воображаемом обществе, и заставляли их играть друг с другом в игру – она известна тем, что порождает сложное социальное поведение не хуже, чем гнилой банан порождает плодовых мушек.

Игра называется "Дилемма заключённого". У неё есть много разновидностей, но по сути – это история о двух людях, выбирающих, сотрудничать им или обманывать друг друга. Если оба обманывают, страдают оба. Если оба сотрудничают, обоим будет лучше. Но если один сотрудничает, а второй обманывает – обманщику будет ещё лучше.

Читать дальше →

+34

itmo 17 окт 2017 в 12:16

Вечные студенты: когда программирование — это постоянная «учеба»

7 мин

23K

Блог компании ИТМОСовершенный код*Программирование*Занимательные задачкиАнализ и проектирование систем*

 Если вы выбрали для себя профессию программиста, учеба, как правило, становится вашим постоянным спутником, хотите вы этого или нет. В этой области «выучить что-то раз и навсегда» маловероятно — постоянно появляются новые решения, новые фреймворки, в конце концов, новые языки. В сегодняшнем материале расскажем, почему разработчикам важно оставаться «вечными студентами», что говорит об изучении новых языков статистика Stack Overflow и почему программирование постепенно превращается в метод изучения других дисциплин.

Читать дальше →

+11

PavelMSTU 16 окт 2017 в 11:57

Почему DataScientist-ы не используют ошибки первого и второго рода

6 мин

21K

Математика*Машинное обучение*Анализ и проектирование систем*Big Data*

Вчера мне в очередной раз пришлось объяснять почему DataScientist-ы не используют ошибки первого и второго рода и зачем же ввели полноту и точность. Вот прямо заняться нам нечем, лишь бы новые критерии вводить.

И если ошибка второго рода выражается просто:

$O_2 = 1 - \Pi$

где Π — это полнота;

то вот ошибка первого рода весьма нетривиально выражается через полноту и точность (см.ниже).

Но это лирика. Самый важный вопрос:

Почему в DataScience используют полноту и точность и почти никогда не говорят об ошибках первого и второго рода?

Кто не знает или забыл — прошу под кат.

Дальше читать

+10

falklol 11 янв 2017 в 12:14

Машинное обучение — это легко

7 мин

346K

Big Data*Python*Машинное обучение*

Из песочницы

В данной статье речь пойдёт о машинном обучении в целом и взаимодействии с датасетами. Если вы начинающий, не знаете с чего начать изучение и вам интересно узнать, что такое «датасет», а также зачем вообще нужен Machine Learning и почему в последнее время он набирает все большую популярность, прошу под кат. Мы будем использовать Python 3, так это как достаточно простой инструмент для изучения машинного обучения.

Читать дальше →

+37

erogov 30 ноя 2016 в 12:32

Демонстрационная база данных для PostgreSQL

7 мин

65K

Блог компании Postgres ProfessionalPostgreSQL*SQL*

В этой заметке я расскажу о нашей демонстрационной базе данных для PostgreSQL: почему она важна для нас и как может пригодиться вам, как устроена схема и какие данные в ней содержатся.

Сразу приведу ссылку на полное описание (там же написано, где взять демо-базу и как ее установить).

Читать дальше →

+38

XLand-100B: первый в мире большой датасет для контекстного обучения с подкреплением

Как построить географическую панель наблюдения с данными в реальном времени

Почему компания меня потеряла

Обзор литературы по языку Python для начинающих

Введение в обучение с подкреплением: от многорукого бандита до полноценного RL агента

Системы ИИ научились создавать умные модели для ML: дайджест для начинающих

Как ИИ совершает тайную революцию в медицине

Врачи должны назначать сон: чего вам может стоить недосыпание

О сборе данных. Как собирать данные, анализировать их и грабить корованы

Собирайте всё

Подробности разработки генной терапии старения в интервью с «Fight Aging!»

Является ли межплеменная вражда естественным сбоем?

Чему учат нас компьютеры по поводу того, как ладить друг с другом

Вечные студенты: когда программирование — это постоянная «учеба»

Почему DataScientist-ы не используют ошибки первого и второго рода

Машинное обучение — это легко

Демонстрационная база данных для PostgreSQL

Информация

Специализация