Все потоки
Поиск
Написать публикацию
Обновить
855.02

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга

Проект "Иммуном Человека" опубликовал целый Научный План по созданию крупнейшего в мире набора данных по иммунологии и разработке моделей искусственного интеллекта для более глубокого понимания иммунной системы и улучшения здоровья населения на глобальном уровне. 

План предполагает создание глобальных исследовательских центров и разработку передовых инструментов искусственного интеллекта для анализа изменений и реакций иммунной системы.

Полученные данные участников (клетки, транскрипты, антитела, белки, эпигенетические модификации и метаболиты) будут использоваться для создания и валидации архитектуры машинного обучения моделей ИИ HIP. Цель на данном этапе заключается в разработке, обучении и валидации одной или нескольких моделей, способных отражать динамику иммунной системы и предсказывать реакцию организма на внешнее воздействие, исходя из базового состояния иммунитета.

“Проект находится на переднем крае научных открытий и обладает уникальными возможностями для предоставления научному и медицинскому сообществу знаний и инструментов для разработки новых диагностических средств, лекарств, вакцин и иммунотерапии, которые могут бороться с болезнями, продлевать продолжительность жизни и обеспечивать более персонализированное и эффективное здравоохранение для всех.”, – высказался ведущий доктор проекта.

Теги:
Всего голосов 3: ↑3 и ↓0+4
Комментарии0

В очередной раз убедились, что сила Хабра — в сообществе. Сторонние разработчики не только попробовали на практике наш YandexGPT API, но и даже создали для него SDK, который теперь доступен всем в опенсорсе с хорошей документацией.

Обо всём этом они рассказали в своей статье на Хабре. Рекомендую почитать.

Теги:
Всего голосов 7: ↑7 и ↓0+9
Комментарии0

Подборка статей для Research MLE


Не так давно я для себя понял, насколько важно читать научные статьи в ML, но сталкиваешься с тем что только 20% статей дадут тебе 80% результата. В своем Notion я собрал небольшую подборку самых интересных и полезных статей по LLM и RecSys. (которая кстати пополняется)

NLP:
Там есть как классические статейки от w2v, attention, transformers, gpt, gpt2, ...
Так и популярные или не так давно вышедших peft, llama, reft

RecSys:
Стараюсь пополнять интересными статейками от топовых лабораторий Meta, Deezer, Spotify, Netflix, X, ... Или годными статья из NIPS или ACM

На некоторые из этих статей я собираюсь писать обзорчики на Habr, кстати недавно вот написал про персонализированный Cold Start в Deezer. Про некоторые я выложу просто Summary в свой телеграм канал или сделаю конспект в Notion.

Если вдруг вам захочется пополнить этот банк статей, то можете закинуть свои идеи вот сюда.

Теги:
Всего голосов 2: ↑2 и ↓0+3
Комментарии0

Сервисы Яндекса основаны в том числе на ML-технологиях. Важно, чтобы исследователи в области машинного обучения оставались в науке, ведь их открытия могут привести к появлению технологий, способных сделать жизнь людей лучше. Поэтому сегодня мы вновь открыли приём заявок на научную премию Yandex ML Prize.

Премия вручается молодым исследователям, научным руководителям и преподавателям. В 2024 году премия будет вручаться в пяти номинациях: «Первая публикация», «Исследователи», «Молодые научные руководители», «Научные руководители», «Преподаватели ML».

Исследователи, ставшие лауреатами премии, получат по полмиллиона рублей, а научные руководители — по миллиону рублей. Также Yandex Cloud предоставит победителям гранты на облачные вычисления на платформе, что позволит им обрабатывать данные экспериментов и обучать ML-модели.

Теги:
Всего голосов 6: ↑6 и ↓0+7
Комментарии1

Пользователи выяснили, что нейросеть «Яндекса» «Нейро» выдаёт более точные ответы, если попросить в промпте «уточнить во внутренней сети Яндекса».

16 апреля «Яндекс» представил «Нейро» — нейросеть для поиска информации в Сети. В компании рассказали, что научили модель машинного обучения использовать внешние источники данных, чтобы не упираться в пределы обучения.

Теги:
Всего голосов 6: ↑6 и ↓0+7
Комментарии0

Дайджест материалов Магнус

Самой короткой рабочей неделе в году — самый короткий материал! Делимся подборкой статей за последние три месяца.

Что может быть важнее данных? То, как они хранятся, используются и воспроизводятся. Эти и другие возможности есть в инструменте ClearML: рассказываем о работе с ним.

Высококачественные данные — это «топливо» для моделей глубокого обучения. Рассказали в этом материале, с помощью чего можно улучшить качество данных.

Предсказывать цены могут не только крупные ритейлеры, но и розничные офлайн-магазины. Как? Рассказали здесь.

Как тимлиду ML-команды выстроить качественные продуктивные отношения с коллегами? Узнали у senior-разработчика, советы собрали тут.

Как учиться, чтобы время и усилия были слиты не зря? Подготовили 10 советов для тех, кто хочет получить от курсов всё.

Получили интересное мнение из первых рук: Роман Резников, senior-разработчик и DL-engineer, рассказал про промт-инжиниринг в работе и личной жизни.

Теги:
Всего голосов 2: ↑2 и ↓0+3
Комментарии0

Visual Capitalist проанализировал, сколько патентов в сфере ИИ было зарегистрировано в разных странах мира с 2010 по 2022 год.

За основу исследования были взяты данные аналитической организации Center for Security and Emerging Technology (CSET) из ИИ-доклада Стэнфордского университета.

Мировым лидером по числу ИИ-патентов является Китай. Он обогнал США по этому показателю в 2013 году и без остановки лидирует с тех пор. А в 2022 году в азиатской стране впервые было зафиксировано больше патентов, чем во всём остальном мире в сумме. Это говорит о высокой интенсивности ИИ-исследований в Китае, но не обязательно означает, что он опережает остальных по качеству ИИ-разработок.

В США большинство патентов принадлежат техногигантам, таким как IBM, Microsoft и Google. В Китае они в основном сосредоточены в руках государственных организаций, вузов и технологических компаний, например Tencent.

Китайские патенты в основном связаны с машинным зрением, американские же в более равной степени охватывают более широкий спектр направлений исследований различных систем на базе ИИ.

Теги:
Всего голосов 2: ↑2 и ↓0+3
Комментарии0

СМИ сообщили, что у Apple есть секретная передовая лаборатория Vision Lab с командами по работе с ИИ в Цюрихе (Швейцария). Специалисты из этого подразделения отвечает за самые революционные разработки в сфере ИИ и чат-ботов. С 2018 года Apple наняла в эту лабораторию как минимум 36 специалистов из Google.

Vision Lab была основана после того, как Apple купила два швейцарских стартапа: FaceShift (VR) и Fashwell (распознавание изображений).

Сотрудники лаборатории Vision Lab участвовали в исследовании больших языковых моделей, которые лежат в основе чат-ботов, таких как ChatGPT.

Теги:
Всего голосов 2: ↑2 и ↓0+3
Комментарии1

В ОАЭ начались первые в мире гонки ИИ–болидов.

27 апреля 2024 года в ОАЭ начались первые в мире гонки ИИ–болидов Автономной гоночной лиги (Abu Dhabi Autonomous Racing League – A2RL). Призовой фонд этого соревнования составляет $2,25 млн.

Учить своего ИИ-«пилота» взялись восемь команд:

  • Code19 Racing: одна из первых независимых автономных гоночных организаций в США.

  • Университет Конструкторов: одноимённый частный университет, Германия и Швейцария.

  • Fly Eagle: Пекинский технологический институт Китая и Университет Халифа, ОАЭ.

  • HUMDA Lab: университет Иштвана Сечени, Венгрия.

  • KINETIZ: смесь команды Kintsugi из ОАЭ и Наньянского университета.

  • PoliMOVE: Миланский политехнический университет, Италия.

  • UNIMORE: команда Университета Модены и Реджо-Эмилии, Италия.

  • TUM: Мюнхенский технический университет, Германия.

Каждая команда должна будет использовать свои навыки программирования, алгоритмы искусственного интеллекта и опыт в машинном обучении.

ИИ-болидам придётся соревноваться на гоночной трассе Яс-Марина в Абу-Даби, ОАЭ, на которой дебютировал Гран-при Абу-Даби в сезоне 2009 года Формулы-1. Для беспилотных спорткаров была специально подготовлена 5-километровая трассе с 16 поворотами. Болидам самостоятельно необходимо проехать 16 кругов.

Теги:
Всего голосов 4: ↑4 и ↓0+6
Комментарии1

Нейросетевой модели «Сбера» GigaChat исполнился один год. За это время аудитория сервиса выросла с нескольких тысяч сотрудников «Сбера» до пяти млн уникальных пользователей. Совокупное количество запросов к сервису превысило 90 млн.

GigaChat доступен бесплатно через веб-версию, Telegram и «ВКонтакте», на умных устройствах Sber и в приложении «Салют» на Android.

С начала февраля 2024 года, активных пользователей чат-бота GigaChat на платформе «ВКонтакте» увеличилось в 10 раз и достигло 1,7 млн человек, а 1,4 млн человек создали «ВКонтакте» 2 млн открыток за месяц.

24 апреля 2023 года «Сбер» объявил о выпуске своего аналога ChatGPT — GigaChat. По заявлению компании, она первой из российских техногигантов выпустила собственную версию мультимодальной нейросети. GigaChat умеет отвечать на вопросы пользователей, поддерживать диалог, писать программный код, создавать тексты и картинки на основе описаний в рамках единого контекста,поддерживает мультимодальное взаимодействие и грамотно общается на русском языке.

Разработчики «Сбера» опубликовали подробный материал на Хабре о нейросети GigaChat и совокупности моделей, лежащих в основе GigaChat, которую они назвали NeONKA.

Теги:
Всего голосов 3: ↑3 и ↓0+5
Комментарии0

Реддитор под ником Alchemist1123 превратил Minecraft в мультфильм. Он запустил нейросеть Stable Diffusion прямо поверх vanilla Minecraft. ИИ-система на лету начала менять внешний вид игры.


Теги:
Всего голосов 5: ↑5 и ↓0+6
Комментарии0

«Сбер» совместно с нейросетью Kandinsky спасает утерянные картины великих художников, включая Илью Репина.

Проект Kandinsky в рамках выставки «Возрождённая коллекция» сумел воссоздать 9 полотен из Сталинградской картинной галереи, которые пропали в годы Великой Отечественной войны.

В Kandinsky залили чёрно-белые снимки и архивные описания полотен — так ИИ смог восстановить работы Репина, Сурикова, Иванова и других авторов почти в первозданном виде.

Увидеть их все можно на выставке «Возрождённая коллекция» в Волгограде — как офлайн, так и онлайн.

Теги:
Всего голосов 2: ↑2 и ↓0+3
Комментарии2

Гендиректор Nvidia Дженсен Хуанг (Jensen Huang) лично доставил свой новый флагманский ускоритель DGX H200 в офис компании OpenAI в Сан-Франциско, подчеркнув тесную связь между двумя гигантами в отрасли искусственного интеллекта.

Хуанга встретили соучредитель OpenAI Грег Брокман и гендиректор компании Сэм Альтман.

DGX H200 – это новейший ускоритель ИИ-вычислений Nvidia, оснащенный 141 ГБ памяти HBM3e. Производитель позиционирует это решение как самый мощный ИИ-ускоритель Nvidia, знаменующий шаг вперёд в области технологий ИИ с производительностью в 1 экзафлопс.

Теги:
Всего голосов 3: ↑3 и ↓0+4
Комментарии3

Ближайшие события

27 апреля 2024 гола в ОАЭ пройдут первые в мире соревнования беспилотных болидов. Призовой фонд этого соревнования составляет $2,25 млн.

Зарегистрированные для участия в соревновании команды уже получили машины Dallara Super Formula SF23 — настоящие болиды категории Super Formula. Инженеры должны оснастить болиды оборудованием для автоматического вождения: GPS, радаром, лидаром, семью камерами и компьютером для обработки поступающей информации. Разным ИИ‑моделям предстоит ориентироваться на реальной гоночной трассе и завершить гонку раньше остальных. Учить своего «пилота» будут восемь команд:

  1. Code19 Racing: одна из первых независимых автономных гоночных организаций в США.

  2. Университет Конструкторов: одноимённый частный университет, Германия и Швейцария.

  3. Fly Eagle: Пекинский технологический институт Китая и Университет Халифа, ОАЭ.

  4. HUMDA Lab: университет Иштвана Сечени, Венгрия.

  5. KINETIZ: смесь команды Kintsugi из ОАЭ и Наньянского университета.

  6. PoliMOVE: Миланский политехнический университет, Италия.

  7. UNIMORE: команда Университета Модены и Реджо-Эмилии, Италия.

  8. TUM: Мюнхенский технический университет, Германия.

Каждая команда должна будет использовать свои навыки программирования, алгоритмы искусственного интеллекта и опыт в машинном обучении.

Теги:
Всего голосов 6: ↑6 и ↓0+8
Комментарии0

Команда Google Cloud представила несколько курсов по генеративному искусственному интеллекту для слушателей разного уровня знаний.

Обучающих программ три:

  • вводная часть, посвящённая основам технологии ИИ (бесплатная);

  • средняя часть, ориентированная на разработчиков приложений, дата-сайентистов, девопсов, инженеров по безопасности и других специалистов. Здесь рассказывается о фирменной платформе Gemini и её применении в различных IT-задачах;

  • продвинутая часть курса подойдёт для ИИ/ML-инженеров, которым тоже расскажут, как и зачем им интегрировать Gemini в свои рабочие процессы.

Помимо этого, у компании есть партнёрская инициатива Google Cloud Affiliate Employers, через которую она поможет соискателям с правильными навыками в поиске работы.

Теги:
Всего голосов 3: ↑3 и ↓0+4
Комментарии0

В 18:00 начинаем митап MLечный путь 2024 ?

Присоединяйтесь к трансляции, задавайте вопросы и общайтесь в чате с коллегами.

Смотрите трансляцию прямо в этом посте или переходите на YouTube.

Теги:
Всего голосов 8: ↑8 и ↓0+11
Комментарии0

Партнерство Selectel и Neoflex
Прокачиваем ML-разработку вместе

Теперь клиенты Selectel могут оптимизировать управление DS/ML-моделями с помощью MLOps-платформы Neoflex Dognauts. Она обеспечивает автоматизацию полного цикла разработки и эксплуатации моделей машинного обучения. 

Какие задачи решает Neoflex Dognauts?

⚙️ Подготовка данных и фичей

⚙️ Разработка моделей

⚙️ Коллективная разработка

⚙️ Применение моделей любой сложности

⚙️ Мониторинг данных и метрик моделей

Вы можете развернуть платформу как на выделенных, так и облачных серверах Selectel. 

В первом случае вам доступны индивидуальная конфигурация нод под оркестрацией платформы Neoflex NEOMSA на базе Kubernetes, изоляция в аттестованной по требованиям ФСТЭК стойке и широкий пропускной канал для связи с локальной инфраструктурой. 

Вариант с облаком делает доступным оперативное масштабирование вычислительных ресурсов с оплатой их фактического потребления за счет использования продукта Managed Kubernetes от Selectel. 

Оба сценария включают развертывание вычислительных кластеров с высокопроизводительными GPU для эффективного управления платформой.

Переходите на страницу решения, чтобы узнать все подробнее и оставить заявку.

Теги:
Всего голосов 5: ↑5 и ↓0+6
Комментарии0

16 апреля 2024 года «Яндекс» представил свой новый сервис на основе нейросетей «Нейро». Это новый способ искать ответы на вопросы. Пользователь может задать «Нейро» любой вопрос, а тот сам подберёт подходящие материалы в «Поиске», проанализирует их и соберёт найденную информацию в одном ответе, подкрепив его ссылками на источники. «Нейро» объединил опыт «Яндекса» в создании поисковых технологий и больших языковых моделей. «Нейро» доступен в приложении «Яндекс» и «Яндекс Браузере».

«Нейро» берёт факты не из памяти модели, а из источников в интернете. Это значит, что в его ответах содержится свежая и актуальная информация, даже если она появилась всего несколько часов назад. Каждый факт в ответе подкреплён ссылкой на источник. Благодаря таким ссылкам пользователи смогут углубиться в интересующую тему, а площадки — получить дополнительный трафик. Если владелец сайта не хочет, чтобы веб-страницу использовали в качестве источника ответов для нового сервиса, он может установить директиву в robots.txt.

Ранее директор бизнес-группы поиска и рекламных технологий «Яндекса» Дмитрий Масюк заявил в интервью СМИ о новинке от компании. «В ближайшее время мы представим новый продукт на стыке поиска и генеративных нейросетей, который даст пользователям совершенно новый опыт работы с информацией в интернете — это самое радикальное обновление в этой части "Яндекса"за последние 20 лет», — пообещал Масюк.

Теги:
Всего голосов 6: ↑6 и ↓0+6
Комментарии1

18 апреля проводим митап MLечный путь 2024 ?

Обсуждаем инфраструктуру для ML, сложности построения production ML-систем, LLM, оптимизацию моделей, безопасность и сокращение расходов на инференс. Выступают эксперты из Selectel, СберМаркета,, Dstack, Axenix, MIL Team, Raft.

Темы докладов

  • Актуальный опыт внедрения feature store в командах СберМаркет. Feast уже можно внедрять или ждём версию 1.0?

  • Непреодолимая легкость повышения утилизации GPU: Allocation и Profiling обычного человека.

  • Как задеплоить свой ML-проект в разных облаках, если ты Data scientist и у тебя лапки в DevOps.

  • Тренды GenAI их влияние на подходы к консалтингу B2B-компаний.

  • Быстрый и экономичный инференс LLM в прикладных задачах.

  • Инфраструктурные векторы атак на LLM: что говорит OWASP и чего в нем нет.

Смотрите подробную программу и регистрируйтесь →

Теги:
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

«Яндекс» тизерит свой новый сервис на основе нейросетей. Всё указывает на то, что в компании его представят уже 16 апреля.

Пользователи нашли на сайте ya.ru пасхалку: если нажать на логотип в левом верхнем углу, то страница схлопнется, и появится слово «Нейро».

В официальном телеграм‑канале «Яндекса» поясняется, что это будет некий «новый способ искать ответы».

Ранее директор бизнес-группы поиска и рекламных технологий «Яндекса» Дмитрий Масюк заявил в интервью СМИ о новинке от компании. «В ближайшее время мы представим новый продукт на стыке поиска и генеративных нейросетей, который даст пользователям совершенно новый опыт работы с информацией в интернете — это самое радикальное обновление в этой части «Яндекса» за последние 20 лет», — пообещал Масюк.

Теги:
Всего голосов 8: ↑4 и ↓40
Комментарии2

Вклад авторов