Как стать автором
Обновить
651.2

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Выжимаем из ChatGPT максимум: советы по правильном выбору модели

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.3K

Привет! С вами Андрей с канала “сбежавшая нейросеть”, на котором я рассказываю про ИИ с творческой стороны. В работе я использую модели разных компаний, среди которых, конечно, есть и ChatGPT с подпиской Plus. Это один из лучших ИИ на рынке, у которого есть одна большая проблема — доступных моделей настолько много, что в замешательстве оказывается даже опытный пользователь. Ниже расскажу, к какой модели и в каких случаях я прибегаю.

Читать далее

Новости

Как мы программировали робота-краба для ЦИПР2025: AI, который выделяет нас на фоне пультов

Время на прочтение3 мин
Количество просмотров481

Привет, Хабр! Мы - команда NIKTA.AI, и на конференции ЦИПР2025 мы решили не просто участвовать, а задать жару с нашим роботом-крабом, управляемым через Visual Language Model (VLM). Пока другие команды щелкали пультами, наш краб самостоятельно принимал решения, осматривал стенд и искал объекты. Как мы это сделали за полтора месяца? Рассказываем!

Читать далее

OpenAI Assistants API: подводные камни продакшена

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров325

OpenAI активно продвигает свой Assistants API как новую основу для создания кастомных AI-агентов. Многие пробуют внедрять его в поддержку клиентов, devtools, работу с документацией. Однако за видимой простотой скрываются нюансы, которые могут привести к неожиданным проблемам в продакшене.

Если не учитывать эти нюансы, вместо эффективного инструмента мы получаем искаженные метрики производительности, неконтролируемые расходы и риск «сгореть» под нагрузкой.

Такая ситуация возникает не только в теории, это реальность, когда вы пытаетесь использовать новый, более абстрактный уровень API для задач, где важен полный контроль над каждым шагом. Проблемы появляются и там, где ваши ожидания от мгновенного ответа модели сталкиваются с многошаговой логикой работы агента.

В таких системах необходим другой подход к внедрению. В этой статье разберемся, чем Assistants API отличается от классического Chat Completions API, какие у него ограничения и когда его стоит использовать, а когда лучше держаться подальше.

Читать далее

Прогнозирование исходов футбольных матчей в реальном времени с помощью байесовской модели

Уровень сложностиСложный
Время на прочтение26 мин
Количество просмотров944

Ставки в реальном времени очень популярны, и поэтому прогнозирование в реальном времени заслуживает особого внимания. Однако среди огромного количества литературы по прогнозированию футбольных матчей лишь немногие статьи сосредоточены на прогнозировании в реальном времени. Разбираем сложную модель калибровки динамической силы команд, основанную на байесовском методе, которая позволяет использовать информацию о текущем матче для калибровки оценок силы каждой команды.

Читать далее

Как устроено глубокое обучение нейросетей

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров1K

Глубокое обучение - Способ обучения моделей на большом количестве данных, используя множество слоёв. Каждый слой сети обрабатывает информацию, "взвешивая" её при помощи параметров (весов и смещений), оставляя признаки или отбрасывая, посредством функций активации. Обучение происходит через итеративную (повторяющуюся) корректировку весов: сначала вычисляются градиенты ошибки с помощью обратного распространения (backpropagation), а затем веса обновляются при помощи оптимизаторов (SGD, Adam и др.).

Эта статья не ответит на все вопросы, но мы пробежимся по всем основам глубокого машинного обучения, что бы создать примерную начальную картину без сильного углубления в детали.

Читать далее

Миф о репрезентациях

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров562

В конце сегодняшнего обзора не будет таблиц с бенчмарками и описанием, что такая-то новая модель обошла в каких-то задачах какие-то старые модели и даже сам GPT. В этот раз авторы рассматривают вопрос почти философский, а в самой статье цитируют Платона и Толстого. Речь о прошлогодней статье The Platonic Representation Hypothesis от исследователей из MIT. Гипотеза заключается в следующем:  нейронные сети разных архитектур, обученные на разных данных и для разных целей, сходятся. Причем сходятся к статистической модели реальности. 

Звучит круто. Получается, что все модели, большие и маленькие, языковые, графические и мультимодальные, не просто показывают свою часть одной и той же модели реальности, но еще и в перспективе приведут к вообще одному отображению. Будет ли это AGI, будет ли та модель мира, о которой говорит Лекун — в явном виде авторы эти вопросы не упоминают, но вывод напрашивается сам. 

Читать далее

Глубокое обучение в науке вредно без глубокой проверки фактов

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров3K

Глубокое обучение гламурно и ажиотажно. Если обучить трансформер (современную языковую модель) на датасете из 22 миллионов ферментов, а затем использовать его для прогнозирования функции 450 неизвестных ферментов, то можно опубликовать свои результаты Nature Communications (уважаемом научном издании). Вашу статью прочитают 22 тысяч раз и она будет в верхних 5% из всех результатов исследований по оценке Altmetric (рейтингу внимания к онлайн-статьям).

Однако если вы проделаете кропотливую работу по анализу чужой опубликованной работы и обнаружите, что она полна серьёзных ошибок, в том числе сотнями некорректных прогнозов, то можете опубликовать на bioRxiv препринт, который не получит и доли цитат и просмотров исходного исследования. На самом деле, именно это и произошло в случае двух статей:

Functional annotation of enzyme-encoding genes using deep learning with transformer layers | Nature Communications

Limitations of Current Machine-Learning Models in Predicting Enzymatic Functions for Uncharacterized Proteins | bioRxiv

Эта пара статей о функциях ферментов стала прекрасным примером для изучения границ применения ИИ в биологии и неправильно расставленных акцентов в современной публикации результатов. В этом посте я расскажу о некоторых подробностях, однако призываю вас изучить статьи самостоятельно. Этот контраст станет ярким напоминанием о том, как сложно бывает оценить правдивость результатов ИИ без глубокого знания предметной области.

Читать далее

ChatGPT предложил научные идеи «на грани»: от лечение старения до континуума когнитивности

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров9K

Привет! С вами Андрей с телеграм-канала «сбежавшая нейросеть», на котором я рассказываю о нейросетях с творческой стороны. Недавно наткнулся на очень интересный промпт, который решил опробовать на одной из самых мощных моделей на сегодня — ChatGPT o3. Ответ модели смотрите ниже.

Читать далее

Обыгрываем казино, с блэкджеком и стратегиями

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров3.2K

В данной статье рассмотрим работу с библиотекой gymnasium для изучения машинного обучения с подкреплением. Реализуем агента, который использует метод машинного обучения q-learning для максимизации выигрыша в карточной игре blackjack. Сравним средний выигрыш за 100000 игр при различных реализациях игры blackjack.

Читать далее

Нейро-дайджест: ключевые события мира AI за 1-ю неделю июня 2025

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров1.2K

Привет! 👋 Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта.

Меня зовут Вандер, и каждую неделю я делаю обзор новостей о нейросетях и ИИ.

Неделя выдалась интересной: обновления от ElevenLabs, Gemini и Suno, Sora встроили в Bing, вайб-кодинг гонка Cursor и Codex, Юра Борисов в фильме про OpenAI, а Илон надеется отправить людей на Марс до 2030.

Всё самое важное — в одном месте. Поехали!

Читать прошлый выпуск

Читать далее

Нейросети для создания видео: подборка самых топовых ИИ-генераторов видео

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров4.5K

Привет, друзья! За год нейросети для создания видео настолько усовершенствовались, что теперь можно генерировать видео сразу со звуком и разговорами. В этой подборке нейросетей для генерации видео я собрал наиболее популярные и функциональные генераторы видео. Для удобства я пронумеровал их.

Некоторые из них более мощные, некоторые более удобные, а некоторые - просто проще в использовании. Я также приведу реальные примеры, расскажу, как получить к ним доступ, и выскажу свои мысли после тестирования каждой из них.

Читать далее

Топ-7 нейросетей для генерации видео: лучшие AI-сервисы 2025 года

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров6.5K

Признайтесь: сколько раз вы хотели сделать видео — для презентации или поста — но вместо вдохновения получали лишь папку с шаблонами и вкладки «Как сделать анимацию за 5 минут»? Идея была, энергия — тоже. Но где-то между рендерами и туториалами всё растерялось.

А ведь хотелось иначе. Представил сцену — и она уже движется. Когда-то это была фантазия уставшего дизайнера. Теперь — реальность, в которую вмешалась нейросеть.

Сегодня мы протестируем 7 сервисов для генерации видео. Но вместо скучного списка с сухими характеристиками — сделаем это иначе.

Уже обратили внимание на обложку? Да, это докторская колбаса и селёдка под шубой — но буквально. Покажем, как нейросети видят названия блюд — не метафорично, а визуально.

Что получится, если макароны по-флотски встанут по команде «смирно»? А Цезарь лично выберет — курицу или креветки?

Будет необычно. Будет живо. И, возможно, немного аппетитно.

Приятного чтения!

Читать далее

Хочешь своего AI-бота? Пошаговый план для новичков и не только

Время на прочтение6 мин
Количество просмотров3.4K

AI-чатботы стремительно трансформируют способы взаимодействия бизнеса и пользователей с технологиями. Эти интеллектуальные виртуальные ассистенты способны обрабатывать клиентские обращения, давать рекомендации и даже автоматизировать сложные бизнес-процессы.

В результате, около 65% организаций заявляют об использовании генеративного ИИ как минимум в одной бизнес-функции на регулярной основе — почти в два раза больше, чем десять месяцев назад.

Читать далее

Ближайшие события

HeyGen представила AI Studio. Как получить доступ и пользоваться HeyGen, чтобы сгенерировать аватара

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров847

Тренд на видео с ИИ-аватарами не сбавляет оборотов. Если в последнее время вы проводили много времени, прокручивая ролики TikTok или Instagram, то наверняка сталкивались с этими ИИ-видео с говорящими персонажами Это и обезьяна, ведущая влог, и день из жизни Джорджа Вашингтона, и многие другие.

Они привлекают внимание, и очевидно, что спрос на такой контент растет.

HeyGen - одна из платформ, которая сделала этот процесс проще и доступнее. Теперь они сделали еще один шаг вперед, представив HeyGen AI Studio.

В этой статье я расскажу вам о том, как работает HeyGen AI Studio, и покажу, какого качества видео вы можете сгенерировать.

Давайте начнем.

Читать далее

Как устроены LLM-агенты: архитектура, планирование и инструменты

Время на прочтение14 мин
Количество просмотров3.6K

Всем привет! С вами Кирилл Филипенко, сисадмин из Selectel, и сегодня мы погрузимся в тему LLM-агентов. Сейчас об этих самых «агентах» кричат буквально из каждого утюга, поэтому пришло время наконец-то разобраться, что это такое, как они работают и с чем их, собственно, едят. Прыгайте под кат, будет интересно!
Читать дальше →

Валерий Бабушкин & MLinside, часть 1 | Автократия. System Design. Lego & Sport. Срезание углов

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров743

На днях посмотрел подкаст с Валерием Бабушкиным. Как всегда, было очень приятно слушать, и я хочу поделиться с вами основными тезисами, которые я для себя вынес.

Узнаем как быстро вникнуть в ML System Design, чем лего и спорт помогают, и почему важно уметь срезать углы на работе!

Порассуждать вместе с Валерой Бабушкиным

ИИ-агенты для автоматизации бизнеса: задачи, примеры и внедрение

Время на прочтение4 мин
Количество просмотров1.5K

Бизнес сегодня работает в условиях информационного перенасыщения, когда скорость обработки данных и принятия решений становится ключевым фактором успеха. Ежедневно компании сталкиваются с задачами: как сократить время на обработку запросов клиентов, как оперативно анализировать большие массивы информации, как снизить нагрузку на сотрудников и повысить качество сервиса?

Ответ на эти вопросы всё чаще звучит в двух буквах – ИИ. Искусственный интеллект, в частности ИИ-агенты, предлагает новый уровень автоматизации бизнес-процессов. 

Читать далее

Вычисление функции потерь и градиентов в AI переводчике

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров603

Привет, Хабр!

Меня зовут Алексей Рудак, я основатель компании Lingvanex, которая разрабатывает решения в области машинного перевода и транскрипции речи. Продолжаю цикл статей о том, как устроен переводчик на нейронных сетях изнутри. И сейчас хочу рассказать про работу функции потерь. Для тренировки модели используется opensource фреймворк OpenNMT-tf.

Статья предоставляет всесторонний обзор вычисления функции потерь в машинном обучении, особенно в контексте моделей последовательностей. Она начинается с подробного описания того, как матрица логитов, генерируемая после преобразований в декодере, обрабатывается через функцию cross_entropy_sequence_loss. Эта функция играет ключевую роль в измерении расхождения между предсказанными выводами и фактическими метками. В статье описаны шаги, включая преобразование логитов в подходящий формат, применение сглаживания меток для создания сглаженных меток и вычисление кросс-энтропийных потерь с использованием softmax. Каждый этап подробно объясняется, чтобы было понятно, как каждый компонент вносит вклад в общую оценку потерь.

Кроме вычисления потерь, статья рассматривает механизм выравнивания, используемый для улучшения работы модели. Описано, как значение потерь корректируется на основе направляемого выравнивания, что позволяет модели лучше учитывать взаимосвязи между исходными и целевыми последовательностями. Также подробно рассматривается процесс вычисления и применения градиентов, иллюстрируя, как оптимизатор обновляет веса модели для минимизации потерь.

Читать далее

Никто не читает старые статьи… базу, так сказать, основу…

Время на прочтение7 мин
Количество просмотров3.7K

Много авторов так или иначе рассказывают о статьях в ML-сообществе, но большинство из них популярны, потому что являются хорошими опытными специалистами, а значит в своё время прошли все базовые статьи и могут себе позволить рассказывать только о новинках в сообществе. Что же делать молодым специалистам, которые действительно хотят разобраться, но ещё не читали ту самую базу?.. так сказать, основу...

Для себя и, надеюсь, кого-то ещё, я предлагаю эти три разбора, на мой взгляд, основополагающих статей мира ML. Приятного прочтения.

Читать далее

От месяцев к минутам. Как мы применяем машинное обучение для поиска перспективных литий-ионных проводников

Уровень сложностиСредний
Время на прочтение14 мин
Количество просмотров965

Привет, я Артем Дембицкий, аспирант программы «Науки о материалах» и стажёр‑исследователь Центра энергетических технологий Сколтеха, а также младший научный сотрудник команды «Дизайн новых материалов» Института AIRI. Мы с коллегами используем модели машинного обучения для разработки новых материалов с улучшенными свойствами.

Недавно статья с результатами нашего исследования вышла в npj Computational materials — журнале из семейства Nature. Совместными усилиями Сколтеха и AIRI мы оценили применимость машинного обучения для ускоренного поиска литий‑ионных проводников, а также показали практический пример использования универсальных межатомных потенциалов для подбора защитных покрытий катодов твердотельных аккумуляторов.

В этой статье хотелось поделиться подробностями нашей работы, а также в целом рассказать об этих материалах и о том, как их ищут.

Читать далее
1
23 ...

Работа

Data Scientist
45 вакансий