Обновить
681.62

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Безопасность — это не отсутствие структуры, а наличие правильной структуры: топология как новый язык науки

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров1.2K

В этой статье мы рассмотрим, как топологические методы меняют или будут менять наше понимание безопасности. Мы увидим, что безопасность не достигается через максимальную случайность, а через специфическую, строго определенную топологическую структуру — тор с максимальной энтропией. Это не просто шаг вперед — это прыжок в новую эпоху, где безопасность перестает быть верой и становится наукой.

Читать далее

MWS Vision Bench: первый русскоязычный бенчмарк для бизнес‑OCR в эпоху мультимодалок

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.5K

Мультимодальные LLM уже умеют «читать» документы — от договоров и таблиц до рукописей и диаграмм. Но измерять их качество на реальных бизнес‑сценариях негде и нечем, особенно если дело касается работы с тяжелым OCR-контентом на русском. Мы собрали MWS Vision Bench — бенчмарк из 5 практических заданий: полностраничный OCR (страница→текст), структурированный OCR (страница→markdown), grounding (координаты текста), KIE/JSON (извлечение ключей) и VQA (вопрос‑ответ). Размер: 800 изображений, 2580 вопросов (валидация - 1 302, тест - 1 278). Код и валидационный сплит открываем; приватный тест — по запросу. Повторить запуск можно менее чем за 1 час.

За подробностями

Как работает Context Engineering в Claude и других агентах

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров4.8K

Команда AI for Devs подготовила перевод статьи об инженерии контекста — новом ключевом подходе в построении AI-агентов. Если раньше все говорили о prompt engineering, то теперь на первый план выходит умение управлять ограниченным ресурсом — контекстом. Компакция, заметки, подагенты, динамическая подгрузка данных — всё это формирует новое искусство работы с LLM.

Читать далее

Соревнование по машинному обучению — предскажите следующее состояние рынка

Время на прочтение3 мин
Количество просмотров2.4K

Привет, Хабр! Недавно мы запустили Wunder RNN Challenge — соревнование по машинному обучению, где нужно предсказывать следующее состояние рынка по последовательности предыдущих состояний.

В этом посте мы расскажем, что это за состояние рынка, и в чём вообще прикол.

📅 Решения принимаются до 1 декабря
💰 Призовой фонд $13,600

Читать далее

Оптимизация источников данных для ML моделей

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров930

В этой статье хочется поделиться собственной методикой оптимизации источников данных для кредитного скоринга и представить ключевые результаты реальных замеров на российском рынке.

Читать далее

Мой промпт для ChatGPT-5 превратит конспекты лекций (в тексте ИЛИ НА ФОТО) в структурированный учебный материал

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров18K

Предлагаю на ваш суд мой промпт, который я разработала специально для ChatGPT-5. Вы можете загрузить свои конспекты или даже фото конспектов и получите материал: с логичной структурой, подзаголовками, списками, выделением ключевых понятий, вводной частью и резюме. Не выдумывает от себя, если что-то написано неразборчиво, пометит в отдельный блок. Cохраняет авторский стиль, поясняет термины, формирует обзор, основную часть, резюме и список вопросов. Результат оформляется в Markdown: удобно читать, редактировать и публиковать.

Сам промпт ниже:

Как ИИ-агенты учатся по видео на YouTube

Время на прочтение3 мин
Количество просмотров823

ИИ становится всё умнее — и вроде бы уже может справиться с самыми разными задачами в интерфейсе компьютера. Но вот парадокс: в настоящих программах даже самые продвинутые агенты до сих пор неловко кликают не туда, путают кнопки и часто просто теряются. Проблема не только в алгоритмах — не хватает настоящих, живых примеров, как действовать шаг за шагом.

Команда исследователей неожиданно нашла решение там, где его никто толком не искал: на YouTube. Вместо сложной ручной разметки они научили ИИ учиться на туториалах обычных пользователей и вычленять из роликов подробные инструкции по работе с реальными приложениями — вплоть до точек кликов и строк ввода текста. Оказалось, такого обучения хватает, чтобы агенты научились уверенно разбираться в браузерах, редакторах и медиаплеерах.

Почему именно такой способ оказался рабочим? И как это открывает новый этап в развитии ИИ для повседневных задач — без огромных затрат и костылей? Разбираемся, как машины начинают учиться «по-взрослому».

Читать далее

Ученые предложили новый метод обучения биполярных нейронных сетей с помощью дистилляции знаний

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров2.4K

Исследование, проведенное коллективом российских ученых, является шагом вперед в области нейронных сетей и их обучения. В своей работе они предложили новую структуру биполярного морфологического нейрона и метод обучения, который может повысить вычислительную эффективность нейронных сетей, так как он сокращает количество вычислительных веток с четырех до одной. Кроме того, они разработали для этой модели новый метод обучения, который позволяет достичь точности, сопоставимой с классическими моделями.

Основной целью исследования было улучшение структуры нейрона, что, в свою очередь, должно было повысить его вычислительную эффективность.

Читать далее

Как бесплатно использовать и сравнивать топовые платные ИИ-модели (на примере Seedream v4)

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров3.9K

Перед тем, как платить за доступ к моделям (особенно дорогим), полезно «пощупать» их на своих задачах. В этой статье я продемонстрировала рабочий способ бесплатно сравнить топовые модели ИИ на примере платной Seedream v4 (ByteDance) и Nano Banana (Google) через сайт Yupp.ai. Эта платформа показывает два ответа разных моделей, вы выбираете лучший, оставляете короткий фидбек и зарабатываете кредиты, которыми «оплачиваете» последующие прогоны. Затем вы уже сами выбираете, какие именно модели (даже платные) хотите тестировать

Читать далее

Как нейросети помогают при создании кино и сериалов, и почему без человека всё ещё никак

Время на прочтение6 мин
Количество просмотров2.7K

Привет, Хабр! Меня зовут Артём Орлов, я директор по инновациям в Wink. В этой статье расскажу, как нейросети влияют на создание контента на всех его стадиях — от проработки идеи и планирования производства до кастинга и постпродакшена.

Под катом:

— интуиция человека VS анализ больших данных ИИ;
 — чувство вкуса VS огромная насмотренность;
 — нерациональные факторы VS шаблонный анализ;
 — спасение сцен на постпродакшене;
 — примеры сервисов, которые помогают киношникам;
 — и другое.

Давайте по порядку.

Читать далее

От нестационарности к прогнозу: пайплайн анализа и моделирования временных рядов

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.6K

Привет, Хабр! Я Михаил Зуев — Data Scientist из команды затрат корпоративных
клиентов Сбера. Мы много предсказываем, классифицируем и прогнозируем.
Впервые столкнувшись с последним и проведя исследование по этой теме, я
столкнулся с большим количеством неструктурированной информации. Эта статья —
одновременно описание моего пути и небольшое упорядоченное наставление по
анализу и прогнозированию временных рядов, которое я сам хотел бы получить.

Читать далее

Топ-10 лучших бесплатных нейросетей, которые сильно упростят вашу жизнь

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров30K

2025 год. Нейросети уже не просто часть технологий, а часть повседневности. Они рядом с нами в работе, учебе, творчестве, даже в быту. Помогают написать письмо, подобрать музыку, отредактировать фото или придумать идею для проекта. Иногда кажется, что единственное, чего им не хватает, это способности приготовить завтрак. Хотя, если честно, и это, похоже, лишь вопрос пары десятков апдейтов.

Всего пару лет назад мы с интересом наблюдали, как алгоритмы с трудом оживляют фотографии. Тогда всё это выглядело забавно и очень неуклюже. А теперь ИИ рисует картины, пишет сценарии и создаёт видео, которые сложно отличить от реальных. В какой-то момент мы даже перестали удивляться.

Но вместе с возможностями пришла и новая проблема. Их стало слишком много. Каждый день появляются десятки новых сервисов, которые обещают упростить жизнь и сделать всё за вас.

Чтобы сэкономить вам время, мы собрали подборку из десяти нейросетей, которые подойдут на все случаи жизни. Они просты, удобны и работают без привязки карты.

Приятного чтения!

Читать далее

Как LLM помогают ученым

Время на прочтение7 мин
Количество просмотров1.6K

Всем привет! Меня зовут Николай Никитин, я руковожу лабораторией автоматического машинного обучения в Институте ИИ ИТМО. Сегодня я бы хотел сделать небольшой экскурс в то, как методы и модели ИИ позволяют автоматизировать решение прикладных задачам в разных областях науки.

Нейросети уже достигли впечатляющих результатов ― вспомним хотя бы Нобелевскую премию по химии прошлого года, выданную за методы фолдинга белков, проработанные с участием AlphaFold. И различные полезные для ученых решения, появляются каждый день во многих областях.

Под катом ― о том, как AI4Science выглядит сегодня, почему всю науку нельзя отдать на откуп LLM и в какой форме они наиболее полезны.

Читать далее

Ближайшие события

Как я автоматизировал анализ логов из Kibana с помощью LLM и AI-агентов

Время на прочтение5 мин
Количество просмотров4.3K

Инструменты вроде OpenSearch, Elastic или Kibana давно стали стандартом для поиска и визуализации логов благодаря удобству и мощной поисковой системе. Однако, когда речь заходит о сложном анализе — агрегациях, парсинге, выявлении сложных закономерностей — их встроенные средства быстро достигают предела возможностей. Особенно сложно становится, если структура логов далека от идеала: например, как у нас — всё содержимое свалено в одно поле Message в формате JSON.

Меня зовут Игорь Щегловитов, я работаю экспертом по тестированию в QC облачной инфраструктуры и веб-порталов. Раньше наша команда решала такие задачи кастомными утилитами на C#, которые выгружали логи из ELK и анализировали их локально. Однако каждое новое требование превращалось в мини-проект: доработать код, написать новые парсеры, скрипты агрегации и фильтрации. Работа замедлялась, техдолг рос.

Я решил использовать связку AI-агентов с кастомными промптами, собственный сервисный слой (MCP) для доступа к логам и LLM-модель, чтобы превращать пользовательские запросы в автоматический алгоритм анализа. Так, кейсы вроде «Посчитай уникальных пользователей за сутки» или «Проанализируй ошибки за период» решаются без ручного кодинга.

Под катом мой кейс: расскажу, как это сделал, поделюсь ссылкой на гитхаб, так что, если хотите упростить себе анализ логов, — эта статья для вас.

Читать далее

Как мы обеспечили +33% к точности на сложных SQL-запросах

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров1.8K

Традиционные подходы к генерации SQL-запросов часто полагаются на инструктированные языковые модели, но они могут быть неэффективными и неточными. Мы рассмотрим новый подход, основанный на использовании Reinforcement Learning для дообучения моделей, который может улучшить точность и эффективность генерации SQL.

Читать далее

7 смертных грехов ML-ценообразования

Время на прочтение19 мин
Количество просмотров1.4K

Оптимизацию цен часто упрощают: учимся прогнозировать спрос, зная его при заданных ценах — оптимизируем цены, фиксируем прибыль.

И, казалось бы, данные о продажах в прошлом найти нетрудно, готовых фреймворков с алгоритмами оптимизации — десятки, осталось только немного «поиграть в kaggle», обучив хорошую модель для предсказания спроса и всё готово!

Но на практике всё намного сложнее. Почему модель, идеально прогнозирующая спрос, может предлагать цены, разоряющие бизнес? Может ли максимизация прибыли привести к потере покупателей в долгосрочной перспективе? Почему оптимизатор может считать, что яблоки должны продаваться по цене iPhone? В этой статье разберём эти и прочие «смертные грехи» ценообразования с помощью ML.

Читать далее

ИИ в трейдинге

Время на прочтение6 мин
Количество просмотров7.3K

В статье рассказывается о вариантах  применения ИИ  для создания торговых систем.

В практической части на примере платформы AmiBroker демонстрируется, как с помощью ИИ (модели DeepSeek) можно написать код простой momentum стратегии для фьючерса на акции Сбербанка. Приводятся результаты бэктестирования стратегии.

Читать далее

Вредные советы: как угробить своего AI-агента

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров1.2K

Ваш AI-агент ведет себя как капризный стажер и доказывает, что 2+2=5? Или вы уже третью неделю пытаетесь дообучить модель, а она делает вид, что не понимает, чего вы от нее хотите? Кажется, пора признать: классические подходы не работают.

Пока одни AI-инженеры кропотливо готовят данные и тестируют их, другие непослушные инженеры открыли простую истину. Они всё делают наоборот: не тестируют агентов, кормят модель мусором и открывают ей полный доступ к конфиденциальным данным. И знаете что? У них получаются самые незабываемые агенты!

Мы в команде Cloud.ru подумали: зачем бороться с этой гениальной стратегией? Гораздо эффективнее ее систематизировать: таким инженерам нужно давать не полезные, а вредные советы. Они все сделают наоборот, и получится как раз правильно. В статье собрали вредные советы для идеального саботажа. Читайте и внедряйте.

Читать советы

130+ датасетов для машинного обучения: гид, который сэкономит часы поиска нужных данных

Время на прочтение27 мин
Количество просмотров7.9K

Сколько раз вы начинали новый ML-проект и первым делом отправлялись на поиски подходящих данных? Процесс этот знаком каждому: есть задача, выбрана архитектура модели, но без качественного датасета дальше не продвинуться. Тут и начинается квест по бесконечному поиску «того самого» набора по репозиториям, форумам и каталогам. 

Хороших датасетов множество, но найти среди тысяч вариантов нужный — отдельная история. Чтобы облегчить вам эту задачу, мы сделали подборку датасетов, которые активно используются ML-инженерами: от классических наборов данных, известных каждому, до новичков в информационном поле.

Читать далее

Новые вирусы против супербактерий: как ИИ меняет правила игры

Время на прочтение5 мин
Количество просмотров1.2K

Супербактерии — микроорганизмы, не реагирущие на антибиотики. Что это значит? Болезни, которые раньше лечились за несколько дней, теперь становятся опаснее. Каждый год от таких инфекций умирают миллионы людей, и к 2050 году число жертв может вырасти до десяти млн в год. Проблема в том, что новые лекарства создаются медленно и стоят все дороже, а бактерии мутируют быстрее, чем фармацевтика успевает на них реагировать.

В этой ситуации на помощь приходят бактериофаги, или фаги, — вирусы, которые естественным образом уничтожают «суперов», не затрагивая клетки человека. А еще в этом помогают технологии. Так, ИИ позволил создать совершенно новые варианты вирусов, которые могут преодолевать даже искусственно выведенную устойчивость. Сегодня предлагаю разобрать, как работает этот механизм и какие вызовы стоят перед методами, сочетающими биологию с машинным обучением.

Читать далее

Вклад авторов