Обновить
717.75

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Невизуальная доступность: опыт незрячего в использовании компьютерного зрения и LLM для взлома цифровых барьеров

Время на прочтение12 мин
Количество просмотров538

С развитием LLM моделей AI начали появляться разные ИИ агенты, автоматизирующие задачи.

Но есть задачи, типа рутинного создания папок в облаке или удаления файлов, которые хорошо бы автоматизировать, но ручками сделать можно.

А есть задачи, где без дополнительной технической помощи никак. Сейчас я говорю например о тех, которые в связи с инвалидностью просто физически не могут осуществлять элементарные для большинства операции.

Сегодня я вспомнил об этом посте моего незрячего знакомого Дениса Шишкина. Суть поста в том, что сегодня нейронные сети так популярны, а вещами, которые как ожидается могут быть простыми, но очень полезными для незрячих, никто не занимается.

Пять минут разработки показали, что даже без AI возможно сделать достаточно много. Я решил попробовать сделать больше и написать эту статью, дабы осветить тему и поделиться своими наработками и размышлениями.

Читать далее

Обзоры препринтов научных статей «astro-ph/arxiv.org» за июнь 2025 года

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров1K

Выпуск 445

Обзор arxiv:2506.20436 Нуклеосинтез и химическое обогащение галактик (Nucleosynthesis and the chemical enrichment of galaxies)Authors: Chiaki KobayashiComments: 34 pages, 29 figures/videos. This is a pre-print of a book chapter for the Encyclopedia of Astrophysics (edited by I. Mandel, section editor F.R.N. Schneider) to be published by Elsevier as a Reference Module 

Большой обзор по химической эволюции галактик. Рассмотрен вклад разных механизмов обогащения межзвездной среды тяжелыми элементами (сверхновые разных типов, проэволюционировавшие звезды, слияния нейтронных звезд и т. д.). Разве что нет свежей идеи о синтезе элементов при вспышках магнитаров. 

Много полезных рисунков. Очень хорошо для использования в разных лекциях.

Читать далее

Grok 4 Fast — новая модель от xAI

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров3.4K

Команда AI for Devs подготовила перевод анонса Grok 4 Fast — новой модели xAI, которая сочетает быстрые ответы и глубокие рассуждения, снижает стоимость токенов на 98 % и впервые становится доступной всем пользователям без ограничений.

Читать далее

Как научить ИИ мыслить по-человечески: разбор WebResearcher и его революционной стратегии

Время на прочтение4 мин
Количество просмотров2K

Зачем ИИ нужен блокнот, а не бесконечная свалка знаний? Большинство современных исследовательских агентов просто складывают всё, что нашли, в одно огромное окно памяти, пока оно не превращается в шумный архив, где сложно что-то найти. Но авторы WebResearcher решила пойти другим путём — её ИИ не тащит за собой весь багаж знаний, а регулярно останавливается, выписывает главное на черновик и начинает следующий раунд с чистой страницей. Получается своего рода интеллектуальная прокачка: агент учится рассуждать шаг за шагом, не захлёбываясь лишней информацией, а данные для таких «марафонов» ему готовит целая фабрика сложных задач. Новая стратегия уже показала себя на бенчмарках — и местами обошла крупные коммерческие решения. Как всё это устроено, почему помогает мыслить по-человечески и что будет дальше — разбираемся в деталях.

Читать далее

Как запустить свою LLM для инференса. Руководство по запуску: Ollama, vLLM, Triton, LM Studio, llama.cpp, SGLang

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров18K

В этой статье будет приведено практическое руководство по базовой настройке и запуску следующих инструментов для работы с LLM: Ollama, LM Studio, vLLM, Triton, llama.cpp, SGLang.

🔥 Начинаем? 🔥

xAI представляет Grok 4 Fast: новая эра доступного ИИ с огромным контекстом

Время на прочтение4 мин
Количество просмотров6.5K

xAI меняет правила: Grok 4 Fast – сверхбыстрый ИИ с 2 млн токенов контекста бесплатно! Что если модель, равная Gemini 2.5 Pro, но в 25 раз дешевле, уже здесь? Узнайте, как она ускоряет поиск, кодирование и анализ, не жертвуя качеством — но с секретами, которые стоит раскрыть.

Читать далее

Нет, тренировка DeepSeek R1 не стоила $294 тыс. Реальная цифра в десятки раз выше

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров2.1K

В интернете широко обсуждают опубликованный в Nature отчет авторов DeepSeek, в котором якобы заявляется, что обучение модели R1 обошлось компании всего в 294 тысячи долларов. Цифра выглядит сенсационной, ведь конкуренты тратят на создание своих моделей в тысячи раз большие суммы: например, для Claude Sonnet 3.7 давали оценку в несколько десятков миллионов долларов. Если бы взятая из Nature цифра была правдой, то получилось бы так, что у конкурентов нет никаких шансов перед командой DeepSeek. Но это не так.

Читать далее

Расширяем базовый функционал n8n: от RAG до кастомного агента с MCP

Уровень сложностиСредний
Время на прочтение15 мин
Количество просмотров10K

Компании и энтузиасты стремятся автоматизировать процессы, но не каждый готов писать код с нуля. Поэтому в последние годы особую популярность набрала no-code платформа n8n. С её помощью можно быстро собирать пайплайны различной сложности: от простых чат-ботов до умных ассистентов, которые управляют календарем и напоминают о задачах.  Обычно в статьях про n8n затрагивают только готовые блоки, собирают из них пайплайны автоматизации, но в то же время упоминают об ограниченности использования этой платформы. Действительно, базовых блоков в n8n может не хватать, чтобы закрыть все потребности пользователя, но сегодня я покажу, как можно обойти эти ограничения и расширить базовый функционал n8n.

Привет, Хабр! Меня зовут Музафаров Данил, я Data Scientist в компании Raft. В этом туториале я шаг за шагом покажу: как локально развернуть n8n, как добавить кастомные API и создать полноценного AI-агента с MCP tools с расширенным функционалом. Придется немного писать код, но главное, что это позволит оставить архитектуру решения на n8n, дополнив его кастомными тулами.

Читать далее

Как DS-инженеры совершенствуют автогенерацию описаний и пополняют индекс объявлений Авито

Время на прочтение6 мин
Количество просмотров8.2K

Привет! Я Сергей Кляхандлер, техлид в команде LLM Авито. В 2024 году мы разработали и выпустили ML-модель, которая автоматически генерирует описания для объявлений из категории «Одежда, обувь, аксессуары». В этом году автогенерацию усовершенствовали, а подход переиспользовали — подробнее о том, как мы это сделали, расскажу в статье. Материал будет полезен DS-инженерам, которые работают с мультимодальными LLM-моделями.

Читать далее

Как научить ИИ-агентов работать с инструментами без ручной разметки

Время на прочтение4 мин
Количество просмотров1.1K

Как сделать так, чтобы ИИ-агент уверенно бронировал рейсы, проверял балансы, собирал ответы из нескольких сервисов — и не упирался в кучу искусственных ограничений? Команда исследователей решила взглянуть на этот вопрос иначе: если мир реальных инструментов слишком хаотичен, почему бы не построить для агента полноценную тренировочную среду — с тысячами функций и строгим контролем каждого шага? Оказалось, что такой виртуальный полигон способен научить модели не только формально вызывать API, но и действовать так, будто она действительно понимает происходящее. Что придумали авторы — в подробностях этой статьи.

Читать далее

Селективная генерализация: улучшение возможностей при сохранении alignment

Время на прочтение16 мин
Количество просмотров248

TL;DR: Мы провели бенчмаркинг семи методов, направленных на предотвращение эмерджентного рассогласования и других форм некорректного обобщения с использованием ограниченного объёма alignment-данных. Мы демонстрируем устойчивый трейдофф между способностями модели и согласованием, подчеркивая необходимость более эффективных методов для снижения этого конфликта. Простое включение alignment-данных в микс обучающих данных оказывается недостаточным для предотвращения рассогласования, однако простое наложение KL Divergence penalty на alignment-данные показывает лучшие результаты, чем более сложные подходы.

Читать далее

Как одеть гидру в броню или взлом смарт-контрактов на DeFi-хаке

Уровень сложностиСредний
Время на прочтение16 мин
Количество просмотров438

Философия, мысли и спойлеры

Добрый день, уважаемые хабровчане ;-). Мы продолжаем серию публикаций о нашем участии в «разношерстных» хакатонах, проводящихся под эгидой коммерческих, государственных и иных организаций самого необычного формата, направленности, специфики, толка и рассуждений.

В общем, мы стараемся на зацикливаться на конкретно одной тематике и/или специфике, и постоянно пробуем себя, в различных направлениях. Да, не скрою, порой мы ввязываемся в, откровенно, рискованные истории, там, где совсем не имеем опыта и/или имеем крайне отдаленное представление о том, что от нас требуется;)). Плохо это или хорошо, тут можно мыслить двояко, однако, у нас получается, учитывая, что из 10 хакатонов, которые мы провели 8 оказались, для нас успешными (или почти) и мы весьма преуспели на этом поприще соревновательного Data Science.

При этом, выходя на хак, мы для себя уже составили небольшой роадмап, что нам, в целом, интересно, помимо решения предложенного кейса и на что мы акцентируем внимание в первую очередь:

Примерно, с такими же настроениями, мы пришли и на этот (DeFi-2025, Сбер) очередной хак, посвященный разработке блокчейн‑решений и анализу уязвимостей смарт‑контрактов и web-3.

Забегая вперед скажу, что нам не хватило, каких‑то 0.06% для того, чтобы войти в топ-8 номинируемых команд. В общем, мы получили по сумме баллов за наше решение 13.44, тогда как у лидера было порядка 16. Отрыв небольшой, учитывая сложность задачи и ее первоначальное очень жесткое условие: одним из проходных критериев было создать уникальное решение, до этого нигде не фигурирующее в цифровом поле до 2025 года текущего месяца. С таким мы столкнулись впервые и были немного удивлены. Да. хакатон и подразумевает нечто подобное, но все же надо было понять, что вместе с нами было еще 28 команд, и они тоже умеют гуглить ;-). Наша команда называлась BlockTeam.

И мы предоставили такое решение и детально его показали организаторам. Интересно, тогда приглашаю всех неравнодушных лиц под кат. Хардкор, и только хардкор!!!

Читать далее

Автоматизированное машинное обучение с помощью нашего Open Source фреймворка: задача о Титанике

Время на прочтение9 мин
Количество просмотров1.6K

Привет! Меня зовут Владимир Суворов, я Senior Data Scientist в Страховом Доме ВСК и core-разработчик нашей библиотеки машинного обучения OutBoxML.

В статье сегодня мы поговорим не о выборе алгоритмов, а о том, как автоматизировать весь процесс ML — от данных до деплоя и мониторинга, сократив время на подготовку с дней до часов. Мы разберем это на примере классической задачи с Titanic, реализованной на нашем фреймворке.

Приятного прочтения!

Читать и обсуждать

Ближайшие события

Ваш ИИ-ассистент — это новое поколение компиляторов

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров5.5K

Команда AI for Devs подготовила перевод статьи о том, как ИИ меняет саму суть программирования. Автор сравнивает LLM с компиляторами и утверждает, что роль разработчиков постепенно смещается от написания кода к управлению архитектурой и обучению ИИ. Как думаете, это угроза или эволюция профессии?

Читать далее

Внутреннее устройство чат-бота

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров2K

Всем привет! Меня зовут Кажекин Денис, я DS в лаборатории машинного обучения Альфа-Банка. В этой статье расскажу о том, как устроен наш чат-бот поддержки и какие модели участвуют в обработке пользовательских запросов.

Читать далее

Нейронные сети, вдохновленные природой: новая архитектура экситон-поляритонных решеток эффективнее распознает образы

Уровень сложностиСложный
Время на прочтение7 мин
Количество просмотров2.7K

Ученые из Московского физико-технического института (МФТИ) сделали важный шаг в развитии нейроморфных систем, создав новую архитектуру нейронной сети на основе экситон-поляритонных конденсатов. Эта инновационная система показала впечатляющие результаты, превзойдя уже существующие поляритонные нейроморфные технологии. Результаты их работы опубликованы в журнале Light: Science & Applications.

Экситон-поляритоны — квазичастицы, представляющие собой «жидкий свет», открывают новые перспективы для создания эффективных нейроморфных систем. Они возникают в результате взаимодействия фотонов и экситонов, сочетая в себе свойства света и вещества. Их уникальные характеристики позволяют создавать высокоскоростные нейроморфные системы, способные обрабатывать информацию с невероятной эффективностью. Впервые термин «поляритонный нейрон» был введен в исследовании группы А. В. Кавокина (МФТИ), посвященном плоским волноводным структурам, которые передают когерентность поляритонов на большие расстояния (2008 год). Они стали основой для разработки бинарных логических вентилей на полупроводниковых микрорезонаторах, что, в свою очередь, открыло путь к нейроморфным вычислениям.

Читать далее

Контекст, параллельное обучение и материалы по другим темам для начинающих работать над ИИ-агентами

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров1.1K

23 сентября эксперты MWS Cloud расскажут, как самостоятельно создавать ИИ-агентов — с помощью кода или без. Мы поделимся, как доработали Langflow под реальные задачи. Встреча онлайн, регистрация — по ссылке

Сегодня же мы собрали несколько полезных материалов для желающих разобраться самостоятельно в устройстве работы ИИ-агентов (или написать собственную интеллектуальную систему).

Читать далее

Учим ai-агента ориентироваться на местности: кастомный tool на python и overpass (OSM)

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров1.5K

Привет, Хабр!

Современные AI-агенты уже умеют планировать отпуск, писать код, и совершать покупки в интернете, но поставьте их перед простым вопросом «где лучше снять квартиру рядом с метро и школой» - и они начинают галлюцинировать. Они не понимают, что «5 минут до метро» и «500 метров по прямой через реку» - совершенно разные вещи. В результате пользователь получает красивые, но бесполезные советы

Этот проект покажет, как добавить агенту «глаза» для карты, чтобы он мог реально находить ближайшие кафе около парков, считать расстояние пеших прогулок и показывать результаты прямо на интерактивной карте

Читать далее

Агенты, которые не теряют цель: как научить ИИ решать многошаговые задачи

Время на прочтение4 мин
Количество просмотров2.5K

Открыть телефон, быстро найти нужный файл, перенести данные между приложениями — для нас привычная рутина, а для ИИ-агентов с их умением «видеть» экран это настоящее испытание. Важно не просто нажать правильные кнопки, а удерживать замысел: дойти до финала, не сбиться на полпути и не потерять контекст. Крупные языковые модели уже умеют работать со скриншотами и даже рассуждать о шагах, но когда задача требует больше двух-трех действий подряд, начинается настоящее веселье. Почему ИИ так легко «теряет нить», и как свежие исследования учат его держать в голове весь сценарий — рассказываем на живых примерах и с неожиданными находками из мира полуонлайн-обучения.

Читать далее

Трансформерные архитектуры для рекомендаций: от SASRec до сегодняшнего дня. Сравниваем с помощью RecTools

Время на прочтение15 мин
Количество просмотров842

Привет, Хабр! С вами Никита Зелинский, Chief Data Scientist МТС, директор по машинному обучению и исследованию данных MWS. В прошлый раз рассказывал, куда расти Data Scientist и какие навыки для этого нужны, а сегодня будет адаптация моего доклада с конференции True Tech Day. Полную видеоверсию можно посмотреть в комьюнити True Tech в VK.

Обсудим, как трансформеры меняют индустрию рекомендательных систем и почему это уже не просто хайп, а устойчивый стандарт, с которым работают в реальных продуктах. Покажу путь от базовых подходов к state-of-the-art-архитектурам, а еще объясню, как с помощью open-source-библиотеки RecTools от МТС можно сравнивать, конфигурировать и оптимизировать рекомендательные алгоритмы на практике.

Будет полезно тем, кто хочет разобраться, как устроены трансформерные рекомендательные модели. Приступим!

Читать далее

Вклад авторов