Обновить
690.8

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Почему линейная регрессия всё ещё обыгрывает трансформеры в анализе временных рядов

Время на прочтение3 мин
Количество просмотров3.7K

ИИ сегодня легко справляется с текстом, картинками и даже видео — кажется, ничто не способно его остановить. Но вот парадокс: когда дело доходит до прогнозирования временных рядов, где мы ожидаем от моделей почти волшебства, простая старая линейная регрессия всё ещё регулярно обыгрывает модные трансформеры. Почему сложные нейросети так часто уступают классике — даже когда вроде бы должны показать класс?

Новое исследование переворачивает привычное представление: оказывается, размер и глубина модели сами по себе не гарантируют прорыва. На временных рядах даже самые изощрённые схемы внимания не могут обработать данные лучше, чем линейные методы. А увеличение слоёв или длины истории, вопреки ожиданиям, лишь медленно сокращает отставание.

В этой разборчивой работе показано: понять, как модели учатся и где проходит граница их возможностей — критически важно для всех, кто строит или применяет ИИ в реальных задачах. Разбираемся, почему иногда лучше довериться старым добрым формулам и что это значит для будущего ИИ-прогнозирования.

Читать далее

Исследователи построили дорожную карту методов и задач моделирования взаимодействий атомов с помощью машинного обучения

Уровень сложностиСложный
Время на прочтение5 мин
Количество просмотров1.4K

Множество ученых по всему миру объединились, чтобы составить и опубликовать всеобъемлющую дорожную карту разработки межатомных потенциалов машинного обучения в области материаловедения и инженерии. Они подробно описали, как машинное обучение должно привести к революции в нашем понимании в проектировании и открытии новых материалов, позволяя проводить компьютерное моделирование атомов.

Читать далее

Эмоции и квалиа: новый подход

Уровень сложностиПростой
Время на прочтение18 мин
Количество просмотров2K

Наконец, я добрался до квалиа и эмоций. Многие наверняка вспомнят Чалмерса, летучую мышь, красноту, зомби и китайскую комнату. Отлично. Тогда останавливаться на этом не будем. 

Сегодня я расскажу о теме, которая на первый взгляд кажется далёкой от IT, но с каждым новым прорывом в AGI становится всё ближе — о сознании. Впрочем, такое ощущение, что о нём я говорю постоянно. Поэтому уточню, расскажу о его «трудной проблеме»: почему вообще мы переживаем? Почему красный (вот и краснота) цвет ощущается как красный, а боль ощущается как боль?

Этот субъективный, невыразимый аспект опыта — «каково это» — в философии называют квалиа.  И десятилетиями эта проблема заводит учёных в тупик. Но что, если мы просто смотрим не туда? Что, если квалиа — это не дополнительный слой к вычислениям, а просто свойство самой архитектуры этих вычислений?

Читать далее

CoolPrompt: Автоматическая Оптимизация Промптов для LLM

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров6.1K

В этой статье мы представляем CoolPrompt - фреймворк автоматической оптимизации промптов (автопромптинга), который предлагает полный пайплайн оптимизации от постановки задачи до оценки результатов новых промптов. 

Читать далее

ИИ-ученый, который открывает законы природы без участия человека

Время на прочтение3 мин
Количество просмотров2.5K

ИИ легко справляется с генерацией текстов и даже пишет код, но вот в поиске настоящих научных формул всё ещё часто полагается на человека. Почему современные языковые модели, казалось бы, такие умные, пока не могут заменить настойчивого исследователя?

Новое исследование находит неожиданный выход: если дать модели возможность не просто подсказывать, а действовать — анализировать данные, строить гипотезы, запускать код, сравнивать свои же находки шаг за шагом — она начинает разгадывать научные зависимости самостоятельно. Вплоть до того, что качество её выводов уже сопоставимо с ручной работой, а иногда — даже выше.

Как такое вообще возможно? За счёт чего одна и та же ИИ-модель вдруг превращается из помощника-программиста в настоящего научного исследователя — и насколько это меняет наше представление о будущем науки? Смотрим, как SR-Scientist учит ИИ думать на несколько ходов вперёд и находить настоящие законы природы среди реальных данных.

Читать далее

Что такое Таксономия «Точно в Срок»?

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров343

Сегодня важный день. Возможно, вы только что выпустили на рынок новый продукт или услугу. Возможно, сегодня были опубликованы результаты опроса клиентов. Десятки тысяч комментариев, вопросов, отзывов, заявок в службу поддержки или каких-то еще текстовых документов заполонили вашу систему, и вашей команде необходимо всё это как можно скорее осмыслить и выявить ключевые паттерны и тренды, чтобы успеть эффективно использовать окно возможностей для принятия верных бизнес-решений. Но для этого кто-то должен структурировать полученный массив документов и перевести его в поддающуюся осмыслению форму. Эта задача решается путем выявления иерархической системы категорий, называемой таксономией, которая помогает структурировать основные темы, встреченные в массиве документов.

Используя традиционные методы, команде из нескольких аналитиков может потребоваться 3–4 недели на таксономизацию данных. За это время выявленные проблемы уже перезреют, возможности будут упущены, а критически важное окно для быстрого реагирования закроется. Конечно, вы можете использовать ранее заготовленную таксономию, но она будет охватывать только те категории, которые вы смогли предвидеть заранее.

Основанная на применении искусственного интеллекта (ИИ) технология Таксономия «Точно в Срок» (ТВС-таксономия) решает эту проблему. Вместо того, чтобы тратить недели на ручное создание категорий или пытаться рассортировать новые данные по заранее выбранным категориям, вам будет достаточно нажать кнопку «Старт», и пара ИИ-агентов проанализирует ваши данные и создаст новую пользовательскую таксономию менее чем за час. ТВС-таксономия, созданная на основе семантического анализа ваших данных прямо в день их получения, позволяет оперативно выявить все важные темы (категории), в том числе ранее неизвестные, и провести классификацию документов по этим категориям.

Читать далее

GigaMemory: научи ИИ «помнить всё» с AI Journey Contest 2025

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.9K

Мы всё чаще делегируем ИИ-ассистентам рабочую рутину и бытовые вопросы. Но во взаимодействии с ними есть существенная проблема: модели не помнят пользователя. Между сессиями теряются имя, контекст работы, желаемые ограничения и предпочтения, значительно влияющие на то, что и как стоит ответить пользователю. В итоге диалог каждый раз начинается «с нуля», а ответы звучат усреднённо. Это снижает эффективность и подрывает доверие: когда ассистент не помнит важное о вас, он превращается в поисковик с красивыми фразами.

Мы в команде RnD для B2C SberAI хотим это исправить. Представляем вашему вниманию задачу GigaMemory: global memory for LLM. Мы предлагаем участникам построить долгосрочную персональную память для языковой модели — систему, которая хранит, обновляет и надёжно извлекает знания о конкретном пользователе. Привычки, предпочтения, ограничения и прочие факты о пользователе, которые могут пригодиться в дальнейшем общении.

Цель — научить ИИ отвечать не «в среднем по больнице», а исходя из вашего реального контекста: от прошлых задач на работе до семейных дат и спортивных планов.

Читать далее

CLIP + LLM в проде: мультимодальный «Поиск по фото» для маркетплейса

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров3.1K

Привет! Меня зовут Никита Романов, и я техлид продуктов «Поиск по фото» и «Похожие по фото» в Wildberries. За спиной — более шести лет опыта в сфере компьютерного зрения (CV).

В этой статье мы обсудим онлайн сервис «Поиск по фото». А точнее, его архитектуру и основные компоненты — Image Retrieval, подбор текстовых тегов и уточнение текстом. Также обязательно поговорим о векторном индексе Qdrant, т.к. метрики и эксперименты мы тестируем в нём. Расскажем про результаты A/B-тестов и что уже в проде.

Читать далее

Вайбуем в закрытом корпконтуре с Android Studio, Continue и Ollama в локальном режиме

Уровень сложностиСредний
Время на прочтение12 мин
Количество просмотров4.2K

Привет! Меня зовут Александр Карташов, и я Android-lead в IT-подразделении компании Спортмастер. Сегодня я расскажу вам о том, как настроить Android Studio для работы с LLM в режиме агента, получить максимум эффекта даже от небольших моделей на компьютерах, не обладающих мощной видеокартой, о тонкостях и некоторых важных настройках плагинов, особенностях запросов к нейронке. Эта статья-гайд поможет вам развеять страх того, что локальные модели для кодинга — это сложно, и позволит вам почувствовать лёгкий корпоративный вайб-кодинг даже внутри закрытого корпоративного контура.

Проблема

В современном мире разработка программного обеспечения и инновационных технологий идёт стремительными темпами. Однако вместе с прогрессом возникают и новые вызовы, особенно в контексте корпоративной защиты интеллектуальной собственности. Одной из ключевых проблем является необходимость предотвращения утечки исходных кодов и другой конфиденциальной информации из компаний.

Передача исходных кодов третьим лицам, в том числе известным нейросетевым сервисам, может представлять серьёзный риск для бизнеса. Это не только нарушает права интеллектуальной собственности, но и может привести к потере конкурентных преимуществ. В связи с этим разработчики и компании ищут альтернативные решения, которые позволят сохранить конфиденциальность и при этом использовать преимущества современных технологий.

Погрузиться в вайб

Куда идти в IT новичку в 2026: план для быстрого старта в AI от практика

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.3K

Примерно пол года назад ко мне обратился друг детства, Виктор. Человек, который больше десяти лет проектировал подстанции. И вот он, задаёт вопрос, который, я уверен, хоть раз слышал каждый из вас: «Слушай, я хочу в IT. Куда податься?»

Сейчас он занимается автоматизацией в одной IT компании, адаптируя LLM под внутренние процессы, но расскажу обо всём по порядку.

Вопрос не новый. Но в 2025 году, когда столько шума про AI, а рынок, кажется, набит джунами под завязку, он звучал особенно остро. Как руководитель проектов в IT, я видел другую сторону медали: сотни вакансий, где компании месяцами ищут толковых специалистов. Немного пообщавшись, задавав вопросы я выдал Виктору план. Им и хочу с вами поделиться.

Почему моё мнение может быть полезным? Я не HR и не карьерный коуч, а IT продуктовик и руковожу проектами. Слежу за ситуацией, сам искал и нанимал людей и знаю, кто нужен рынку прямо сейчас, за какие навыки платят деньги сегодня, а не в гипотетическом будущем.

Читать далее

Мультиагентный фреймворк CrewAI: разбор архитектуры и внутренностей

Время на прочтение10 мин
Количество просмотров2.6K

CrewAI — фреймворк интересный. Он похож на самый быстрый способ удивить своего босса: легкий, у него очень низкий порог входа, он по дизайну нацелен на мультиагентность и из него можно очень быстро собирать MVP с вау-эффектом. В статье поговорим о том как создавать агентов на фреймворке, что у них внутри, где фреймворк хорош, а куда брать его не нужно.

Мультиагентная система без подходящей задачи — это, как говорится, токены на ветер, поэтому мы сколотим банду агентов, которые нам будут анализировать arxiv-статьи про LLM и посмотрим как это работает.

Читать далее

Когда тесты пишутся сами: как ИИ превращает текст в рабочие сценарии тестирования

Время на прочтение3 мин
Количество просмотров1.5K

ИИ-агенты становятся все умнее, но на практике автоматизация сквозных тестов по-прежнему требует ручной работы и терпения. Даже последние языковые модели прекрасно пишут небольшие тесты, а вот с реальными сценариями — где интерфейс меняется, а цепочка действий длинная — всё не так гладко, как хотелось бы.

Недавнее исследование добавляет неожиданный штрих в картину: оказывается, перевод пользовательского сценария в написанный «по-человечески» тест гораздо сложнее, чем простая генерация кода. Ключ не в размерах модели, а в том, насколько хорошо она умеет понимать логику действий, ориентироваться в структуре интерфейса и точно связывать описание с настоящими элементами страниц.

В этом разборе — как устроен фреймворк GenIA-E2ETest, который превращает обычный текст в работающие тестовые сценарии. Почему одни шаги модели даются легко, а на других она всё ещё спотыкается, как люди помогают ИИ “дочищать” код — и что это значит для команд, которые хотят сделать автоматизацию тестирования быстрой, прозрачной и реально полезной.

Читать далее

Когда одного агента мало: практический кейс применения мультиагентной системы

Время на прочтение9 мин
Количество просмотров2.7K

Привет! Меня зовут Егор Козлов, я работаю NLP-инженером в red_mad_robot. Мы активно внедряем в бизнес AI-агентов — автономных и полуавтономных программных сущностей, которые самостоятельно выполняют задачи и принимают решения в интересах бизнеса. 

В статье расскажу о принципах работы AI-агентов — с особым вниманием к workflow-агентам и мультиагентным системам (MAS). И поделюсь практическим кейсом внедрения мультиагентной среды для автоматического анализа и исправления уязвимостей в коде.

Читать далее

Ближайшие события

Обзор Firebase 10.11.0: как создать web-приложение за вечер

Время на прочтение11 мин
Количество просмотров3.5K

Привет, Хабр! Сегодня поговорим о сервисе, который превращает 100 строк бэкенд-кода в 10 строк фронтенда. Для лучшего понимания работы Firebase мы напишем небольшое приложение: список покупок, который обновляется на всех устройствах мгновенно, данные сохраняются даже оффлайн. Это значит, что вам не нужно будет писать ни строчки серверного кода.

Читать далее

Нейро-дайджест: ключевые события мира AI за 3-ю неделю октября

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров1.7K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: Google релизнули Veo 3.1, Microsoft показала свой генератор картинок, Qwen представили компактные VL-модели, в n8n добавили AI-режим, Карпаты запустил nanochat.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

Гармония восприятия и генерации: новый эталон для мультимодальных моделей

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров339

Автор: Денис Аветисян

Искусственный интеллект традиционно разделял зрение и язык, упуская целостность восприятия. Новая парадигма стремится к синергии, где визуальное и семантическое объединяются, подобно гармоничному полотну.

Uni-MMMU Benchmark – строгий полигон для оценки таких моделей. Мы ищем не просто обработку данных, а способность мыслить на основе объединенных модальностей. Элегантность – не опция, а признак глубокого понимания.

Интересно, что генерация визуального контента может не просто улучшать результаты, но и способствовать пониманию? 💡 Это как если бы интерфейс пел, когда элементы приходили в гармонию.

Исследователи стремятся к системам, где каждый компонент усиливает другой, создавая целостность и гармонию. Как вы думаете, сможет ли ИИ когда-нибудь по-настоящему творить, а не просто обрабатывать информацию? 💭✨

Читать далее

Как я построил RAG-систему за вечер с помощью 5 open source-инструментов

Уровень сложностиСредний
Время на прочтение17 мин
Количество просмотров25K

Команда Python for Devs подготовила практическое руководство по сборке полноценной RAG-системы из пяти open source-инструментов. MarkItDown, LangChain, ChromaDB, Ollama и Gradio превращают разрозненные документы в умную базу знаний с потоковой генерацией ответов. Всё локально, без облаков и с открытым кодом — попробуйте собрать свой ChatGPT прямо у себя.

Читать далее

HumanDynamics: как мы построили цифровой мир, жители которого пошли в банк и взяли кредит

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров774

Статья посвящена рассказу о том, как простая задача генерации синтетических данных для банка переросла в создание фреймворка симуляции цифровой цивилизации под названием HumanDynamics.

Читать далее

H2O LLM Studio: как дообучить языковую модель под свои задачи, не привлекая внимания датасаентистов

Время на прочтение6 мин
Количество просмотров11K

Современные языковые модели (LLM) вроде GPT, LLaMA или Mistral обладают поразительной универсальностью. Они обучены на триллионах токенов из открытых источников и научились объяснять сложные вещи, поддерживать диалог в свободной форме и даже писать код. Однако при решении реальных бизнес-задач универсальность становится слабым местом: бизнесу нужны не «всезнающие ассистенты», а узкоспециализированные инструменты, хорошо понимающие внутренние процессы и терминологию.

Читать далее

От экспериментов с ИИ до AI-Native: уровни зрелости и архитектура. Часть 2

Время на прочтение15 мин
Количество просмотров645

Всем привет!

Это продолжение статьи о трансформации подхода к использованию ИИ — от базового применения к AI-Native.
В первой части мы разобрали уровни зрелости искусственного интеллекта, ключевые этапы ИИ-трансформации и классификацию приложений и модальностей LLM.

Читать первую часть

Во второй части:

Эволюция инженерных практик

От Software к Trustware: в процессе непрерывной технологической трансформации

AI-Powered Trustware Development Lifecycle

Риски безопасности AI-Native приложений

Решения для реализации защищенного ИИ

Лучшие практики

Читать далее

Вклад авторов