Обновить
734.81

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

Как изменить формат обучения LLM: подход через фазовую когерентность

Уровень сложностиПростой
Время на прочтение15 мин
Количество просмотров515

Современные LLM учатся предсказывать следующее слово. Я предлагаю дополнить эту цель: учить модель сохранять стабильность смысловых связей (когерентность). Это может уменьшить зависимость от объёма данных и ускорить появление способностей к рассуждению. Статья описывает гипотезу, метрики для проверки и возможные способы реализации.

Читать далее

EMNLP-2025: обзор исследований жестовых языков

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров312

Всем привет! В этом году в китайском городе Суджоу прошла юбилейная тридцатая конференция EMNLP (Empirical Methods in Natural Language Processing). Это одна из ведущих международных конференций по обработке естественного языка (NLP), проводимая под эгидой ассоциации компьютерной лингвистики ACL (Association for Computational Linguistics). 

Впервые конференция EMNLP прошла в 1996 году. Сегодня она посвящена эмпирическим методам, то есть моделям, основанным на данных, статистике и машинном обучении. А тогда конференция называлась Workshop on Very Large Corpora и представляла собой небольшое мероприятие ACL, посвящённое использованию корпусов текстов для обучения моделей. Тогда еще не было никаких трансформеров и уже привычных нам больших языковых моделей (LLM) и уж тем более мультимодальности, агентов и прочих хайповых ИИ-направлений. Это была эпоха статистического NLP, когда всё строилось вокруг частот, вероятностей и корпусов текстов, а в ходу были N-граммные языковые модели и скрытые Марковские модели. 

Читать далее

ИИ для юристов: Как мы неделю учили нейросеть работать с юридическими шаблонами

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров838

Однажды, к нам пришли наши клиенты — юристы и рассказали, что наш агрегатор обходит по эффективности их дорогие нейросетевые юридические сервисы. Но! Всегда ведь есть но, правда?. Говорят — «Ребята», продукт классный, но нам нужно больше. Научите его работать с нашими внутренними шаблонами документов, искать актуальные нормы права, подбирать свежую судебную практику». Мы, если честно, даже и не думали, что нашим B2C продуктом пользуются юристы.

Так родилась задача: сделать конструктор документов на базе нейросетей, такого нейро-помощника для юриста, способного генерировать документы на основе проверенных шаблонов. Путь к ее решению оказался куда более извилистым, чем мы предполагали, и растянулся на семь дней интенсивной работы.

Читать далее

Интенсивный курс «AI-агенты» от Google День 3

Уровень сложностиПростой
Время на прочтение58 мин
Количество просмотров3.9K

На данный момент я прохожу 5-дневный интенсив по AI‑агентам от Google. Эта статья представляет собой перевод оригинального материала, выполненный с помощью Gemini и мной. В этой статье вы узнаете как сделать так, чтобы ИИ не просто «отвечал», а «понимал» и «запоминал»? И если вы когда‑либо задумывались о том, как научить LLM‑агентов вести осмысленные, долгосрочные беседы, эта статья станет вашим проводником в мир сессий и памяти, которые формируют ИИ агентов.

Читать далее

Программист & LLM: как написать эмулятор ретро-компьютера за четыре вечера. Часть 1, вводная

Уровень сложностиСложный
Время на прочтение50 мин
Количество просмотров2.3K

Тон данной публикации задал товарищ @kiltum в своих статьях, начатых с этой. В самом начале был задан вопрос

может ли ИИ заменить программиста?

А действительно? Сколько вокруг этой темы хайпа, нет ни дня чтобы здесь на ресурсе не появилось 100 500 статей на тему нейросетей, LLM, ML и прочего. Пишут много и всякое. Возникло желание проверить лично, насколько решения, предлагаемые ИИ могут быть воплощены в жизнь.

Системы ИИ прочно вошли в нашу жизнь, и да, я тоже ими регулярно пользуюсь. Но мысли программировать с их помощью особо не возникало. Но что если попробовать, поставив при этом задачу из предметной области в которой ты не особо разбираешься? Похожий вопрос ставит и @kiltum, но я хочу попросить автора не ругаться на мою невольную попытку «пообезьянничать». Своей публикацией я лишь хочу подкрепить уже высказанные тезисы, на примере личного опыта. К тому же, старое железо — это всегда интересно, не правда ли? Если так, то добро пожаловать под кат.

Читать далее

Интенсивный курс «AI-агенты» от Google День 2

Уровень сложностиПростой
Время на прочтение40 мин
Количество просмотров4K

Злоумышленник успешно обошёл средства контроля безопасности компании. Ему не пришлось взламывать репозиторий напрямую. Вместо этого он использовал доверительные отношения между AI-моделью и высокопривилегированным MCP-сервером.

Читать далее

ИИ простыми словами

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров6.7K

Всем привет. Этот пост открывает реплику моего нового проекта «ИИ простыми словами» здесь на Хабре. Сегодня хочу рассказать о том, что сподвигло меня начать этот цикл, а также обозначу некоторые базовые моменты.

Читать далее

Почему мышление через видео может быть следующим шагом в развитии ИИ

Время на прочтение5 мин
Количество просмотров662

Кажется, что для развития ИИ нам нужно только увеличить объем данных и количество слоев нейросетей, чтобы достичь новых рекордов. Однако часто современные модели все еще сбиваются с толку из-за вещей, которые кажутся нам простыми. Почему это так?

В недавней работе исследователи предложили совершенно новый взгляд на этот вопрос. Они предполагают, что ключ может крыться не только в тексте или изображениях, а в видео. Они показывают, что обучение модели рассуждению с помощью видео помогает увязать вместе язык, логику и геометрию. Некоторые задачи выглядят иначе, когда гипотезы проверяются, а формулы пишутся в реальном времени.

Речь не о генерации привлекательных видеороликов, а об обучении модели рассуждать, действовать и учиться на своем опыте. В этой статье объясняю, почему видеогенератор может стать универсальной моделью мира для ИИ.

Читать далее

Как я создал торговую алго-платформу без опыта или почему для одних ИИ — гений, а для других — идиот

Уровень сложностиПростой
Время на прочтение18 мин
Количество просмотров6.9K

Технический разбор процесса разработки торговой платформы с использованием Gemini, Claude и ChatGPT. С настоящими постановками задач, архитектурными проблемами и выводами.

Всем привет! Меня зовут Артём, и последние 6 месяцев я создавал полноценную веб-платформу для алготрейдинга. Около 95% кода было сгенерировано c использованием современных LLM, большая часть с помощью Gemini 2.5 Pro, ручные правки составили менее 5%

Речь о проекте Depth Sight. Это платформа с гибким визуальным конструктором торговых стратегий, бэктестингом, реальной/бумажной торговлей, мобильной pwa версией и нативно встроенным Ai ассистентом для помощи в создании и объяснении торговых стратегий, а также анализа результатов бэктестов. Эта статья не столько об алготрейдинге, сколько о новом подходе к созданию сложных программных продуктов. Это кейс о том, как человек с видением продукта может в одиночку создать платформу промышленного уровня. Или нет? Предлагаю разобраться вместе.

Читать далее

Как ИИ помог быстро ввести и нормализовать строительные сметы

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров2.5K

У знакомого есть консалтинговая компания по внедрению продуктов 1С в бизнес и он поделился болью - у его заказчика - среднего размера строительной компании необходимо внести в систему порядка нескольких сотен смет в xlsx формате в 1С конфигурацию, которую они внедряют.

Сложность в том, что другие инженерные отрасли сильно отстают от IT в плане культуры разработки. Во времена моей юности по ФИДО ходила присказка "Если бы строители строили дома, как программисты пишут программы, то первый же залетевший дятел разрушил бы цивилизацию". Скорее всего автор этого афоризма никогда не был знаком с реальными строителями. Сейчас скорее наоборот - если бы строители писали программы, мы бы не вышли из эпохи арифмометров. Мы в IT приучены к тому, что ревью кода не пропустил коммит с лишним пробелом.

У сметчиков же документация выглядит как в буквальном смысле черновики - все файлы разной структуры, с разным числом и содержанием колонок, разделы разного формата, где-то древовидные, где-то плоские, причём оформлены в разном стиле - где помечено цветом, где шрифтом, с комментариями на полях и прочее.

Дело осложняется тем, что одно и то же наименование может быть записано разными сметчиками по-разному. Где просто бетон, где бетон с указанием марки, слова в разном порядке, часто одно и то же наименование, но записано и вовсе разными терминами, где синтаксический анализатор бессилен, при том что термины для неспециалиста неочевидные и незнакомые.

Традиционный автоматический импорт в сметной документации невозможен. В итоге 6 сметчиков вводили одну строительную очередь больше 2-х месяцев - бюджет для компании-внедренца около 2-х миллионов.

Читать далее

XGBoost альтернатива CatBoost для работы с категориальными данными???

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров678

Новый категориальный ре-кодер в XGBoost обещает избавить нас от рутины ручного кодирования и опередит CatBoost по качеству работы с категориальными данными?

Читать далее

GPT как основа low‑code‑платформ: разработка без программистов

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров4.9K

Привет, Хабр!

Меня зовут Никита, я ML-разработчик в «Инфосистемы Джет». В этой статье хочу поделиться практическим опытом: как GPT + low-code помогает запускать прототипы и автоматизировать процессы без долгих циклов классической разработки.

Если вам нужно быстро проверить гипотезу, запустить внутренний инструмент или собрать простой прототип, длинные спринты и ожидание, пока IT‑отдел возьмет задачу, могут убить всю инициативу. Современные низкокодовые (low‑code) платформы в связке с генеративными моделями GPT позволяют собрать рабочий MVP буквально за выходные. Достаточно описать задачу обычным языком — и платформа генерирует бизнес-логику, сценарии интеграции и рабочие процессы.

Ниже разберёмся, как это устроено, на что действительно способен подход GPT + low-code и какие ограничения важно учитывать на старте. Статья пригодится техническим продукт‑менеджерам, аналитикам и разработчикам.

Читать далее

Как мы ускорили работу с исполнительной документацией с помощью ИИ

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.1K

Привет, Хабр! Меня зовут Всеволод Зайковский, я заместитель руководителя проекта в «Газпром ЦПС».

Есть рутинные задачи, которые отнимают много времени и трудовых ресурсов. В проектах, с которыми работала компания, такой задачей была каталогизация исполнительной документации. Кто не знает, что это такое, тому очень в жизни повезло исполнительная документация – это документы, которые подтверждают фактическое выполнение работ на стройке. Вырыли траншею? Составили акт. Закопали траншею? Составили акт – и так далее. В конце среднего размера стройки мы получаем десятки тысяч актов, протоколов и схем, которые нужно вручную разобрать, хорошо отсканировать и вручную разнести по нужным папка. А затем поиск нужного документа все равно превращается в монотонный квест на несколько часов.

Читать далее

Ближайшие события

Почему LLM не волшебная таблетка: баланс между скоростью, качеством и достоверностью в NLP & LLM

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров2.1K

Привет, Хабр! Меня зовут Лиза, я разработчик направления AI/ML/DS. Вместе с командой мы решаем задачи, связанные с обработкой текстовых данных. В работе с большими языковыми моделями и классическим NLP я постоянно ищу баланс между скоростью, качеством и достоверностью — и в этой статье поделюсь нашими кейсами и практическим опытом, который помогает создавать надёжные и эффективные решения в условиях быстро меняющегося мира нейросетей.

Обычный рабочий день: заварил кофе, созвонов нет, можно и поработать. Заходишь в Jira, а там новая таска. Срок исполнения — вчера. Данные в хаосе, от прямых ответов на вопросы про данные заказчик уклоняется.

И тут возникает соблазн — отдать всё LLM-ке. Пишем промпт, слёзно просим несколько производственных видеокарт и кидаем всё в LLM, она ж явно больше нас повидала. И простое программистское: докручиваем API-шку, пишем тесты, но счастье не случается. Где-то получаем значение, которого нет, где-то ответ с первого взгляда правильный, но если рассмотреть глубже - не подходит. 

Судорожно добавляем новые вводные в промпт, а результат в некоторых кейсах всё равно как в анекдоте:

— Муж, купи батон хлеба, если будут яйца — возьми десяток.

Муж возвращается из магазина с десятью батонами.

— Ты зачем столько хлеба купил?

— Так ведь яйца были...

Кажется, закончить рабочий день в обед не удастся. Давайте разбираться, как заставить решение работать и подтвердить это результатами теста заказчику.

Что имеется: данные сложные, структуры и досконального понимания бизнес-процессов нет, а задачу решать критически нужно для бизнеса. В предметной области и данных разобраться придётся в любом случае.

Читать далее

Как мы починили процессы в ML-команде и сократили T2M на 20%

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров290

Привет, Хабр! Меня зовут Василий Сизов. По образованию я инженер-конструктор, а сейчас работаю тимлидом в ВТБ и занимаюсь машинным обучением в CRM и проектами с LLM. 

В какой-то момент мне доверили кросс-функциональную команду — и тут пришлось разбираться не только в моделях, но и в процессах, которые обеспечивают их жизнеспособность. В этой статье расскажу, как мы пересобрали эти процессы и сократили Time to Market на 20%. Возможно, вы узнаете в этих историях свои задачи и вызовы – и найдете идеи, которые помогут их решить.

Читать далее

Как ИИ-ученый пишет научные статьи о машинном обучении на уровне джуна

Время на прочтение6 мин
Количество просмотров1.4K

Заголовки статей, да и бенчмарки говорят о том, что ИИ становится всё умнее. Но когда дело доходит до реальных научных исследований, на практике многие автономные «ИИ-учёные» всё ещё не справляются с задачей. Их проблемы и решения выглядят расплывчатыми, а эффективность часто ниже, чем у студентов. Но почему?

Новое исследование из Японии предполагает интересный подход: вместо того, чтобы давать волю машине заниматься исследованием отдельной области, авторы попробовали сфокусировать её на одном исследовании - и получили заметный результат. Казалось бы, небольшой сдвиг, но результаты получаются лучше.

Что это значит для будущего ИИ-исследователей? Как машины учатся ориентироваться в реальных задачах и почему им всё ещё нужен человеческий надзор.

Читать далее

DPI-First: почему анализ трафика становится сердцем сети

Уровень сложностиСредний
Время на прочтение10 мин
Количество просмотров5.8K

Глубинный анализ трафика (DPI) больше не ограничивается фильтрацией пакетов. Шифрование, рост облаков и исчезновение сетевого периметра заставляют его меняться. На наших глазах DPI превращается в архитектурный элемент сетевого интеллекта — основу наблюдаемости, доверия и активной защиты. В статье разбираю, почему старые методы перестают работать, как DPI эволюционирует к поведенческому и ML-анализу, и почему распределённые DPI-системы могут стать сердцем сетей нового поколения.

Читать далее

Год работы с AI-проектами: 4 из 5 компаний делают одни и те же ошибки. Показываю правильный путь

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров11K

Привет, Хабр! Меня зовут Игорь Акимов, CEO Abasis.AI. Мы в последний год смотрим, как российский и не только бизнес пытается оседлать хайп-трейн с надписью «Искусственный Интеллект»

И знаете, что? Чаще всего это выглядит как карго-культ. Все бегают, кричат "Надо срочно всем использовать AI! Сейчас все будут работать в 2 раза быстрее!", покупают лицензии ChatGPT и аналогов всему офису и ждут чуда. Но будем честны: у 9 из 10 компаний получается не «цифровая трансформация», а дорогостоящий «театр инноваций».

Читать далее

Почему современные LLM пока не отберут работу у программистов

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров12K

Целая отрасль замерла в ожидании. Заменит ли LLM программистов? Выпускники школ прямо говорят — зачем поступать на программистов, придёт ИИ, и я останусь без работы. В новостях регулярно сообщается о массовых сокращениях в ИТ компаниях. Работодатели пытаются внедрить ИИ и если не уволить, то снизить зарплаты айтишников.

В интернете как всегда множество за и против. Я не вижу смысла приводить в статье сотни этих ссылок, потому что, во-первых, они по существу разные, а во-вторых, непонятно о каких программистах идёт речь, о каких стеках, о каких проектах, сложность, масштабность, возможность декомпозиции. Единственный вывод — нет однозначного подтверждение эффективности или неэффективности внедрения LLM.

Так ли это?

Читать далее

Как мы научили ИИ рисовать коллажи, когда дизайнер внезапно закончился

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров1.1K

Можно сосредоточить сотрудников на решении бизнес-задач и настоящей инженерной магии, если скинуть рутину на плечи ИИ. В прошлой статье мы рассказали об успешном опыте создания отдельного сервиса скоринга клиентов для персональных промоакций, и о том, как небольшой сервис быстро вырос в самостоятельный инструмент — платформу монетизации предложений от поставщиков MPS (Monetization Platform for Suppliers), — и позволил увеличить количество и качество промокампаний.

 С запуском платформы MPS мы автоматизировали большинство шагов по подготовке маркетинговых кампаний. И до настоящего времени узким местом в масштабировании промозапусков оставалась ручная отрисовка коллажей товарных позиций для персональных предложений в мобильном приложении.

Масштабировать количество дизайнеров вместе с маркетинговыми кампаниями — идея, достойная триллера, но не бизнеса. Рабочим решением стало создание сервиса автоматической генерации промоколлажей товарных позиций. И в этой статье мы поговорим о целях проекта и его технической реализации от постановки задачи до боевого использования в проде. Автоматизация отрисовки маркетинговых коллажей спасла наших дизайнеров от рутинного копипаста, улучшила бизнес-метрики и подарила клиентам такие промо, на которые хочется смотреть, а не закрывать глаза :)

Читать далее

Вклад авторов