Обновить
744.17

Машинное обучение *

Основа искусственного интеллекта

Сначала показывать
Порог рейтинга
Уровень сложности

ARC-AGI для оценки способностей ИИ и новый релиз ChatGPT 5.2

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели1.9K

Вчера вышла новая версия модели ChatGPT 5.2. В очередной раз Сэм Альтман и OpenAI удивляют качеством модели (в последний месяц было так много релизов, что они решили не отставать). В целом, все как обычно — топовые результаты на большинстве бенчмарков.

Но хочу уделить внимание одному очень сложному бенчмарку, на котором пока многие спотыкаются — ARC-AGI (Abstract and Reasoning Corpus for Artificial General Intelligence). Именно здесь ChatGPT 5.2 показал значительный скачок.

На сегодня существует две версии этого теста. Так о чем же он?

Читать далее

Новости

Обзор GPT-5.2: пора сдвинуть Google и Anthropic c лидирующих позиций

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели5.1K

Последние месяцы рынок ИИ живёт в состоянии непрерывного перегрева. Каждая компания стремится первой выкрикнуть слово «прорыв» и доказать, что её новая модель изменит правила игры. Создаётся ощущение, что индустрия соревнуется не в качестве, а в частоте анонсов. На фоне этой гонки OpenAI после короткой паузы возвращается в информационное поле и выкатывает GPT 5.2. Не промежуточную сборку и не облегчённый вариант, а полноценное обновление.

Первые намёки на грядущий релиз появились задолго до анонса. Сперва тихие утечки, затем осторожные публикации в профильных медиа. Журнал The Verge дал понять, что OpenAI готовит что-то объёмное. Чуть позже зарубежная пресса привела источники, уверявшие, что внутри компании несколько месяцев действовал режим молчания именно ради этой версии.

Читать далее

ИИ-психоз миллиардеров: как Big Tech сходит с ума от собственных продуктов

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели4.9K

В разговоре с Linus Tech Tips Линус Торвальдс, создатель операционной системы Linux, назвал Илона Маска «просто некомпетентным» и «слишком тупым, чтобы работать в технологической компании». И с этим, кажется, все согласились. Трудно не согласиться, учитывая десятки случаев, когда Маск доказывал свою полную профнепригодность. Нацистские приветствия, разрушающие его тщательно выстроенный публичный образ, продвижение безосновательных и опасных теорий заговора, очевидно лживые заявления, невозможные сроки, идиотский дизайн продуктов, полное отсутствие самосознания и постоянные выстрелы себе в ногу с последующим обвинением других - всё это коллективно нарисовало портрет Маска как полного шута, не способного управлять даже ларьком с лимонадом, не говоря уже о его разросшейся империи.

Читать далее

ИИ и мэйнфреймы: от наследия к конкурентному преимуществу

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели4.1K

ИИ возвращает мэйнфреймам актуальность и они снова становятся опорой гибкости и роста. Эти системы по-прежнему остаются незаметным фундаментом корпоративной архитектуры: каждую секунду они обрабатывают тысячи транзакций, управляют операциями и хранят критически важные данные. Однако многие организации, включая отраслевые компании, где жизненно важны точность и скорость обработки информации, по‑прежнему недооценивают необходимость их модернизации. В итоге старые технологии становятся источником высоких расходов на поддержку и превращают обновление инфраструктуры в сложный и затратный процесс.

Модернизация мэйнфреймов с помощью ИИ снимает главный барьер: сложность работы с устаревшим кодом. Генеративные модели, агентная автоматизация и гибридные облака позволяют превратить старые приложения из обузы в стратегический ресурс, который поддерживает развитие бизнеса и открывает новые возможности.

Читать далее

Оцифровываем сырую документацию компании с помощью ИИ локально! DeepSeek-OCR + Qwen 1.5

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели8.7K

Недавно получил зад��чу сделать автоматизированную оцифровку характеристик из паспортов товаров в БД, а не изменение параметров вручную в ERP. Я подумал, было бы здорово поделиться, как я это сделал, с вами на Хабре!

Читать далее

Нейро-дайджест: ключевые события мира AI за 2-ю неделю декабря 2025

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.8K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась насыщенной: Mistral выкатили Devstral 2, Photoshop, Express и Acrobat встроили прямо в ChatGPT, а исследования показывают, что более 80% вайб-кода могут содержать уязвимости. Криштиану Роналду инвестирует в Perplexity, а Сэм Альтман считает, что сейчас невозможно воспитывать детей без ИИ.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

ИИ агент на n8n: создаём Telegram бота с доступом к своим данным без иностранной карты за 30 минут

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели8.5K

В свободное время я часто "грешу" тем, что пилю очередной "стартап на коленке". Каждый раз когда мне приходила идея по типу "а не создать ли мне прикольного бота, который будет изменять прическу или одежду по фото, я шел по самому долгому пути - лез в код, и порой, это отнимало недели.

Как итог - разработка прототипа затягивались. Идеи опережали возможности, а мысль о том, что надо снова пилить фичу, тестировать ее, и паралельно еще править кучу багов (при этом без какой-либо гарантии, что продукт когда-либо принесет деньги), отбивало желание возвращаться к нему вовсе.

В этой статье я бы хотел поделиться с вами преимуществами no-code, которые я для себя открыл, а в качестве примера продемонстрировать, как можно легко и быстро, буквально за один вечер собрать телеграм бота с ИИ под капотом. Да еще и с возможностью подключения к собственным данным

Поехали! 🚀

Проблемы и подходы к нормализации НСИ

Время на прочтение13 мин
Охват и читатели5.2K

Нормативно‑справочная информация (НСИ) — это язык предприятий. Через наименования, коды и атрибуты описываются материалы, оборудование, комплектующие, инструменты — все, что используется в производстве, логистике, закупках, эксплуатации и ремонте. Именно НСИ обеспечивает согласованность ERP, MDM, BI и десятков других систем.

Однако на практике справочники редко бывают в порядке: в них копятся ошибки, дубли, разнородность описаний, несогласованность между системами. Для крупных предприятий эта проблема становится системной и дорогостоящей — не только в ИТ, но и в операционной эффективности бизнеса.

Меня зовут Дмитрий Романов, управляющий директор «Преферентум» (кластер SL Soft AI). В этой статье поделюсь, почему именно справочники материально‑технических ресурсов (МТР) превращаются в точку боли, почему «ручные чистки» и классические MDM‑подходы не помогают, и какие технологические решения действительно работают.

Читать далее

Техрепорт Alice AI: как мы создавали новое поколение моделей для самого популярного ИИ-ассистента в России

Время на прочтение46 мин
Охват и читатели12K

Сегодня мы делимся техрепортом, в котором разобран полный цикл создания нового семейства моделей Alice AI: базовая текстовая Alice AI LLM и специализированная LLM Search, мультимодальная Alice AI VLM и картиночная Alice AI ART. 

В части про Alice AI LLM расскажем, как сделали упор в Alignment на RL и Reward Modeling: мы минимизируем число разрозненных RL-стадий, собирая «общий RL». Вместо хрупкого «суперсигнала» используем аспектную формулировку качества и агрегируем её в целевую функцию, чтобы изменения критериев не требовали пересборки всей разметки. В главе про Alice AI LLM Search расскажем про многократные последовательные походы в Поиск с последующей фильтрацией/ранжированием источников. А также о том, как готовим ответы с использованием документов разной модальности (веб-документы, картинки, видео, гео).

Чтобы «вывезти» MoE-модель на сотни миллиардов параметров, мы целенаправленно сняли инфраструктурные ограничения обучения и инференса: в обучении используется YaFSDP (которую мы выложили в опенсорс) и собственная библиотека коллективных коммуникаций YCCL. В прод-инференсе мы работаем под SLA (avg TPOT ≤ 70 ms, p95 TTFT ≤ 2 s) и достигаем их комбинацией TP Attention/EP FFN, KV cache reuse, FP8 w8a8kv8 (в т. ч. сжатие KV cache ~3,05→~1,52 GB) и спекулятивного декодинга EAGLE‑3, что в сумме даёт 5.8× ускорение относительно BF16 (и 1,32× относительно лучшего open-source). Параллельно для Alice AI VLM нарастили в 1,5 раза объем претрейна, контекст до 32k и обновили OCR-датасет; VLM-генератор работает «из коробки», а для математики/геометрии выделен специализированный VLM‑решатель. В пайплайне Alice AI ART повышение релевантности к промпту начинается с диагностики смещений в датасете с помощью VLM и последующей адресной коррекции обнаруженных проблем.

Недавно все эти модели и решения легли в основу нашего нового ИИ-ассистента, и уже к ноябрю, согласно исследованию Mediascope, Алиса AI вышла на первое место по используемости среди россиян (14,3%), обойдя ранее доминировавший DeepSeek (9,4%). Кроме того, модель Alice AI LLM теперь доступна и для разработки собственных AI-решений на платформе Yandex AI Studio.

Читать техрепорт

Как системному аналитику перейти в дата-аналитику: советы из личного опыта

Время на прочтение13 мин
Охват и читатели6.9K

Рынок вакансий для системных аналитиков меняется. Растет спрос на работу с данными, облачные технологии и инструменты ETL/ELT. Бизнесу нужны специалисты, которые понимают архитектуру хранения данных, знают процессы их преобразования и принципы управления. Но требования в таких вакансиях часто пугают — со стороны это выглядит как другой мир, требующий совершенно новых знаний.

На своем примере перехода из финтеха в data-платформу VK Tech покажу, что все не так страшно. Расскажу, что в профессии системного аналитика остается неизменным, какие есть ключевые концепции и инструменты Data-направления и что на самом деле нужно знать для перехода.

Читать далее

ML-проект моей мечты. Часть 1

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели3.8K

Сегодня я хочу поговорить о том, как можно организовать код внутри своего проекта таким образом, чтобы всем было удобно им пользоваться. Я считаю, что это важный этап разработки, который напрямую влияет на многие аспекты, в том числе на удовлетворённость от работы.

Читать далее

ИИ: как триллионы долларов, спрятанные в офшорах, стали топливом для самого опасного пузыря в истории

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели9.1K

В искусственный интеллект влито столько денег, что мы, по сути, поставили на его успех всю экономику. И это огромная проблема. Не только потому, что ИИ - это технология с фундаментальным изъяном, которая никогда не станет прибыльной, никогда не оправдает спекуляций и создаёт долговую бомбу невиданных ранее масштабов. Нет, видите ли, даже если я ошибаюсь, а инвесторы в ИИ правы, мы все равно в проигрыше, поскольку ИИ отнимет огромное количество рабочих мест и обрушит экономику снизу вверх. Это идиотская, проигрышная со всех сторон ситуация.

Но так быть не должно было. Чёрт возьми, так никогда не должно было быть. Если бы компании взяли на себя часть ответственности, тикающей экономической бомбы под названием «пузырь ИИ» никогда бы не случилось, и вы жили бы экспоненциально лучше. Позвольте мне объяснить.

Почему существует пузырь ИИ? Не поверхностные спекуляции, а реальные структурные силы, стоящие за ним. Что ж, есть четыре простые, но весомые причины.

Читать далее

Руководство по PyTorch для новичков: создаём модель множественной регрессии с нуля

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели11K

В реальных задачах машинного обучения куда чаще приходится иметь дело не с «миллионами картинок», а с небольшими табличными датасетами вроде Abalone из UCI. В статье разбирается путь от честного EDA и линейной регрессии до нейросетевой модели на PyTorch: что дают трансформации признаков, какие проблемы создают гетероскедастичность и мультиколлинеарность, когда глубокая модель действительно улучшает метрики, а когда остаётся всего лишь дорогим способом получить те же самые 4–5 % выигрыша. По сути, это разбор того, где проходит граница здравого смысла между «добавим ещё один слой» и «нам хватит простой модели».

Читать далее

Ближайшие события

Топ-7 нейросетей для создания инфографики: от данных до наглядных диаграмм

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели9.7K

Недавно я занимался исследовательской работой, тогда сроки горели сильнее, чем кофе в моей кружке по утрам. И тут возникла задача: срочно нужно было сделать инфографику в виде схемы. Сначала я пытался рисовать руками, потом в Excel (да, туда тоже можно много чего засунуть), но всё это было слишком медленно и скучно.

Тогда я подумал: «А что если есть нейросети, которые сами умеют делать инфографику? Чтобы нажал кнопку - и вуаля, готово!» И знаете что? Есть. И не одна.

Сегодня мы посмотрим на восемь таких генераторов и протестируем их на практике, чтобы понять, какие реально помогают быстро и красиво превращать идеи в инфографику.

Приготовьтесь, будет весело, быстро и информативно - как идеальная инфографика.

Приятного чтения!

Читать далее

Экономика Computer Vision-проектов: от стоимости данных до ROI модели

Время на прочтение3 мин
Охват и читатели6.5K

В 2025 году проекты в области компьютерного зрения всё чаще рассматриваются не как исследования, а как полноценные бизнес-инициативы, эффективность которых определяется экономикой данных, затратами на инфраструктуру и ожидаемым ROI.

В этой статье — честный разбор от HR-стратега с 15+ годами опыта в AI и Tech: сколько на самом деле стоят данные, почему модель — лишь 20 % бюджета, какие роли действительно влияют на ROI, как считать стоимость ошибки FN/FP и что разрушает рентабельность быстрее всего.

Материал поможет инженерам, менеджерам и основателям понять: что делает CV-проект прибыльным, как выстроить минимальную команду, где экономить можно, а где нельзя, и какие KPI действительно важны для бизнеса.

Читать

Как я воссоздал веб-сайт 1996 года при помощи Claude

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели11K

Вчера до вершины популярности Hacker News добрался этот пост Джоны Гловера:

Может ли Claude воссоздать веб-сайт Space Jam из 1996 года? Нет. Или, по крайней мере, не с моими навыками промптинга. Требуется помощь, потому что я хочу сохранить этот веб-сайт навечно, но это никак нельзя сделать, кроме как попросить Claude воссоздать его из скриншота. Поверьте мне, я менеджер по разработке со степенью по computer science. Пожалуйста, помогите 😞

Чтобы уточнить подробности своей просьбы, Джона передал Claude Code (Opus 4.1) скриншот лэндинга, папку с изображениями и следующий промпт:

Я даю тебе:

1. Полный скриншот страницы лэндинга Space Jam.

2. Папку с сырыми графическими ресурсами**, извлечёнными с исходного сайта

Твоя задача — максимально точно воссоздать страницу лэндинга в полном соответствии со скриншотом.

С подобными задачами кодинг-агенты справляются идеально. Как я часто говорю, все задачи — это задачи поиска, но этот принцип не всегда просто применить на практике. Однако в данном случае применить его очень просто! У нас есть скриншот, поэтому diff пикселей сильно упрощает работу!

Вообще, можно сказать, что сам по себе Claude Code не смог бы с этим справиться. Но Claude с конфигурациями nori1 просто обязан это сделать.

Так что вызов принят.

Читать далее

Система мониторинга ML-моделей: что важно контролировать и почему

Время на прочтение11 мин
Охват и читатели6.3K

«Обучил, запустил и забыл» — плохая стратегия работы с ML‑моделями, но она часто встречается после удачного тестирования. Качество моделей может незаметно снижаться, и если пропустить этот момент — последствия могут дорого стоить. Когда мы начали задумываться о системе мониторинга, одна из наших моделей начала выдавать предсказания, которые требовали незамедлительного вмешательства в выстроенную работу. Но разум подсказывал, что проблема не в процессе, а в модели. О том, каким трудоемким оказалось наше расследование, и как мы восстанавливали и изучали каждую составляющую процесса почти вслепую, читайте по ссылке.

Быть детективами нам понравилось, но вкладывать столько усилий в каждый подобный случай не хочется. Мы поняли, что нужно научиться контролировать работу модели так, чтобы своевременно находить проблему и чинить ее, используя минимальное количество ресурсов. В серии из двух статей расскажу, как мы построили систему мониторинга ML‑моделей силами одного человека за несколько месяцев. 

Читать далее

ГенИИальный помощник ИТ-аналитика: как ИИ влияет на профессию и что с этим делать

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели4.5K

Профессия ИТ-аналитика в последние годы быстро трансформируется под влиянием бурного развития генеративного ИИ. Эксперт Axenix Игорь Кайбанов рассказывает, какие задачи теперь должен уметь решать специалист по данным, на какие ключевые тренды в развитии моделей ему важно обратить внимание и какие возможности ГенИИ стоит применять в своей работе.

Эволюция профессии

Всего за несколько лет эволюции генеративного ИИ роль ИТ-аналитиков заметно изменилась — модели взяли на себя огромную часть рутины, оставив человеку критическую оценку проделанной работы и преобразование инсайтов в действенные бизнес-решения.

CEO Shopify Тоби Лютке недавно предложил термин context engineer на замену понятия prompt engineer — и это оправдано. От постановки задачи и способов ее исполнения мы перешли к необходимости ограничивать и задавать контекст решения. В этом помогают как экспертные промты и ИИ-агенты, так подключение к системе специализированного массива данных.

Казалось бы, аналитик, пройдя стадию промт-инжиниринга для domain-задач, становится профи в контент-инжиниринге. Но и это быстро уходит в прошлое. По мере того, как искусственный интеллект становится проактивным и все больше берет на себя принятие решений, аналитик превращается в когнитивного инженера.

Ключевой задачей аналитика становится гибридная экспертиза, то есть синтез ИТ-знаний плюс понимание возможностей/рисков ИИ (особенно в security-sensitive отраслях). На этом уровне аналитик становится «проводником» между данными и стратегией, где ГенИИ — не замена, а мультипликатор эффективности.

Читать далее

Benchmark Driven Development: почему мы перестали верить чужим бенчмаркам

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели3.9K

В этой статье расскажем, как мы пришли к подходу, который внутри называем Benchmark Driven Development (BDD) — р��зработка, движимая бенчмарками на своих данных.
(Да, мы знаем, что BDD — это ещё и Behavior Driven Development, тут у нас своя расшифровка 🙂)

Читать далее

Как Nvidia может случайно уничтожить 90% собственного рынка (и даже не заметить этого)

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели10K

В своём последнем обращении к Уолл-стрит Nvidia упомянула Майкла Бьюрри, прославившегося благодаря «Игре на понижение», чтобы опровергнуть его анализ пузыря ИИ и заверить общественность, что «они - не Enron».

Давайте начистоту: если многотриллионная компания вынуждена публично обращаться к одному-единственному финансовому аналитику по имени и заявлять, что она не Enron, - это лучший способ заставить всех думать, что вы и есть новый Enron. Бьюрри ответил на этот довольно забавный выпад в своей статье на Substack, указав, что Nvidia совсем не похожа на Enron, а скорее напоминает Cisco. Это невероятно точное сравнение. Оно прорезает всю словесную шелуху и обнажает гниль в самом сердце пузыря ИИ. Однако я не думаю, что его предупреждение зашло достаточно далеко, потому что у Nvidia есть потенциал стать чем-то гораздо худшим, чем Cisco.

Читать далее
1
23 ...

Вклад авторов