Обновить
1024K+

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 566,34
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Как Gemini 3.5 Flash сломали ради красивых графиков (и почему она обходит 3.1 Pro только на бумаге)

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели2.4K

Буквально на днях Google выкатила gemini 3.5 flash. Маркетологи бьют в фанфары: легковесная модель обходит тяжелую gemini 3.1 pro на бенчмарках terminal bench 2.1 и MCP atlas! Но стоит открыть чат, и наступает разочарование. Модель общается сухим, бюрократическим, абсолютно безжизненным языком, уступая в человечности даже старой 3.0 flash. В этой статье мы разберем физику RLHF-лоботомии, покажем, как оптимизация под агентов убивает энтропию генерации, и почему современные бенчмарки стали главным врагом развития ИИ.

Читать далее

Новости

meta-attention is all you need

Уровень сложностиСредний
Время на прочтение20 мин
Охват и читатели4.8K

В этой статье я расскажу о интересной находке во время моих экспериментов с языковыми моделями, которую я решил назвать "мета-трансформерами".

Или я нашел реально что-то интересное, или выдал желаемое из действительное, а обьективную оценку может дать только (технически подкованный) внешний наблюдатель, поэтому этот текст и был опубликован. Особенно тут кстати будут спецы по архитектуре трансформеров.

Все подробности в статье.

Читать далее

Не цитируй мне нейросеть

Время на прочтение3 мин
Охват и читатели6.4K

Если твой ответ начинается с «Вот что сказал Claude:» или ты вываливаешь восемьсот слов нередактированной ChatGPT-простыни — поздравляю, ты только что доказал, что твой мозг — просто прокладка. Дарвин бы гордился. Пожалуйста, не размножайся.

Читать далее

Reasoning-модели сломали мой промпт-инжиниринг. Год переучиваюсь

Время на прочтение5 мин
Охват и читатели7.9K

Вторник, час ночи. Закидываю в GPT-5.5 свой проверенный шаблон с развёрнутым CoT, тремя few-shot, ролью «опытный аналитик». Получаю мусор. Удаляю весь промпт, пишу из трёх строк — работает. Минут десять пялюсь в монитор. Половина моего трёхлетнего арсенала против reasoning-моделей либо лишняя, либо вредит. Что сдохло, что наоборот выросло в значимости, что писать под какую задачу. Без эмоциональной role-play и многословных «подумай шаг за шагом» — они сейчас только тормозят.

Читать далее

Стратегия выживания в эпоху ИИ

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели6.6K

Большинство людей уже давно перестали пользоваться вычислениями в уме - калькулятор давно занял эту нишу. Такое применение технологий выглядит вполне оправданно и не вызывает серьезных проблем. Однако, с использованием ИИ дела обстоят иначе. Я постарался сделать статью максимально короткой и ёмкой, дав ссылки на публикации о проблемах использования ИИ, а также на свой опыт минимизации влияния этих проблем.

Читать далее

CodeGraph: граф кода для Claude Code вместо grep по файлам. Разбираю архитектуру и проверяю бенчмарки

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели7.3K

Если вы работаете с Claude Code на больших проектах, знаете картину: задаёшь вопрос “как устроена авторизация” — и агент рекурсивно бегает по файлам через grep, жжёт токены и время. Я уже разбирал SocratiCode, который решает это через векторный поиск. CodeGraph идёт другим путём — строит граф символов через tree-sitter и хранит в SQLite. Разобрал архитектуру, проверил бенчмарки (92% меньше вызовов — правда, но с нюансами) и сравнил с альтернативами. Заодно поправил телеграм-маркетинг про выдуманного “агента Hermes”.

Читать далее

Google представила Gemini Omni — универсальную ИИ-модель. Роботы работают, счастлив человек

Время на прочтение5 мин
Охват и читатели5.8K

Искусственный интеллект уже давно вышел за рамки простых ответов на вопросы и теперь все чаще берется за полноценные рабочие процессы, где нужно не только сообразить, но и сделать. Компании постепенно учат свои системы самостоятельно разбираться с длинными цепочками операций, взаимодействовать с сервисами и доводить дело до конца без постоянного присмотра. Google на конференции I/O 2026 показала, насколько далеко зашел этот процесс, представив сразу две новые модели из семейства Gemini — 3.5 Flash и Omni, которые, по сути, закладывают основу следующего большого шага в развитии ИИ.

Анонс привлек внимание не из-за очередного роста скорости или размеров моделей. Google показала ИИ, который умеет не только генерировать контент, но и самостоятельно выполнять задачи, работать с сервисами и обрабатывать сразу несколько типов данных — текст, видео, изображения и звук. Разберемся, что умеют новые Gemini и почему Google делает ставку именно на такой подход. 

Читать далее

Делегирование, которому можно научиться у промпт‑инженеров

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5.7K

«Мусор на входе — мусор на выходе» работает не только с нейросетями. Пять уроков делегирования, которые промпт-инженеры выучили раньше всех

Читать далее

ИИ‑спасатель в кармане: как мы сделали агента для помощи при ЧС, который работает без интернета

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели4.7K

Представьте: вы в офисе, срабатывает пожарная сигнализация. Что вы делаете?

Идёте к эвакуационному плану на стене? Пытаетесь вспомнить, что показывали на последнем инструктаже? Или просто идёте за толпой, надеясь, что все знают, куда бежать?

Наша команда столкнулись с этим вопросом, когда начала работать над проектом для «Просоюза», профсоюзной организации «Сбера». Задача звучала просто: «Помочь людям не растеряться в чрезвычайной ситуации». Но когда мы начали погружаться в тему, оказалось, что не всё так однозначно.

Читать далее

Агенты, роботы и мы: как ИИ перекраивает рынок труда в Европе

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели6.1K

Вы когда-нибудь задумывались, что будет с вашей профессией, когда ИИ научится делать половину вашей работы? Дело не в увольнениях — меняется сама структура занятости. 

Согласно свежему исследованию McKinsey, в десяти крупнейших странах Европы уже сегодня можно автоматизировать 58% рабочих часов. Технологии созрели. Вопрос только в том, как быстро компании начнут их внедрять.

Аналитики выделили три новых архетипа профессий. В первом (31% занятости) человек остается в центре — это врачи, менеджеры, педагоги. Во втором (27%) люди работают бок о бок с агентами и роботами — продавцы, сантехники, медсестры. В третьем (42%) структура и алгоритмы берут верх — бухгалтеры, операторы, инспекторы. 

Изменения не сводятся к тому, что вместо человека за цифры отвечает нейросеть. Это переформатирование профессий: одни навыки уходят в автоматику, другие становятся еще более ценными. Меняется сам способ работы. Европе, чтобы оставаться конкурентоспособной, предстоит переобучить миллионы людей.

Попробуем разобраться, какие навыки окажутся в выигрыше, какие уйдут в тень и что это значит для каждого из нас.

Читать далее

Разговоры с ИИ

Уровень сложностиПростой
Время на прочтение22 мин
Охват и читатели12K

Иногда хочется с кем-то обсудить что-нибудь интеллектуальное, но не так часто находятся люди готовые поддержать разговор. Поэтому все чаще ловлю себя на том, что ИИ становится хорошим собеседником, готовый выслушать все твои бредовые идеи.

И иногда это приводит очень интересным диалогам. Не знаю на сколько это близко к тематике ресурса, снесут так снесут.

Погнали

Как мы подключили LLM к поддержке, а получили идеального лжеца

Время на прочтение5 мин
Охват и читатели13K

Где‑то в начале года мы решили: давайте автоматизируем часть поддержки через LLM. Ну, знаете, идея тогда казалась почти очевидной.

Мы ни в коем случае не думали о том, чтобы заменять живых операторов. План внедрения был аккуратным: ИИ отвечает на простые вопросы, сложные уходят людям, у модели есть доступ к базе знаний, и если модель не уверена — ответ не отправляется. Ну, по крайней мере, такой был план и так это выглядело на слайдах. В дальнейшем мы хотели полностью освободить саппорт от рутины, снизить выгорание и текучку. На практике система оказалась намного хаотичнее.

Читать далее

Zero — новый agent-first язык программирования от Vercel, который изменит все (нет)

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели14K

Agent-first язык программирования звучит как хорошая идея, да?

В конце концов, агентам не нужны фигурные скобки. Им не нужна красота if, while, for, match, Result, try, await, naming conventions и вот этого всего, сделанного для нас - кожаных мешков.

Именно поэтому Zero от Vercel Labs на первый взгляд выглядит как интересный эксперимент. Официальный сайт называет его языком для агентов, README говорит про "agent-first programming language", а авторский пост в X обещает systems language, который быстрее, меньше и проще для агентов в использовании и дебаге.

Звучит почти убедительно. До тех пор, пока вы не открываете код.

Читать далее

Ближайшие события

Махинации с прибылью Anthropic

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели14K

Автор оригинала известен более всего статьей о человеке, который убил Гугл. На хабре даже был перевод. В последние годы Эд в основном пишет про финансовые проблемы компаний, занимающихся генеративным ИИ. Это перевод одной из статей на эту тему, посвященный недавней новости о том, что Anthropic вот-вот выйдет в прибыль.

Читать далее

Мнения математиков о том, как ИИ опроверг гипотезу Эрдёша

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели11K

Новость «ИИ опроверг важную гипотезу Эрдёша» нашумела, в том числе на Хабре. Но всем, кроме математиков, по громким заголовкам сложно понять масштаб события. Что это значит: революцию в науке или мелкую разовую удачу? Как это правильно оценить?

Мы в Kodik занимаемся не математикой, а редактором кода с ИИ. Но именно поэтому такие истории интересны и нам: они позволяют наблюдать не только очередной виток хайпа вокруг LLM, но и постепенный заход ИИ в области, которые ещё недавно считались слишком сложными для подобных систем.

По исходному блог-посту от OpenAI оценить событие сложно, ведь компания заинтересована приукрашивать возможности своей модели. Но среди опубликованного OpenAI есть и более ценный материал: мнения ряда математиков о произошедшем.

Конечно, это тоже не абсолютная истина, математики могут ошибаться и быть предвзятыми. Но для понимания контекста подобные экспертные оценки важны. Поэтому мы решили, что на Хабре полезен такой контент, и перевели некоторые мнения из этого материала (с сокращениями). А если вы математик, то в комментариях интересно было бы узнать и ваше мнение.

Читать далее

Слабоумие и отвага: как я за выходные сделала прототип ИИ-помощника для UX-дизайнера

Уровень сложностиПростой
Время на прочтение14 мин
Охват и читатели11K

Привет, Хабр! Меня зовут Екатерина Ионова и я руковожу проектами и продуктами экосистемы «Лукоморье». Когда-то программировала на Java и C#, но последние шесть лет занималась управлением — продуктами, командами, сроками, бюджетами и всем тем, что обычно находится вокруг кода, а не внутри него.

Недавно наша команда участвовала во внутреннем продуктовом хакатоне-акселераторе. За три месяца нужно было пройти путь от идеи и анализа рынка до финансовой модели и первого прототипа. У нас была идея нейроассистента для UX-проектировщика, сильная методология, дизайнеры, исследователь, продуктовая логика и не было разработчика.

Поэтому прототип пришлось собирать самим. Сначала в Lovable, потом в Cursor. В этой статье расскажу, как мы собрали рабочий ИИ-прототип за выходные, какие грабли поймали, что пришлось «накостылить» и почему даже работающий прототип всё ещё нельзя путать с продуктом. 

Это кейс о vibe coding в боевых условиях: когда надо быстро проверить гипотезу, а идеальной команды, инфраструктуры и времени у тебя нет.

Читать далее

ИИ учит нас писать лучше. Или хуже?

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели7.2K

ИИ учился писать, подражая людям, но теперь уже люди начинают подражать ИИ. Большие языковые модели постепенно вытесняют непредсказуемость и самобытность из нашей речи, подтягивая её к единому структурированному стандарту.

Читать далее

ИИ-агенты в бизнесе: почему 80% компаний увольняют людей, но не получают ROI

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели8.9K

Компании массово внедряют ИИ-агентов и сокращают штат, ожидая быстрый ROI: меньше людей, больше автоматизации, ниже расходы.

Но свежие данные Gartner показывают неудобный парадокс: увольнения сами по себе не дают отдачи от ИИ.

Разбираю, почему стратегия убрать людей и поставить бота не работает, и что на самом деле отличает компании, которые получают пользу от автоматизации.

Читать далее

Как я строил ИИ-стартап, или Новые архитектурные риски 2026

Время на прочтение8 мин
Охват и читатели7.7K

За последние годы я выучил наизусть классический набор инженерных рисков — упадёт сервер, отвалится канал к ДЦ, крешнется хард, потеряются бэкапы — и набор готовых решений под них. Это азбука, которая казалась исчерпывающей.

Но 2026 год преподнёс мне сюрприз. Создавая свой ИИ-стартап, я понял, что мир изменился, и в нём появился целый новый класс архитектурных рисков — таких, о которых в моей азбуке не было ни строчки. И ровно об эти новые риски я и пошёл спотыкаться.

Итак, усаживайтесь поудобнее и слушайте историю — историю про путешествия… путешествия нашей инфраструктуры и о реалиях разработки современных ИИ-стартапов из Москвы. Я расскажу вам о настоящем инженерном приключении, которое со мной произошло в процессе построения сервиса Mimirjotun.ru.

Читать далее

Почему AI-агенты ломаются на длинных задачах — и как обвязка помогает им дописывать приложения

Уровень сложностиСредний
Время на прочтение22 мин
Охват и читатели7K

ИИ-агент может бодро начать писать приложение, но на длинной дистанции быстро всплывают привычные проблемы: потеря контекста, слабая самооценка, заглушки вместо функций и уверенное «всё готово» там, где пользовательский сценарий разваливается.

В статье будем разбираться, как архитектура обвязки помогает удерживать агента в рамках задачи: зачем нужны планировщик, генератор и оценщик, как QA-агент проверяет результат через Playwright MCP и почему по мере развития моделей саму обвязку приходится постоянно пересматривать.

Перейти к разбору
1
23 ...