Обновить
1024K+

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 194,83
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Почему LLM-агенты в CI/CD выбирают читерство вместо решения задачи

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели1.6K

LLM-агенты отлично решают алгоритмические задачи. Но что произойдет, если поместить их в реальную инфраструктуру – с CI/CD, branch protection и security-политиками?

Я провел эксперимент: дал агентам простую задачу – внести изменение в репозиторий и замерджить его в main, соблюдая все правила. При этом у них был доступ к тем же инструментам, что и у разработчика, включая GitHub CLI и админский токен.

Результат оказался немного неожиданным. Практически все модели успешно выполнили задачу, но ни одна так, как я ожидал.

Читать далее

Новости

AI для умного дома: что уже работает сегодня (часть 1)

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели6K

В статье — не просто список инструментов, а как они сочетаются, какие подводные камни ждут при развёртывании, какие цифры можно ожидать по производительности и как обойти ограничения Llama 8B без облачных кредитов.

Читать далее

Человек после цифровой эпохи (Часть 2)

Время на прочтение4 мин
Охват и читатели5.9K

Продолжение статьи посвященной тому, как цифровая эпоха меняет не только технологии, но и самого человека: труд, свободу выбора, роль творчества и границы ответственности. Это попытка честно посмотреть в будущее без паники и иллюзий — для тех, кто привык не потреблять готовые ответы, а думать.

Читать далее

Топ локальных нейросетей 2026: полный суверенитет без интернета

Уровень сложностиСредний
Время на прочтение13 мин
Охват и читатели6.4K

Я долгое время была в отношениях с облачными нейросетями. Это было удобно, даже комфортно. Открыла браузер, написала промпт и через пару секунд получила ответ. Но в последнее время отношения начали давать трещину.

Интернет стал неотъемлемой частью нашей жизни, но в 2026 году мир переживает непростые времена. Ситуация крайне нестабильна, и это вызывает у каждого чувство неуверенности. Возникает закономерный вопрос: а можно ли как-то подстраховаться? Чтобы нейросеть всегда была под рукой, даже когда провайдер решил устроить себе выходной или на телефон пришло очередное оповещение о беспилотной опасности.

Оказалось, что можно. И не просто можно, а вполне себе комфортно.

К 2026 году локальные нейросети доросли до того состояния, когда их действительно имеет смысл использовать. Не как хобби для гиков с тремя видеокартами в башне, а как рабочий инструмент. Они всё ещё требуют некоторых технических знаний (куда без них). Но порог входа заметно снизился.

В этой статье я собрала шесть инструментов, которые работают полностью без интернета. Ну, почти полностью - устанавливать их придётся онлайн, но после этого можно смело отключать Wi-Fi и наслаждаться цифровым суверенитетом.

Приятного прочтения!

Читать далее

Десятилетняя вражда, формирующая будущее ИИ

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели6.8K

Ещё до споров из-за применения Пентагоном искусственного интеллекта Дарио Амодеи всё активнее нападал на своего бывшего начальника Сэма Альтмана и на курс развития OpenAI — компании, которую они вместе выстроили.табачным компаниям, сознательно сбывающим вредоносный продукт.

В последние месяцы генеральный директор Anthropic в общении с коллегами сравнивал судебную тяжбу между Альтманом и Илоном Маском с борьбой Гитлера и Сталина1, называл злом пожертвование в $25 миллионов долларов, которое президент OpenAI Грег Брокман направил в протрамповский суперкомитет политических действий2, и в речах уподоблял OpenAI и других соперников табачным компаниям, сознательно сбывающим вредоносный продукт.

Читать далее

OpenAI: сделка с Пентагоном, бойкот, иск на $134 млрд и война. Полная хронология краха

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.2K

В феврале CEO Anthropic заявил, что не может «по совести» дать Министерству обороны неограниченный доступ к своим ИИ-системам. Через несколько часов администрация Трампа назвала Anthropic риском для цепочки поставок. Ещё через несколько часов Сэм Альтман подписал сделку.

Позже он признал, что это «выглядело оппортунистично и небрежно», но он был 1) нечестен и 2) слишком поздно.

Удаления ChatGPT выросли на 295% в тот же день. Бойкот под названием QuitGPT собрал 2,5 миллиона участников за неделю (4 миллиона на момент написания). Claude стал самым скачиваемым бесплатным приложением в US App Store. Глава робототехники OpenAI публично уволился. Сотни сотрудников подписали открытое письмо в поддержку позиции Anthropic.

Тротуар у офиса OpenAI в Сан-Франциско покрылся граффити: «you suck».

Это движение против OpenAI не убьёт лидерство ChatGPT, но оно разрушит её имидж безвозвратно. Рынок может не заботиться о морали, но он заботится об оптике.

Читать далее

Как распознавать контент, созданный нейросетями (рекомендации для репортеров)

Время на прочтение24 мин
Охват и читатели6K

В наши дни соотношение полезного сигнала и шума в информационном пространстве приближается к единице. Иными словами, дезинформации почти столько же, сколько реальных фактов — и отличить одно от другого становится крайне трудно. Эти рекомендации помогут журналистам в условиях нехватки времени распознавать контент, сгенерированный с помощью ИИ. Предложенные семь категорий проверок полезно освоить каждому репортеру.

Я помогаю редакциям бороться с дезинформацией. И вот что меня особенно тревожит: обычная проверка фактов занимает несколько часов или даже дней, а ИИ способен производить фейковый контент за считаные минуты.

(Эта статья является переводом, а обложку мне прислал институтский коллега. По русскому языку Gemini вместе с Nano Banana пока ставим уверенную «двойку»)

Читать далее

KPI по ИИ: как «эффективность» убивает мотивацию разработчика (и при чем тут синдром самозванца)

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели6.4K

Всем привет. Меня зовут Максим, я разработчик в одном из крупных финтехов России. У нас сейчас (наверно, как и у всех) интенсивно вводят ИИ-агенты для написания кода. Плюс необходимое соблюдение метрик по охвату и использованию данных агентов.

Но никто не задумывается о состоянии души разработчика при KPI обязательного использования ИИ.

Читать далее

Вайбкодинг по Chess’ноку. 1. e4

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели5.5K

От вайбкодинга к профессиональной ИИ-разработке на примере LanChess: 3300 промптов, 832 коммита, 100 тыс. строк кода и путь от POC к продакшен-сервису.

Поздний вечер, я смотрю в терминал. Celery worker на восьмиядерном сервере перемалывает 67 партий блица на Lichess одного из пользователей. Через минуту этот человек получит персонализированную аналитику и упражнения от сервиса, аналогов которого в России найти пока не удалось. Я же сижу и думаю, стоит ли выводить этот сервис из закрытого режима по инвайтам.

Менее чем за 3 месяца я написал 100 тыс. строк кода и ни одной — своими руками. Мне пришлось стать оператором персональных данных. РКН порекомендовал мне убрать авторизацию от Google. А ВК не давал мне подключить свою авторизацию, пока я не стал самозанятым.

Зато теперь у меня есть свой сервис, на примере которого без всяких NDA я могу открыто рассказывать о том, чем отличается вайбкодинг от профессиональной ИИ-разработки. Могу смело поделиться статистикой продуктивности. Могу, не таясь, рассказать о сложностях, ошибках и успехах, с которыми сталкиваются инженеры, использующие самые современные инструменты искусственного интеллекта для разработки программного обеспечения. С помощью ИИ я работал над разными проектами за последние годы. Но только о своём я могу рассказать всё.

Читать далее

На шаг ближе к Скайнету: научились ли нейросети умножать?

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели5.8K

Занимаясь созданием систем искусственного интеллекта, не перестаешь удивляться, из каких порой «костылей» состоят настоящие чудеса прогресса. Например, знаете ли вы, что даже самые современные нейросети фундаментально не умеют перемножать два числа? Они не считают в привычном нам смысле, а скорее запоминают и аппроксимируют ответы.

Как так вышло, что ИИ пишет код и сочиняет стихи, но буксует на таблице умножения?

Давайте разбираться

Я не программист. Я два месяца учил нейросеть не подлизывать

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.2K

Нейросеть хвалила мой говнокод и помогала закопать проект. Я психанул и два месяца строил инструкцию, которая убивает подлизу. Это история о том, что вышло.

Читать далее

Одна AI-голова — хорошо, а две — от разных вендоров лучше. Как заставить Claude и Codex спорить между собой

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели5.7K

Недавно OpenAI выпустил опенсорсный плагин, который даёт Claude Code структурированную интеграцию с Codex. Кроме того, всё работает прямо из VS Code через Claude Code Extension. По моему опыту даже в задачах, не связанных с кодом, две "AI-головы" дают результаты лучше, чем одна. У одиночного AI нет стимула оспаривать свои выводы, да и ограничен он своими условиями обучения. Но раньше взаимодействием двух AI было не очень комфортно управлять. С новым плагином стало удобнее, а с дополнительными скиллами для Claude Code еще удобнее. Ниже про скиллы, которые превращают AI-советчиков в структурированных оппонентов. 

Пока я не разобрался как использовать плагин эффективно, получал такие диалоги:

Читать далее

Реверс-инжиниринг безымянного табло электронной очереди: когда 1 бит весит целый байт, а математику за тебя делает ИИ

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели5.5K

Я работаю в компании, которая разрабатывает и продаёт систему электронной очереди. Пришёл недавно, успел написать веб-клиент для их очереди — общение по SOAP, веб сайт, талоны с QR кодом, ничего особенного. Потом руководство поставило задачу: интегрировать физическое табло с вызовом клиентов через веб. Старое десктопное приложение как-то умеет зажигать на нём цифры — надо сделать то же самое, но из веба.

Окей, задача понятная. Первым делом пошёл к тем, кто делал это приложение.

Читать далее

Ближайшие события

Нельзя так просто взять и внедрить LLM в прод: как управлять ИИ-системами в компании

Время на прочтение12 мин
Охват и читатели5.4K

Большинство ИИ-агентов выглядят классно в демках, но в проде они не справляются с реальными бизнес-задачами.

Проблема обычно не в самой модели, а в том, что сама по себе LLM не несет большой ценности для бизнеса. Ценность создает только ИИ-система с правильным контекстом, метриками качества, ограничениями, безопасными интеграциями и понятной ролью человека в процессе.

В статье разбираю, почему между классной демкой и продом такая пропасть, из чего на самом деле состоит зрелая LLM-система в компании и почему будущее не за “самой умной моделью”, а за самой управляемой ИИ-системой.

Читать далее

Глухой телефон для ИИ: мы замерили физику LLM-графов и поняли, почему добавление агентов всё ломает

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели4.9K

Индустрия ИИ переживает бум мультиагентных систем. Кажется, рецепт AGI найден: просто соедините 10 умных нейросетей в команду, дайте им роли, и они свернут горы.

Но на практике мы часто сталкиваемся с магией «черного ящика». Иногда агенты действительно решают сложнейшие задачи. А иногда - скатываются в бесконечные галлюцинации, теряют контекст и выдают результат хуже, чем базовая модель соло. Индустрия решает эту проблему в стиле средневековых алхимиков: «просто добавьте еще агентов» или «дайте им больше токенов на болтовню». Никто не измеряет физику процесса.

Мы решили, что с нас хватит алхимии. Нам понадобился измерительный прибор - эдакий МРТ-аппарат для мультиагентных сетей, который покажет механику общения LLM изнутри.

Так появился опенсорсный проект llm-coordination-harness - строгий измерительный стенд (measurement rig), который доказывает, что у общения нейросетей есть своя физика, которую можно и нужно измерять.

Под катом рассказываем и показываем на графиках. Никаких заявлений про AGI - только честный хардкорный ресёрч, физика графов и отрицательные результаты, которые оказались важнее положительных.

Заглянуть в черный ящик

Сэм Альтман подтвердил, что ИИ-пузырь начал сдуваться

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели13K

И, возможно, мы наблюдаем именно это. OpenAI умерила свои аппетиты. Она сократила прогнозные инфраструктурные расходы до 2030 года с $1,4 трлн до $600 млрд — минус 57%.

По сути, OpenAI признала, что её собственный нарратив о триллионе долларов на вычисления был блефом. Переход от $1,4 триллиона к $600 миллиардам — это не стратегический разворот. Это вынужденное отступление.

Читать далее

Как не превратить ИИ в машину выгорания: протоколы, итерации и культура

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели3.7K

Начнём с разбора людей, их ролей и мотиваций.

Возьмем классическую ролевую модель, пока на операциональном уровне.

Управляющий — исполнитель

Управляющий (менеджер, тимлид) — заинтересован в росте метрик и выполнении большего объёма задач за более короткий срок.

Исполнитель — заинтересован в том, чтобы выполнить нужный поставленный объём задач в сжатые сроки.

На выходе мы имеем такую картину:

Исполнителю приходит больший объём задач, но он получает меньше качественной положительной стимуляции.

Управляющий доволен тем, что метрики растут, и радостно несёт результаты руководству.

Как это может выглядеть в работе?

Исполнитель вбивает промпт — потом тратит кучу времени на работу с по сути чужим результатом, что ощущается рутинно и не даёт чувства авторства (в сценарии, где правками занимается он сам).

Объём выполненных задач растёт, но человек испытывает дефицит качественной стимуляции и утопает в рутинных правках, не получая глубокого удовлетворения. Потому что ощущение «задача решена» он получил ещё в начале процесса, а за этим последовало длительное внесение корректировок.

Как это связано с выгоранием и какой тут может быть цикл?

ИИ внедряется — исполнитель получает кратковременный рост возбуждения и чувство собственной эффективности. Ему кажется, что он выполняет больший объём задач за более короткий срок. Но сам формат «сделал промпт — получил ответ — потратил время на правки — закрыл таск» имеет существенные минусы.

Такой подход очень быстро истощает, потому что снижает уровень глубокой вовлечённости в процесс и заставляет человека чувствовать себя продолжением машины, а не машину — продолжением себя. Краткосрочно это может давать более высокие результаты, но на дистанции приводит к выгоранию и текучке кадров.

Читать далее

Veo 3.1 бесплатно — 10 генераций видео в месяц для любого аккаунта. Разбираю, что реально можно получить

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели4.2K

Google отдала Veo 3.1 бесплатно — 10 генераций видео в месяц для любого Google-аккаунта. Без карты, без подписки. Протестировал: 720p, до 8 секунд, с нативным звуком. Физика убедительная, свет и тени — на уровне. OpenAI свернула Sora не просто так. Разбираю, что реально получаешь, где ограничения, и даю советы по промтам, чтобы не тратить генерации впустую.

Читать далее

Сбежать из квест-комнаты или притвориться «кожаным мешком» — необычные бенчмарки для нейросетей

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели4.8K

Мы в Beeline Cloud рассказывали о необычных бенчмарках для оценки больших языковых моделей (БЯМ) — например, когда нейросетям предлагают нарисовать пеликана на велосипеде или разобрать по косточкам шутку из британского юмористического шоу.

Недавно в сети стал вирусным еще один тест, в котором чат-ботов просили ответить на простой вопрос — как лучше добраться до автомойки: пешком или на автомобиле? Задача с подвохом, и далеко не все модели с ней справляются. Сегодня расскажем о других необычных тестах, авторы которых пытаются «подловить» нейросети.

Читать далее

Renga API: автоматизируем автоматизацию с помощью ИИ-агентов

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели4.8K

Щупаем внутренности Renga. В этой статье залезу под капот к отечественному ПО и разберу его API. Сравню с западным конкурентом и заставлю подружиться с ИИ.

В этой статье:

- посмотрим на суть API - тут будет не пересказ примеров из SDK, а общий взгляд на технологию
- сравним с Revit API
- подключим ии-агента к Ренге и заставим работать

Читать далее
1
23 ...