Обновить
1146.29

Искусственный интеллект

AI, ANN и иные формы искусственного разума

Сначала показывать
Порог рейтинга
Уровень сложности

Пишем свою ноду в n8n под любой API за вечер

Время на прочтение8 мин
Количество просмотров5.2K

Сегодня многие разработчики различного уровня знают n8n как гибкий инструмент для автоматизации. В нем можно собрать почти любой сценарий - от простейшего Telegram-бота до сложных бизнес-процессов, используя множество готовых нод (узлов) для работы с популярными сервисами.

Но что делать, если в это множество не входит один из используемых вами сервисов, а через ноду HTTP Requests работать крайне сложно и неудобно? Или, может, хочется подключить собственный API и работать с ним по собственной логике?

Здесь напрашивается довольно простой ответ: написать свою ноду на n8n. Изначально это кажется сложным, однако, прочитав эту статью, вы сможете буквально за 1 вечер собрать минимально-рабочую ноду под ваши "хотелки".

Читать далее

Умный Early Stopping: обучаем нейросети, анализируя тренд, а не шум

Уровень сложностиСредний
Время на прочтение3 мин
Количество просмотров387

Классический Early Stopping часто преждевременно завершает обучение, путая шум с ухудшением качества. В этой статье я покажу, как добавить анализ тренда чтобы модель останавливалась не по случайным колебаниям, а по тенденции метрики.

Читать далее

x402 и MCP для чайников

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров3.1K

С появлением всё большего количества сервисов/агентов/платформ/llm-юзеров встал вопрос о встроенной и универсальной оплате. Одним из самых лучших ответов на этот вопрос становится протокол x402.

x402 - это протокол от Coinbase, продолжение инициативы от Google с их AP2.

x402 позволяет делать нативные платежи для http-интерфейсов. Запрос->Заголовок->Оплата->Результат. Без карт, лишних кабинетов с балансами, и прочей мороки. Любой веб-ресурс или API может запрашивать оплату, а клиент (человек/агент/бот) могут оплачивать с помощью блокчейн транзакций.

Для тех, кто создаёт MCP, это колоссальный буст: наконец-то появляется монетизация. Каждый вызов вашего API, может быть платным, или только методы подписки или pro-функций, могут быть платными.

Возможность монетизации выведет на рынок большое количество платных MCP, а вслед за ними начнётся настоящий бум всевозможных бесплатных MCP (запись в салон красоты/спа/итд).

Протокол работает на HTTP 402 ответе. В связи с тем, что никто его толком не использует, и он десятки лет остался свободным, сейчас наконец появляется применение.

Читать далее

Нарративный двигатель LLM. Критика промптинга

Уровень сложностиПростой
Время на прочтение13 мин
Количество просмотров2.8K

Человечество тысячелетиями рассказывало истории, а теперь на этих историях учатся LLM.

Что такое нарратив? Это история с сюжетом, помните? — Город, герои и возвращение. Но мы не будем углубляться в философскую глубину, где люди создают историю, чтобы осмыслить себя и свой опыт (желающие могут почитать Karl E. Weick), а рассмотрим, как можно применить нарративы в понимании работы LLM.

Читать далее

Эволюция протоколов встреч: от листка в блокноте до ИИ-ассистента

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров717

Когда люди начали собираться для обсуждения — будь то советы, кружки, комитеты — кого-то назначали фиксировать, «протоколировать». Чаще всего это была простая запись вручную: кто присутствовал, что обсуждали, какие решения приняты. Такой подход живёт даже сегодня в небольших организациях.

Писец или секретарь сидит, слушает, старается ухватить суть — и записывает тезисами. Часто ему приходится буквально читать между строк: что важно — что нет.

Позже, в XIX–XX веках, появились стенографические методы: сокращения, скоропись — чтобы не упускать ход речи. Но даже стенографист не успевал за несколькими говорящими подряд.

Читать далее

Почему ИИ-агенты для интерфейсов учатся в симуляции лучше, чем в реальности

Время на прочтение4 мин
Количество просмотров767

ИИ с каждым годом становится умнее — на тестах и демонстрациях модели поражают логикой и ловкостью, но стоит выпустить их в реальный интернет или мобильное приложение, как начинается череда странных ошибок. Почему даже продвинутые агенты испытывают сложности на обычных сайтах и кнопках, хотя под капотом у них миллиарды параметров?

Новое исследование показывает, что дело вовсе не в дефиците данных. Оказывается, гораздо эффективнее обучать ИИ на сгенерированных симуляциях интерфейсов, а не на живых задачах из реального мира — и на выходе агенты становятся не только умнее, но и куда более стойкими к любым неожиданностям.

Разбираемся, как современные подходы меняют понимание того, что значит "обучить ИИ действовать по-человечески" — и почему выигрывает не тот, кто учится в реальности, а тот, кто научился играть с фантазией.

Читать далее

Краткий обзор 10 локальных UI для LLM

Время на прочтение4 мин
Количество просмотров9.5K

На просторах интернета можно найти множество интерфейсов для LLM. Все они довольно разношерстные и обладают разным функционалом: от простых чатов до почти энтерпрайз-приложений.

Я установил и опробовал 10 них (на самом деле больше, но нормальных только 10 :) В этой статье найдете их краткий обзор.

Мои курсы: Разработка LLM с нуля | Алгоритмы Машинного обучения с нуля

Читать далее

Почему разработчики не доверяют вайб-кодингу и как это исправить

Время на прочтение7 мин
Количество просмотров5.4K

По-моему, вайб-кодинг — полезная фича, но я знаю, что многие его недолюбливают и считают, что AI генерит чушь, а не нормальный код. Ну тут я могу сказать как в той рекламе с гепардом: «Ты просто не умеешь их готовить».

Я начал заниматься вайб-кодингом 2 года назад (привет первая версия GPT Engineer), то есть еще до того, как ввели сам термин (он появился только в этом году). За это время у меня накопился опыт, который я переложил в небольшие рекомендации, возможно они помогут начинающим вайб-кодерам.

Вообще вайб-кодинг, это, конечно, огромная тема. Думаю, сделать серию из нескольких статей: здесь начну с теории, а потом покажу практику, как я настраиваю окружение и вообще весь процесс.

Читать дальше

Обзор книги Харари «Нексус. Краткая история информационных сетей от каменного века до искусственного интеллекта»

Уровень сложностиПростой
Время на прочтение12 мин
Количество просмотров832

Уже год назад вышла новая книжка Юваль Ноя Харари "Нексус. Краткая история информационных сетей от каменного века до искусственного интеллекта".
Предыдущие его книги (особенно "Sapiens") были настоящими хитами. Но Nexus, к сожалению, не переведён на русский. Есть опасения, что перевода и не появится в обозримом будущем.

Книга посвящена истории и будущему информационных сетей человечества, с особым акцентом на искусственный интеллект.

Предлагаю читателю мой краткий пересказ.

Читать далее

Обработка музыки с помощью Python: от вайбкодинга до мастеринга в один клик

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров3.2K

Продолжаю рассказывать, как я в одного делаю проект - сайт, радио и медиаплатформу для своей музыки. В первой части был фронт и админка, теперь - как я встроил мастеринг аудио через Python сервис, чтобы не бегать по разным сайтам и не возиться с Audacity. Ну и немного про вайбкодинг - куда ж без него.

Читать далее

Мастерски снижаем затраты на токены LLM

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров4.1K

Статья про неконтролируемый рост сжигания токенов и как это угрожает юнит-экономике вашего стартапа. Делюсь ключевыми уроками, позволившими мне сократить расходы. Эти шаги стали критически важны при масштабировании до 30 000 пользователей.

Читать далее

601 уголовное дело за 6 месяцев в 2025: «набеги» за нарушения в сфере персданных и ИИ

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров2.8K

В статье кратко расскажу об изменениях в законодательстве 2025-2026, связанных с использованием искусственного интеллекта и обработке персональных данных. На примерах покажу, за что могут «прилететь» огромные штрафы и даже уголовная ответственность.

Начну с шокирующей статистики, которая уже стала новой реальностью:

За 6 месяцев 2025 г. возбуждено 601 уголовное дело по статьям, связанным с нарушением обработки персональных данных и неправомерным использованием искусственного интеллекта;

Штрафы в сфере нарушения обработки персональных данных, особенно биометрических, достигают теперь 500 миллионов рублей при повторных нарушениях;

В России запрещены 68 иностранных сервисов, в том числе Google Forms, Google Analytics и многие другие популярные инструменты;

Заблокировано 1700+ интернет-ресурсов в связи с использованием запрещенных сервисов и нарушением правил обработки персональных данных.

Читать далее

BERT — это всего лишь одноэтапная диффузия текста

Время на прочтение9 мин
Количество просмотров1.9K

Некоторое время назад компания Google DeepMind представила Gemini Diffusion — экспериментальную языковую модель, генерирующую текст методом диффузии. В отличие от традиционных моделей, написанных в стиле GPT и генерирующих слово за словом,  Gemini создаёт текст целыми блоками, пошагово уточняя случайный шум.

Я прочитал статью «Large Language Diffusion Models» — и с удивлением узнал, что дискретная диффузия языка представляет собой просто обобщение метода генерации пропущенного токена (MLM), практикуемого уже с 2018 года. Я сразу подумал: «А можно ли тонко настроить BERT-подобную модель так, чтобы приспособить её к генерации текста?» Из чистого любопытства решил наскоро набросать проверку концепции.

Примечание: уже после того, как написал эту статью, я наткнулся на исследование DiffusionBERT, где сделано практически то же самое, что и у меня, но проект гораздо тщательнее протестирован. Посмотрите этот пост, если тема вас заинтересовала.

Читать далее

Ближайшие события

ТОП-10 ошибок при работе с нейросетями: как не тратить время впустую

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров8.8K

Доброго времени суток, «Хабр»!

Сижу и понимаю, что в моём профиле уже висит приличное количество статей на тему нейросетей. Конечно, мой список нельзя сравнить с теми авторами, кто уже год и больше публикуют свои работы, но для меня это уже достижение. Немного отвлекся, продолжим: рассмотрел я уже разные темы — от простых историй развития искусственного интеллекта до подробностей архитектуры и техники составления промтов.

Сегодня мы поговорим о десяти ошибках при работе с нейросетями, которые допускают многие из нас. Я приведу рекомендации, чтобы избежать этих проблем и получить нужный результат.

Приготовьтесь, начинаю рассказ!

Читать далее

Как мир регулирует ИИ

Время на прочтение9 мин
Количество просмотров1.4K

К 2025 году в мире искусственного интеллекта уже больше нормативных документов, чем рабочих моделей. США публикуют руководства для безопасного использования LLM, Европа принимает AI Act, в ОАЭ и Сингапуре появляются свои принципы ответственного ИИ. Россия тоже не стоит в стороне и нормативные требования активно у нас разрабатываются.

Уже действующие и готовящиеся нормы ЕС, США, Китая и России требуют от ИБ не просто контроля моделей, но и полноформатного аудита, документирования и управления реальными угрозами.

Мы в HiveTrace внимательно следим за этой эволюцией из практической необходимости: от того, как быстро и в каком направлении будет развиваться регуляторика, зависит, какие функции мы добавим в продукт завтра.

Читать далее

Агентная операционная система — новая парадигма взаимодействия человека и машины

Время на прочтение4 мин
Количество просмотров1.7K

Раньше голосовой ассистент в телефоне был просто еще одной кнопкой — попросил включить будильник, получил результат и разговор закончен. Но мобильные интерфейсы усложнились: привычные сценарии часто ломаются, если что-то изменилось на экране. На практике выясняется, что ИИ-агенты, даже самые продвинутые, часто путаются в простых вещах — теряют суть задачи, не могут учесть предпочтения человека и забывают свои же действия спустя пару шагов.

Исследователи показали, что дело не столько в размере моделей, сколько в том, как они учатся рассуждать и адаптироваться к реальному взаимодействию. Вместо агента, который просто кликает за пользователя, появился агент, который держит контекст, реально пытается понять, что именно нужно, и даже сам уточняет детали по ходу сценария.

В этом обзоре посмотрим, как шаг за шагом учат такие модели быть ближе к человеку — помнить, ошибаться и учиться на своих ошибках, идти навстречу даже в нестандартных ситуациях. Это меняет представление о будущем ИИ-систем и показывает, на что они будут способны буквально завтра.

Читать далее

От визуализации к действию: как ДРАКОН+LLM может стать фундаментом для агентских ИИ

Уровень сложностиПростой
Время на прочтение14 мин
Количество просмотров2.2K

95% корпоративных ИИ-пилотов проваливаются. IBM Watson Health - $62 млн впустую, Zillow - $880 млн убытков, McDonald’s - чат-бот, заказывающий 260 наггетсов. Почему? Потому что компании внедряют ИИ вслепую, без понимания своих процессов.

Но есть и другой путь. В этой статье я показываю, как связка ДРАКОН + LLM превращает хаос в управляемую систему и становится фундаментом для агентских ИИ.

Вместо «чёрного ящика» - понятная визуальная карта, где каждый шаг прозрачен.
Вместо слепого доверия - гибридный процесс: человек и ИИ делят зоны ответственности.
Вместо провала - три уровня автоматизации, от 30% до 70%, с чёткими расчётами времени, рисков и ROI.

На примере сети СТО мы показываем:

как LLM на основе ДРАКОН-схемы проектирует агентов для записи клиентов, управления складом и поддержки механиков,

как сократить время на создание ТЗ с месяца до недели,

как избежать «ученика Герострата» - человека, который разрушает будущее, не понимая, что делает.

Это не теория. Это инженерный план:

Уровень 1: 5-7 часов экономии в неделю, риск провала - 5%,

Уровень 2: 15-20 часов, риск - 20%,

Уровень 3: 30-35 часов, риск - 35%.

И всё это - на открытых, доступных инструментах: Llama 3, Mistral, Qwen и языке ДРАКОН, который понимает и директор, и программист.

Потому что реальный ужас - не в том, что ИИ захочет нас уничтожить. А в том, что мы сами разрушим бизнес, не понимая, как работает то, чем управляем.

Статья для тех, кто устал от хайпа и хочет действовать - с пониманием, а не на авось.

Читать далее

Нейросети в реальных задачах агентства: обучение сотрудников, создание фото, тексты, HR, документы

Уровень сложностиПростой
Время на прочтение11 мин
Количество просмотров1.5K

Привет, Хабр! Я генеральный директор digital-агентства Panda Family, и сегодня хочу поделиться нашим практическим опытом внедрения нейросетей в задачах агентства. Речь пойдет не о теоретических возможностях, а о реально работающих кейсах в 5 ключевых процессах: создание экспертного контента, онбординг сотрудников, обработка тысяч товаров, документооборот и дизайн.

Забегая вперед, волшебной пилюли по решению всех проблем не будет, как и рассказов о том, как мы стали зарабатывать в 50 раз больше, тратя на это в 10 раз меньше времени. Но, надеюсь, будет полезно тем, кто собирается внедрять нейросети в свои бизнес-процессы, даже если они не касаются маркетинга и контента. Ведь основная трудность и боль не в технологиях и процессах, а в людях, которые этими технологиями должны пользоваться.

Читать далее

Как я экономлю на инференсе LLM-модели в облаке и не теряю в качестве

Время на прочтение7 мин
Количество просмотров3K

Если вы читаете этот текст, скорее всего, вы уже пробовали запустить LLM самостоятельно. И, вполне вероятно, столкнулись с одной из типичных проблем:

«Заказал GPU, загрузил модель, а она не влезла, хотя по расчетам памяти должно было хватить».

«Платим за A100, а реально используем лишь 30% ее мощности».

Привет, я Павел, ML-инженер в Cloud.ru. И я прошел через эти проблемы сам, поэтому не понаслышке знаю, как это может раздражать.

Сегодня на примере настройки фреймворка VLLM покажу, как запускать крупные языковые модели без переплат за GPU. Мы разберемся, как VLLM распределяет vRAM, какие его параметры действительно влияют на потребление памяти и производительность, и как с их помощью гибко управлять балансом между затратами, скоростью и качеством модели.

Читать далее

Нейро-дайджест: ключевые события мира AI за 4-ю неделю октября 2025

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров1.7K

Привет! Это новый выпуск «Нейро-дайджеста» — коротких и полезных обзоров ключевых событий в мире искусственного интеллекта и технологий.

Неделя выдалась интересной: Anthropic выкатили лёгкую Claude Haiku 4.5, Suno 4.5 открыли бесплатно, Microsoft включила голосового агента в Windows 11, а OpenAI показали ИИ-браузер ChatGPT Atlas, пока ИИ уже пишет половину текстов в сети.

Всё самое важное — в одном месте. Поехали!

Читать дайджест →

Вклад авторов