Обновить
1024K+

Искусственный интеллект

AI, ANN и иные формы искусственного разума

2 194,17
Рейтинг
Сначала показывать
Порог рейтинга
Уровень сложности

Как я строю рекомендательную модель фильмов: cold start, вектор вкуса и GPT

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели437

Выбрать фильм на вечер сложно даже для одного человека.
А если фильм нужно выбрать для пары, где вкусы просто разные, задача становится ещё менее предсказуемой.

Обычные подборки, жанровые фильтры и списки “что посмотреть вечером” помогают только до определённого момента.
Они работают как витрина, но плохо работают как персональная рекомендация, потому что почти не учитывают зрительский опыт, индивидуальные предпочтения и то, какие фильмы человек вообще уже видел.

Именно с этой задачи я и подошёл к своему проекту NextFilm: не как к каталогу фильмов, а как к рекомендательной системе.
Основной вопрос звучал так: как выдать полезную рекомендацию новому пользователю, если на старте о нём почти ничего не известно.

По сути, в моём контексте это и есть cold start.
Не абстрактная проблема “мало данных”, а вполне прикладная ситуация: пользователь уже хочет получить рекомендацию, а система пока не знает, что он смотрел, насколько у него большая зрительская база и какие паттерны вкуса у него вообще есть.

Читать далее

Новости

Как я добавил в браузерного AI-агента поддержку MCP за вечер

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели1.2K

"Эта статья о том, как я n0x из просто болталки сделал агента который научился открывать браузер, делать скриншоты и выполнять команды

Вы когда-нибудь разговаривали с AI, и он в ответ на просьбу «открой Яндекс» писал вам: «Вот ссылка: https://yandex.ru»?

Я — да. И каждый раз мне хотелось сказать: «Спасибо, капитан Очевидность, я и сам это знаю».

Проблема в том, что большинство LLM-приложений — это просто болталки. Они генерируют текст, но не могут сделать что то полезное. А что, если бы AI мог управлять браузером? Открывать страницы, делать скриншоты, выполнять JavaScript?

В этой статье я расскажу, как добавил в проект n0x поддержку MCP (Model Context Protocol) — и научил AI-агента открывать сайты по команде «открой …».

Читать далее

OpenAI выпустила GPT-5.5 с акцентом на улучшение возможностей в области программирования

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели2.3K

OpenAI выпустила GPT-5.5, и это обновление выглядит довольно значительным, особенно если вас интересуют программирование, агенты и использование компьютеров.

Она лучше пишет код, более уверенно использует компьютеры и может выполнять больше задач, требующих автономной работы, без необходимости постоянного контроля с вашей стороны.

Модель уже доступна для пользователей тарифных планов Plus, Pro, Business и Enterprise в ChatGPT и Codex. Существует также более мощная версия под названием GPT-5.5 Pro, которая будет доступна пользователям Pro, Business и Enterprise.

Для разработчиков доступ к API указан как «coming soon». Печальной частью является цена. Она в два раза превышает цену за токен GPT-5.4, что, вероятно, станет предметом споров для многих разработчиков на этой неделе.

GPT-5.5 — это первый за долгое время релиз, который кажется чем-то большим, чем просто очередной номер версии.

По словам OpenAI, это первая полностью переобученная базовая модель со времен GPT-4.5. Скачок в тестах по агентному программированию, похоже, подтверждает это.

Давайте углубимся в детали.

Читать далее

SpaceX покупает Cursor, а Claude Mythos слили, угадав URL

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели2.7K

Седьмой выпуск еженедельных IT-новостей от OpenIDE: Anthropic выносит Claude Code из плана за $20, Duolingo перестаёт следить за потреблением ИИ сотрудниками, а четыре человека из Discord получают доступ к засекреченной модели просто потому, что правильно угадали адрес эндпоинта.

Читать далее

Голосовое управление роботом-перевозчиком паллет: что показал первый тест

Время на прочтение5 мин
Охват и читатели1.9K

Голосовое управление роботами часто выглядит как простая идея: человек произносит команду, робот ее распознает и выполняет действие. В бытовых сценариях мы уже привыкли к голосовым ассистентам, поэтому кажется логичным перенести тот же подход на складскую технику.

Читать далее

DeepSeek V4 vs Claude Sonnet 4.6: кто дешевле, кто умнее

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели2.7K

DeepSeek V4 в 3-4 раза дешевле Sonnet 4.6 на одинаковых задачах. На английских бенчмарках они почти равны, и интернет советует переходить на DeepSeek. Но что если прогнать обе модели на 50 типовых задачах российского разработчика? Разбор с цифрами и примерами.

Читать далее

Проектор, дрон, нейросеть: как технологии меняют работу в дизайне и оформлении пространств

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели2.1K

За 3 500 проектов по оформлению интерьеров мы прошли путь от малярной сетки до цифрового рабочего процесса. Рассказываю, что реально работает, что оказалось пустышкой — и какие технологии изменят эту индустрию в ближайшие 5 лет.

Читать далее

DataCopilot: строим мультиагентную архитектуру для работы с корпоративным хранилищем данных и документацией

Уровень сложностиСредний
Время на прочтение9 мин
Охват и читатели2.1K

Привет, Хабр! Меня зовут Максим Шакуров, я ML-инженер в VK.

Сегодня индустрия активно внедряет LLM для оптимизации рабочих процессов. Наша команда решила идти не от самой технологии, а от реальных потребностей. Чтобы найти процессы с наибольшим потенциалом для автоматизации, мы начали с аудита текущей рутины: проанализировали, с какими запросами аналитики и менеджеры приходят в чаты поддержки к инженерам Data Office (специалистам, отвечающим за сбор, хранение и миграцию корпоративных данных) и к разработчикам нашей платформы данных (команде, которая поддерживает и дорабатывает DWH).

Затем сформировали образ нашей будущей системы: она помогает ориентироваться в каталоге витрин, может рассказать, что и где хранится, помогает заполнить заявку на доступы, отвечает на вопросы по специфической документации и пишет скрипты, которые люди могут сразу забрать к себе в ETL-процессы. Под катом рассказали о том, что из этого вышло.

Почему рой, а не RAG

claude --model claude-opus-4-6

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели2.4K

Недавно вышла Claude Opus 4.7 флагманская модель от Антропик. В выпущенных пресс-релизах и графиках маркетологи обещали пользователям, что модель станет ещё умнее, ещё точнее и так далее. На деле же получился феерический провал. Под катом - подробности этой истории и рецепт возврата вашего душевного равновесия.

Читать далее

Интеллектуальная маршрутизация входящих документов: как мы наняли ИИ в диспетчеры документооборота

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели1.6K

Привет! Меня зовут Антон Топчиев, я ведущий аналитик команды продукта «Среда ЭДО» в МТС. Мы автоматизируем электронный документооборот и периодически делаем то, что обычно обещают на презентациях, — действительно снимаем рутину с людей. В том числе и с помощью искусственного интеллекта. 

Сегодня я расскажу, как мы реализовали систему интеллектуальной маршрутизации входящих документов. Спойлер: мы не убрали человека из контура полностью. Мы убрали просмотр бесконечной ленты входящих событий и оставили контроль там, где он действительно нужен.

Читать дальше

Полноценное управление Claude Code и Codex через Telegram

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели2K

Если коротко — я сделал телеграм-бота, через который можно общаться с Claude Code и Codex, запущенными на VPS. Бот жрет голосовые сообщения, картинки, файлы, пересланные сообщения, умеет пересылать файлы с VPS в Телеграм. Работает через tmux на сервере, поэтому умеет все, что умеют агенты, запущенные в терминале.

Проект опенсорсный, вы можете его установить, переделать под себя и пользоваться.

Github → https://github.com/pavel-molyanov/telegram-ai-agent 

Если подлиннее, то дальше расскажу, как оно работает.

Читать далее

$180 за три дня: история про архитектора, Cursor и пакет орешков

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели2.9K

$180 на Cursor за три дня. Три монитора. Пакет орешков. Ноль тестов. Бизнес в восторге. Команда в ужасе. Угадайте, кто победил.

Читать далее

Базовые модели для астробиологии: практический обзор

Уровень сложностиСредний
Время на прочтение57 мин
Охват и читатели1.9K

Это перевод работы группы астрономов и астробиологов, в которой рассматривается потенциал фундаментальных моделей (крупных нейросетей, обученных на больших массивах данных) для астробиологических исследований. Такие гибкие модели уже разрабатываются в NASA, они открывают новые возможности для быстрого создания приложений, интегрирующих разнородные мультимодальные данные. В статье представлены выводы и описаны ключевые направления для создания специализированной LLM, решающей задачи поиска биосигнатур, планирования космических миссий и обработки научной информации для нужд астробиологии.

Фактически, речь идёт о разработке специализированного суперинтеллекта-помощника астробиолога, в т.ч. интеллекта, работающего автономно на космических аппаратах (каким мы его видим в фантастических фильмах про космические миссии). Для всех, интересующихся [корректным и осторожным] использованием ИИ для анализа астрономических данных.

Читать далее

Ближайшие события

Kandinsky 6.0 Image Pro — новый уровень редактирования изображений

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели3.2K

В конце прошлого года на конференции AI Journey мы открыли доступ к линейке моделей Kandinsky 5. Сегодня мы представляем масштабное обновление — единую модель генерации и редактирования изображений Kandinsky 6.0 Image Pro!

Читать далее

Первый шаг к кандидатской

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели1.8K

Не так давно я встретился с замдеканом факультета прикладной информатики,  на котором учился. Как в фильме «Начало» он прокинул мне мысль, что мне нужно защитить кандидатскую диссертацию. Говорит, будешь приезжать к нам на факультете лекции читать.
Стало интересно разобраться и оценить что потребуется. 

Читать далее

Прогнал 6 апрельских LLM через battle test. Победил не самый новый и не самый дорогой

Уровень сложностиСложный
Время на прочтение7 мин
Охват и читатели2K

DeepSeek V4 Pro вышел 24 апреля. Огромная модель, топ AIME и SWE-bench, передовая reasoning-архитектура. Я ждал Tier S — 95+ из 100 в нашем battle test на русском контенте. Получил 89. Запустил его собственный Flash — 83. Pro выше на 6 пунктов, но в 13 раз дороже. Перетестировал Qwen 3.6 Plus, который вышел на 22 дня раньше V4 Pro: 92 балла. Старый Qwen обогнал новейший флагман DeepSeek и по качеству, и по цене. В статье: парадокс Pro vs Flash с экономикой production, гипотезы почему reasoning-оптимизация не вытягивает narrative, обновления методологии (max_tokens, paid re-test), формула score-per-dollar и обновлённые рекомендации.

Читать далее

Как я написал антиспам-бота (TAB) для Telegram на собственной нейросети

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели1.8K

Привет, Хабр!

Решил наконец‑то рассказать о проекте, который уже полгода живёт в тени моего личного репозитория. Речь пойдёт о боте для борьбы со спамом в Telegram‑чатах. Это не просто «очередной антиспам бот», а решение, которое я писал с нуля, включая архитектуру нейросети для классификации текстов.

Забегая вперёд: бот бесплатный и открытый к тестированию. И он работает. Но обо всём по порядку.

Читать далее

Найти специалиста по ИИ через SpeShu.AI: в России появился сервис AI-Профи для бизнеса

Время на прочтение2 мин
Охват и читатели1.8K

В первом квартале 2026 года российские работодатели разместили больше 16,5 тыс. вакансий, где требовались навыки работы с ИИ или готовность осваивать нейросети. Это в 2,7 раза больше, чем годом ранее. 

Платформа SpeShu.AI представила сервис AI-Профи, который помогает компаниям быстро находить специалистов по искусственному интеллекту под конкретные бизнес-задачи. Новый инструмент позволяет в несколько кликов оставить заявку и получить отклики от релевантных экспертов из базы сервиса.

Узнать больше

Рекомендательные системы для бизнеса — мой опыт разработчика

Уровень сложностиСредний
Время на прочтение18 мин
Охват и читатели1.8K

Если вы видели "С этим товаром покупают…", "Попробуйте этот урок дальше" или ощущали необычную точность автоподбора треков в музыкальных сервисах - вы сталкивались с рекомендательной системой.

Но стоит ли конкретному бизнесу вообще её строить? И если да, то с чего начать, чтобы не потратить впустую месяцы инженерного времени на "чёрный ящик", который никто не понимает?

Эта статья написана мной РУКАМИ (не "ИИ") и основана на моём выступлении-вебинаре для инженеров, предпринимателей и продуктовых специалистов. Я не ML исследователь и не публичный спикер - я фулстек-разработчик, который создавал и поддерживал рекомендательные системы в разнообразных коммерческих проектах.

Целевая аудитория - все, кому интересна эта тема.

Читать далее

10 настроек Claude Code, до которых большинство разработчиков не доходит

Уровень сложностиПростой
Время на прочтение13 мин
Охват и читатели4.2K

Ранее я писал про утечку исходного кода Claude Code. 512 000 строк, KAIROS, упоминания нерелизнутых моделей Opus 4.7 и Sonnet 4.8. Так вот. В актуальном Claude Code уже есть Opus 4.7. Ровно как и было в leaked-коде. Вместе с ней появился новый уровень /effort xhigh - это мы сегодня тоже разберём.

В первой части я показал что Claude Code умеет из коробки. Типовой сценарий после этого: "понял, установил, пользуюсь". И дальше тот же потолок что у всех - Claude работает быстро, но как-то странно. Отвечает не то, повторяет одно и то же к концу сессии, просит разрешения на каждый чих, жрёт токены как не в себя.

Это решается настройками. Конкретными. Которые лежат в двух файлах и никто до них не доходит.

Ниже десять вещей которые я настроил за полгода работы с Claude Code и которые сделали разницу между "работает" и "работает как отдел". С готовыми конфигами. Копируй, вставляй, меняй под себя.

Читать далее
1
23 ...