Вторая часть про Tier 1 "AI tools", первая тут https://habr.com/ru/posts/966942/
В первой части коротко про ChatGPT, Claude + NotebookLM, во второй коротко про изображения и автоматизации

🔡 Генерация изображений и видео
Nano Banana 🍌
Визуальная модель внутри Gemini, которая генерирует одни из лучших на сегодня изображений. Очень высокое сохранение лиц и объектов.
В интерфейсе Gemini на бесплатном аккаунте доступно до 100 генераций в день
Либо можно работать через AI Studio — он чуть перегружен, но там можно выбирать разрешение:
Основные сценарии:
• Создание контента и креативов с нуля
• Визуал для постов, афиш, презентаций, обложек
• Быстрое редактирование и улучшение фото (удаление объектов, замена фона)
• Генерация ключевых кадров для дальнейшего создания видео в Veo 3.1
Nano Banana не переделывает всю сцену с нуля, а как бы «прифотошопливает» людей и объекты, сохраняя исходную композицию.
Лучшие практики:
• Подробно описывайте результат (стиль, освещение, тона)
• Используйте референсы для сохранения персонажей и стиля
• Работайте итеративно: сначала фон, затем персонажи, потом детали
Про AI изображения писал огромную статью, все те же правила подойдут и для бананы
Veo 3.1 (есть ещё Sora 2, тоже очень высокого качества)
Создание видео из изображения или текста
Гугловская модель для создания видео и озвучки. Превращает статичные изображения в живые ролики.
В бесплатном Gemini напрямую не доступен — нужен Pro-тариф.
Основные сценарии:
• Создание рекламных и промо-роликов без съемок
• Короткий контент для Reels, Stories, TikTok
• Оживление статичных фото и концепт-артов
• Демонстрация продукта с разных ракурсов
Как работать:
• Пропишите детальный сценарий: локацию, время, героев, действия, камеру, звук
• Добавляйте референсные изображения для сохранения стиля
• Тестируйте композицию в Fast, финальный вариант делайте в Normal
В режиме Image to Video можно загрузить два кадра (Start Frame и Finish Frame) и получить плавное видео между ними.
⸻
🔡 Автоматизации и агенты
n8n
Low-code платформа для автоматизаций. Не только AI, но последнее время они активно развивают AI ноды
Это уже сильно прикладной инструмент. Последнее время мне намного проще написать кодом и развернуть на своём сервере автоматизацию, чем собирать в n8n.
Но для визуальной сборки он классный 🐥
Основные сценарии:
• Автоматическая обработка заявок, лидов, форм
• Связка ChatGPT/Claude с CRM, Notion, почтой
• Регулярные отчеты, выгрузки, уведомления
AgentKit от OpenAI
Похоже на n8n немного, но достаточно сильно отличается изнутри. Работает только как агентная система с ИИ. Тогда как в n8n не обязательно ставить ИИ-ноду.
Но у AgentKit есть огромные плюсы в виде очень удобного RAG, Guardrails и уже готового SDK с сильно настраиваемым UI.
Что означает, что чат-бота можно развернуть за 10 минут на своем сайте.
Есть много других подобных сервисов, например Make или Google Opal.
⸻
🔡 Создание сайтов и интерфейсов с помощью ИИ
Что пробовал я:
• Replit
• Lovable
• v0
• Bolt
Насчет разницы между ними сложно сказать, так как они постоянно развиваются, а мой опыт работы с каждой из платформ становится не релевантным уже спустя месяц. Но если бы я выбирал только 1 из них, то выбрал бы Replit, вроде самый популярный сейчас
Я просто последнее время перешел на связку VS Code + Claude Code + Codex + CLI, а за инструменты из списка выше платить перестал.
Cursor я кстати не использую, но без каких либо конкретных причин, просто за Claude Code 100$ плачу
Про работу с кодом как нибудь отдельно расскажу, ещё и про AI CLI. Так как это очень большой отдельный мир