Обновить
80.49

Обработка изображений *

Работаем с фото и видео

Сначала показывать
Порог рейтинга
Уровень сложности

Бесплатные нейросети для фото: топ-5 ИИ-моделей для генерации изображений в 2026 году

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели16K

Кажется, в мире нейрогенераторов сейчас настоящая гонка вооружений. Каждый месяц выходит новая модель, каждая громче предыдущей кричит о “прорыве”, “фотореализме” и “понимании контекста”. OpenAI, Google, Black Forest Labs, Midjourney – все хотят быть первыми. Но кто из них действительно умеет работать со сложными, многосоставными сценами?

Мы решили не гадать, а провести честный эксперимент. Взяли один мегапромпт – с девушкой, двумя необычными спутниками, инопланетной атмосферой и кучей деталей – и прогнали его через пять топовых нейросетей 2026 года. Что получилось? Кто‑то блистательно справился, а кто‑то просто нарисовал милую открытку, проигнорировав половину условий.

Это не просто обзор – это битва алгоритмов, где победит тот, кто не просто рисует красиво, а думает, как художник. Итак, запускаем генерацию – и смотрим, чья нейросеть действительно готова к полету на другую планету в компании Крокодила и Зебры.

Включаем воображение и начинаем тест!

Читать далее

Новости

Нейросети и Казино

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели12K

Статья носит юмористический характер. Автор не пропагандирует азартные игры. Слово "казино" используется исключительно как метафора случайности процессов генерации.

На первый взгляд может показаться, что игрок у рулетки и хипстер с подпиской на Midjourney - это разные люди. Однако: оба они молятся Богу Рандома, оба тратят деньги и оба надеются, что в этот раз "выпадет красиво".

Читать далее

От идеи к реальности: как я собрал свой первый пет-проект по распознаванию языка жестов

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели11K

ПРЕДЫСТОРИЯ

Полгода назад, ближе к концу первого курса, я стал думать о будущей работе. Возможно на волне хайпа мой выбор пал на Нейронные сети. Начал с классического машинного обучения, а потом нашел хороший курс по свёрточным (CNN) и рекуррентным сетям. CNN меня впечатлили гораздо больше. После пары учебных проектов вроде классификации кошек и собак захотелось сделать что-то сложнее. Так появилась идея: детектировать руку в кадре и определять жест из американского языка жестов (ASL).

Читать далее

Как развернуть что угодно с ИИ-агентами, даже ComfyUI с жирными моделями

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели7.3K

Я кайфую от работы с нейронками. Конкретно, через ComfyUI и вот это вот всё со стрелочками и пайплайнами. Это история о моём пути от RTX 3080 дома до GPU-серверов с ИИ-агентами.

Есть два типа людей, которые арендуют GPU-серверы:

Читать далее

Ещё 15 полезных промптов для Nano Banana Pro: лучшая нейросеть для фото

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели25K

Фотография — это не только момент, но и настроение, стиль, история. А что если всё это можно изменить одним промптом?

И тогда я решил попробовать Nano Banana Pro. Оказалось, нейросеть может создать любой кадр за секунды — нужно только правильно её попросить. Без навыков дизайна, без фотошопа, без месяцев обучения. Только нейросеть и ваша фантазия. Звучит как читы, но это уже реальность.

В этом гайде — подборка промптов, которые превращают обычные фото в арты, схемы и даже создают визуальные решения загадок. Логические задачи, паттерны, дорисовка... иногда кажется, что нейросеть прошла уровень сложности, который нам и не снился. И теперь она готова делиться своими скриншотами.

Читать далее

GIMP: простейший итерационный деблюр

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели6.7K

В сети достаточно материалов по методам восстановления резкости изображения (деблюру) с помощью специального математического аппарата. Этот аппарат включает в себя нахождение ядра размытия (ядра предполагаемого "фильтра", применённого к изображению) и проведение операции, обратной свёртке данного ядра с изображением.

Всё это хорошо, но!....

Ничего такого сложного в GIMP нет, особенно нахождение ядра размытия и применение ядер сложной конфигурации. Хотелось бы чего‑нибудь попроще, более известного и понятного, но чтобы можно было понять сам процесс и сделать это не прибегая к сторонним заумным средствам.

Исходя из вышесказанного, сделаем допущение, что наше изображение размыто «Гауссовым размыванием» и более того, радиус данного размытия известен. Довольно «нахальное» предположение, но хочется то по простому.

Для «эксперимента» используем традиционно изображение «Лена»:

Читать далее

Как на самом деле выглядит необработанное фото

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели29K

Вот фотография новогодней ёлки в том виде, в котором видит матрица камеры.

Она даже не чёрно-белая, а серо-серая.

Причина этого в том, что хотя аналогово-цифровой преобразователь (АЦП) камеры теоретически способен выдавать значения от 0 до 16382, данные не покрывают весь этот диапазон.

Читать далее

Archivist: Как я учил нейросеть понимать физику плёнки, вместо того чтобы просто размывать шум

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели33K

В прошлых статьях я разбирал основы апскейлинга дома и сходил с ума, вырезая закадровый смех из «Скуби-Ду». Тот опыт привёл меня к выводу: существующие инструменты, будь то плагины вроде NeatVideo или комбайны типа Topaz Video AI — это «чёрные ящики». У них ограниченный набор настроек, и они часто пасуют перед специфическими задачами старой анимации.

В этот раз я пошёл от обратного. Сразу снижу градус ожиданий: это любительский эксперимент. Мы сильно ограничены в мощности GPU (в наличии только RTX 4060 Ti), из-за чего натренировать реально точную, тяжелую нейросеть-универсала возможности нет.

Поэтому вместо гонки за идеальными метриками я сосредоточился на «неудобных» проблемах. Я написал симулятор уничтожения плёнки, чтобы научить легкую модель понимать физику конкретных дефектов: от сдвига эмульсии до химических ожогов.

Спойлер: на это ушло 2 месяца и 2 миллиона итераций. Получилась не «волшебная кнопка», а набор узкоспециализированных инструментов.

Читать далее

Как я построил визуальную вселенную для онлайн-курса с помощью Nana Banana и почему это важно для студентов

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели3.1K

Меня зовут Иван Стародубцев, я автор курса для новичков «Лучший по Python» на Stepik. Он не просто так называется: за год его прошли почти 30 тысяч учеников, которые оставили 3,8 тысячи отзывов со средней оценкой 5 звёзд. Это курс, написанный максимально простым языком в формате диалога, без снобизма и математики. Вместо скучных формул там интересные задачи из жизни, а уже на второй неделе студенты пишут первые игры.

В какой-то момент я столкнулся с проблемой, знакомой многим авторам учебного контента: курсу нужны десятки и сотни иллюстраций. Случайные картинки из интернета не подходят — это должна быть настоящая визуальная вселенная с постоянными персонажами, узнаваемыми локациями и мини-историями, которые раскрываются на протяжении всего материала.

Работа иллюстратора на 100–150 картинок стоит 300–450 тысяч рублей. Это дорого, долго и негибко: захотел добавить новую сцену — снова договариваешься, ждёшь, платишь. Поэтому я решил выстроить собственную схему по производству иллюстраций на нейросетях. Сегодня расскажу, как это работает и, главное, как помогает студентам.

Читать далее

Основы оптического потока в ML: от первых принципов к уравнениям Лукаса-Канаде и Хорна-Шанка

Уровень сложностиСложный
Время на прочтение37 мин
Охват и читатели8.1K

Аннотация

Настоящая статья представляет собой развернутое исследование, посвященное систематическому изучению классических алгоритмов оценки оптического потока — фундаментальной задачи компьютерного зрения. Основной целью работы является последовательный и строгий вывод ключевых методов, начиная от базовых физических постулатов и заканчивая завершенными, готовыми к реализации математическими моделями. В центре внимания находится уравнение ограничения оптического потока, выводимое из краеугольного предположения о постоянстве яркости, и два основополагающих, принципиально различных подхода к решению этой недоопределенной задачи: локальный метод Лукаса-Канаде, основанный на предположении о пространственной согласованности потока в малой окрестности, и глобальный метод Хорна-Шанка, вводящий условие плавности (гладкости) потока в виде регуляризирующего функционала. Подробно анализируются теоретические основания каждого подхода, их математический аппарат, включая вывод и решение соответствующих систем уравнений, а также проводится сравнительный анализ их сильных сторон и присущих им фундаментальных ограничений, таких как проблема апертуры и чувствительность к нарушениям исходных предположений.

Практическая значимость и верификация теоретических положений исследования обеспечиваются детальной численной реализацией обоих алгоритмов в среде MATLAB. Экспериментальная часть включает генерацию и обработку синтетических последовательностей с заведомо известным вектором движения для объективной количественной оценки точности, а также тестирование на реальных видеоданных для анализа устойчивости в условиях шумов, изменений освещенности и текстуры. Проведенное сравнение визуализирует ключевые различия в характере получаемых полей потока (разреженное против плотного), оценивает вычислительную эффективность и робастность методов в различных сценариях.

Читать далее

Применение вариационного исчисления к задаче выделения границ: вывод уравнения Эйлера-Лагранжа

Уровень сложностиСложный
Время на прочтение25 мин
Охват и читатели10K

Представьте, что вам нужно обвести объект на картинке — не просто тыкая в пиксели, а проведя одну идеальную, плавную и уверенную линию. Та самая, которую набросал бы на бумаге художник. Как объяснить компьютеру, что значит «идеальная граница»? Как заставить его искать не среди груды точек, а в бесконечном море возможных кривых?

Оказывается, на этот вопрос уже давно ответила математика, а именно — вариационное исчисление. Это тот самый инструмент, который стоит за знаменитыми алгоритмами вроде «активных контуров» (snakes) или «уровневых множеств». Часто в статьях показывают готовые формулы и код, а саму красивую логику оставляют за кадром.

Давайте вместе разберем эту связь. Начнем с простого: как найти минимум у обычной функции. А потом — шаг за шагом — расширим эту идею до целых кривых. Ключевой момент на пути — уравнение Эйлера-Лагранжа. Мы не просто запишем его, а честно выведем: от замысла «энергии» контура до финального условия, используя лишь базовую лемму вариационного исчисления и интегрирование по частям.

Самое интересное — это уравнение не просто абстракция. Оно описывает баланс, равновесие сил. Оптимальная граница — результат «борьбы»: с одной стороны, она хочет оставаться гладкой и аккуратной, с другой — стремится лечь точно на резкий перепад цвета или яркости на изображении.

Как только вы это поймете, работа с алгоритмами сегментации перестает быть магией. Вы начинаете осмысленно настраивать параметры, предсказывать поведение и даже придумывать собственные критерии для «идеальной границы».

Читать далее

Генерируем новогодние картинки и видео с Kandinsky 5.0

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели13K

Всем привет! Месяц назад на конференции «AI Journey» мы представили линейку моделей нового поколения Kandinsky 5.0 Image & Video. Мы опубликовали код и веса моделей в открытом доступе для разработчиков, а также открыли доступ к новым моделям на всех площадках GigaChat: в Telegram, мессенджере Max, на сайте giga.chat, а также в приложении под Android. Для тех, кто хочет поглубже погрузиться в технические подробности, советуем прочитать техническую статью. А для тех, кому уже хватит архитектур, параметров и кода, а хочется салатов и Нового года — наш сегодняшний материал, в котором будет много ёлок, гирлянд и снега. В этой статье мы расскажем, как сделать отличные, новогодние и не только генерации, и надеемся, что вы получите от работы с моделью такое же удовольствие, как и мы. Спасибо, что интересуетесь и пользуетесь нашими моделями! С наступающим Новым годом!

Читать далее

RealTime FaceSwap-10k — датасет для задачи детекции real-time дипфейков

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели8K

Мы в Контуре собрали собственный датасет и использовали его для обучения детектора, ориентированного на работу в сценариях видеосвязи. В статье расскажем, откуда брали материалы, как организовали сбор и тегирование, как генерировали фейки и почему важно заранее продумывать систему тегов. Датасет открыт для сообщества, ссылки оставили в конце статьи.

Читать далее

Ближайшие события

20 полезных промптов для Nano Banana Pro: как создать фотосессию и отредактировать изображение

Уровень сложностиПростой
Время на прочтение15 мин
Охват и читатели55K

С Nano Banana Pro всё действительно изменилось. Модель заметно лучше понимает контекст и задачу пользователя. Она воспринимает сцену почти как человек (ну, по крайней мере, очень старается… и у неё получается!).

Эта нейросеть — на базе Gemini — без лишних танцев с бубном превращает обычные текстовые описания в реалистичные изображения с богатой детализацией. Более того, она позволяет редактировать уже готовые картинки буквально одним текстовым запросом. Да‑да, без многочасовых ковыряний в слоях.

Больше не нужно писать магические заклинания времён раннего Stable Diffusion — теперь с нейросетью можно разговаривать на понятном, человеческом языке: подробно, логично и по делу. Звучит заманчиво, не так ли?..

Перед вами подборка готовых промптов для нейросети Nano Banana Pro. В этом гайде мы разберём 20 крутых и практичных способов применения Nano Banana — от генерации изображений до полноценного редактирования.

Читать далее

Kandinsky 5.0 vs Stable Diffusion: практический тест на 6 сценариях для иллюстраций и ассетов

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели6.2K

В разработке мне регулярно нужны картинки «вокруг кода»: обложки к техпостам/README, иллюстрации в документацию, а иногда — быстрые ассеты/референсы для пет‑проектов.

В рамках сезона решил протестировать Kandinsky 5.0 на типовых сценах и сравнить ощущения с привычным пайплайном на Stable Diffusion: где быстрее получить годный результат без плясок с промптом, а где лучшеиметь «запасной аэродром».

Под «разработческими задачами» здесь я имею в виду не генерацию кода, а задачи вокруг продукта: обложки к постам/README, иллюстрации к документации и быстрые прототипы визуалов/ассетов для пет-проектов.

Смотреть сравнение

Бэкап и хранение видео в YouTube

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели8.1K

Когда‑то мне виделась отличная идея использовать YouTube как надёжное облачное хранилище для своих видеоархивов. Зачем тратить место на локальных дисках, если можно выгружать туда смонтированные ролики или склеенные клипы — всё удобно, всегда доступно с любого устройства в любой момент, без необходимости хранить копии локально. Доступ через браузер или приложение, бесконечное онлайн-хранилище, и видео якобы остаётся в первозданном виде. Но со временем выяснилось, что не всё так просто и безоблачно, как казалось на первый взгляд. Давайте разберёмся, что пошло не так.

Читать далее

Nano Banana Pro vs SeeDream 4.5 vs GPT-5: битва моделей для генерации изображений. Кто победит в 2025 году?

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели9K

Доброго времени суток, «Хабр»!
Не так давно у меня вышла статья о сравнении топовых моделей для генерации текста (к сожалению, на данный момент ее уже нельзя назвать самой актуальной). И вот у меня возникла идея - провести аналогичное сравнение для новых моделей в сфере генерации изображений, ведь и эта ниша развивается бешеными темпами.

Сегодня в битве участвуют: Nano Banana Pro, SeeDream 4.5 и GPT-5 Image. Делайте ставки, а я приступаю к сравнению этих впечатляющих моделей.

Читать далее

Garbage In — Garbage Out: ошибки в разметке данных и как они ломают ML-системы

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели4.4K

На Хабре тысячи статей про OCR, IDP, ML и искусственный интеллект. Все они сходятся в одном: «качественная разметка данных — ключ к точности модели». Но что это значит на практике?

Меня зовут Снежана Игнатенко, я руковожу отделом разметки данных в SL Soft AI. Каждый день моя команда работает с самыми разными документами: печатными, рукописными, строгими формами, свободными текстами, сканами и фотографиями, в которых встречаются печати, подписи, штампы, затертые области, перекосы и артефакты. Наша задача — создавать качественный, точный и контекстно корректный набор размеченных данных, который служит фундаментом для всех интеллектуальных систем класса IDP.

В этой статье я приглашаю вас заглянуть за кулисы разметки данных и понять, как она формирует точность и надежность любых интеллектуальных систем.

Читать далее

Российские физики научились восстанавливать скрытые детали на зашумленных интерферограммах с высокой точностью

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели22K

Коллектив российских ученых из МФТИ, Физического института им. П.Н. Лебедева РАН, Института искусственного интеллекта AIRI и других ведущих научных центров создал новый итерационный фреймворк WISP, позволяющий с высокой точностью восстанавливать фазовую информацию из одиночных и сильно зашумленных интерферограмм. Разработанный алгоритм демонстрирует значительно более высокую устойчивость к шумам и точность по сравнению с существующими методами, включая подходы на основе глубокого обучения, открывая новые горизонты для изучения сверхбыстрых и сложных физических процессов, таких как плазменные разряды. Результаты исследования опубликованы в журнале IEEE Access.

Лазерная интерферометрия позволяет «увидеть» невидимые неоднородности в прозрачных средах, например, распределение плотности в плазме или напряжение в стекле. Интерференционная картина, состоящая из чередующихся светлых и темных полос, несет в себе зашифрованную информацию о фазовом распределении, которое, в свою очередь, напрямую связано с физическими свойствами объекта. Расшифровать эту информацию — ключевая задача для многих областей науки и техники.

Читать далее

Kandinsky 5.0 — нейросеть от Сбера для генерации изображений и видео

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели8.7K

В ноябре 2025 года инженеры “Сбера” представили семейство мультимодальных моделей Kandinsky 5.0 - новое поколение нейросетей, способных создавать как статичные изображения, так и видеоконтент по текстовому описанию. 

Мы детально рассмотрим три ключевые модели, выпущенные в рамках Kandinsky 5.0: легковесную Kandinsky 5.0 Image Lite (6B параметров) для быстрой генерации изображений, мощную Kandinsky 5.0 Video Pro (19B параметров) для создания качественного видео и экономичную Kandinsky 5.0 Video Lite (2B параметров) для ускоренной обработки и экспериментов. 

Читать далее
1
23 ...

Вклад авторов