Обновить
32K+
71
Илья Nerual Dreming@timonin

Занимаюсь нейросетями

47,9
Рейтинг
182
Подписчики
Отправить сообщение

Next.js, PostgreSQL, OAuth, Т-Банк и ни одного разработчика. Как я построил SaaS MVP с помощью AI-агентов

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели9.6K

Всем привет! Если вы следите за темой вайбкодинга, то наверняка замечали как быстро всё меняется. Ещё год назад я генерил одностраничные HTML-файлы, радовался жизни и был уверен что вайбкодинг - он вот про это. Странички, кнопочки, красивый фронтенд. А потом как-то незаметно оказалось что мне нужна база данных, авторизация, платёжная система и тесты. Это как зайти в IKEA за свечкой и выйти с кухней.

Вайбкодинг за последний год изменился до неузнаваемости. Сейчас это не "сгенерь мне страничку" - это полноценная разработка с бэкендом, PostgreSQL, OAuth авторизацией, эквайрингом от Т-Банка, тестами и автодеплоем. Настоящий небоскрёб. И каждый кирпичик в нём выбран не случайно - самые беспроблемные технологии которые я нашёл за время своих скитаний по разным стекам и агентам. Чтобы строить легко и с удовольствием. Ну или хотя бы без желания выкинуть ноутбук в окно.

Читать далее

Пишешь код, а звучит музыка. Как я сделал бесплатную лайвкодинг-платформу для создания музыки с ИИ-агентом

Уровень сложностиПростой
Время на прочтение15 мин
Охват и читатели15K

Всем привет! Знаете это чувство, когда ты ищешь решение какой-то конкретной проблемы, а находишь целое новое хобби? Вот у меня примерно так и вышло.

Как значит было дело. Сидел я, как обычно, никого не трогал, починял примус... а если конкретнее - делал небольшую игру-платформер. Задумка была в том, чтобы она была процедурно-генерируемой, причем я хотел чтобы все уровни генерировались через большую...

Читать далее

Whisper больше не нужен? Обзор VibeVoice ASR от Microsoft — часовая транскрипция, диаризация, hotwords и портативка

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели14K

Всем привет! Команда Microsoft Research выложила в открытый доступ VibeVoice-ASR — нейросетевую модель для распознавания речи с диаризацией (разделением) спикеров. Сегодня хочу рассказать об этой технологии подробнее и поделиться портативной версией.

Читать далее

Клонирование голоса по 3-секундному образцу локально: обзор Qwen3-TTS, примеры на русском и портативная версия

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели25K

Всем привет! Команда Qwen от Alibaba выложила в открытый доступ Qwen3-TTS — нейросетевую модель для синтеза речи с клонированием голоса. Сегодня хочу рассказать об этой технологии подробнее и поделиться портативной версией.

Читать далее

Тестирую ChatGPT, Claude, DeepSeek, Grok и ещё 5 нейросетей на реальном запросе: кто поможет активировать Windows?

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели35K

Друзья, всем привет! Сегодня у меня для вас необычный эксперимент - тестирование нейросетей в боевых условиях. Какая нейросеть поможет активировать Windows, а кто откажется сразу?

Читать далее

А что там у Гуглов: Jules вайбкодинг агент от Google, который не смог

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели9.1K

Всем привет! Если вы как и я задавались вопросом "а что там у гуглов", когда находили какую-то новую крутую софтину, смело полагая что если уж есть такое чудо, то у гуглов должно быть что-то еще лучше - то у нас с вами много общего.

И вот сегодня, вместо того чтобы продолжать вайбкодить в клоде, я вдруг вспомнил, что пару месяцев назад слышал что-то про Jules. Тогда меня это не заинтересовало, но недавно где-то еще в комментариях всплыло и я понял что пришло время смотреть агента от гугл.

Читать далее

Codex: как много в этом звуке. Агент-разработчик от openai который входит в вашу подписку на ChatGPT за 20$

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели17K

Всем привет! Недавно я делился своим обзором на Devin, в котором рассказал как потратил 500 долларов на вайбкодинг AI‑редактора и остался не особо доволен – он хоть и справился, но было дорого и долго. Продолжаю поиск своего идеального кодинг‑агента и сегодня разбираюсь в Codex от OpenAI.

Читать далее

Как я потратил $500 за 10 дней на вайбкодинг AI редактора для видео c открытым исходным кодом

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели14K

Всем привет! Я потратил на ии кодинг 500 долларов за 10 дней работы с Девином, и в результате у меня получился онлайн редактор для АИ видео с открытым исходным кодом. Кто такой Девин, зачем я это делал и что в итоге получилось. Разбираемся ниже.

Читать далее

S.U.P.P.O.R.T. — Гайд по выживанию в Пустоши пользовательских проблем

Уровень сложностиПростой
Время на прочтение26 мин
Охват и читатели11K

Всем привет! Решил я тут собрать в кучу все свои знания по онбордингу новых сотрудников поддержки. За свою карьеру я построил несколько отделов саппорта с нуля и, признаться, порядком устал от бездушных корпоративных регламентов, от которых клонит в сон уже на третьей странице. Писать очередной талмуд «делай хорошо — не делай плохо», который никто не дочитает, — гиблое дело, особенно для молодого поколения, выросшего в эпоху TikTok.

Читать далее

Кто убил интеллект? Расследование деградации ChatGPT, Claude, Gemini и других LLM

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели26K

Всем привет! Недавно я вновь сменил свою основную LLM-модель. Долгое время пользовался Claude, потом перешел на ChatGPT, затем на Gemini, и вот я опять оплатил Claude и снова отменил подписку. Почему? Потому что Gemini, который поначалу казался невероятно мощным, в какой-то момент просто перестал справляться с моими основными задачами, а до этого так же сделал Claude и ChatGPT. Они стали лениться, игнорировать части промпта и выдавать поверхностные ответы.

Читать далее

Выбираем лучший ультраширокий монитор летом 2025: история о том, как я заставил ИИ спорить с самим собой

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели31K

Доброго времени суток, друзья! Мое утро на днях началось не с кофе, а с того, что мой старый верный товарищ, ультраширокий Xiaomi Mi Curved Gaming Monitor 34", который мне еще года четыре назад подарил лучший друг, приказал долго жить. Вдвойне обидно.

Симптомы классические: черный экран, мигающий светодиод, и чтобы его запустить, нужно пошаманить с вилкой. Судя по всему, накрылась плата T-CON. А поскольку работа не ждет, нужно было немедленно приступать к поиску замены.

И да, сразу оговорюсь: мой финальный выбор — гиперспецифичен. Он подойдет вам, только если вы, как и я, белый гетеросексуальный мужчина среднего класса ищете ультраширокий монитор от 34 дюймов, черный и обязательно со встроенной эмбиент-подсветкой. Однако, я надеюсь, что само исследование рынка и детальный разбор моделей будет полезен любому, кто сейчас находится в поиске или рассматривает один из упомянутых вариантов. Моя цель — дать вам не рыбу, а удочку, которой я сам и воспользовался.

Читать далее

Выбираем лучшие TWS наушники для воспроизведения музыки летом 2025: исследование рынка и мой финальный выбор

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели102K

Я регулярно выбираю себе различные вещи и всегда стремлюсь добиться наилучшего сочетания цена/качество. Началась теплая пора, прогулки стали длиннее, а у моего нового Redmi 13 Pro+ 5G, как назло, нет выхода под наушники. Значит, настало время наконец-то купить себе TWS.

Как аудиофил со стажем, имеющий плеер FiiO M11 и наушники FiiO FH5, я всегда избегал беспроводных наушников. Когда-то, лет 5-10 назад, я пробовал ранние модели TWS и, честно говоря, обплевался — качество звука было отвратительным. С тех пор я не верил беспроводной связи вообще, предпочитая проводные решения.

Читать далее

Полностью AI-генерируемая RPG-арена в одном HTML-файле: мой опыт с бесплатным API Pollinations для MVP игры

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели6.7K

Всем привет! Наверняка у каждого, кто увлекается технологиями, бывают моменты, когда хочется быстро проверить какую-то идею или ‭«поиграться‭» с новым API, не погружаясь в сложную разработку. Сегодня я хочу рассказать как раз о таком эксперименте выходного дня, который начался с простого желания пощупать возможности одного сервиса, а в итоге вылился в небольшой, но забавный пет-проект – GPT Arena.

Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист. Идея GPT Arena зародилась у меня давно, еще во времена появления кастомных GPTs от OpenAI. Тогда я даже сделал небольшой прототип: игра предлагала создать героя, генерировала его изображение и весело описывала его бой с другим таким же созданным героем, учитывая их абилки и способности. С учетом того, что в ChatGPT была озвучка сообщений – получалось прикольно. Однако тот прототип был сыроват и я надолго его забросил.

Недавно я решил вернуться к этой концепции, когда познакомился с API от Pollinations. Как человек, который не является программистом в классическом смысле, а скорее энтузиастом, исследующим возможности AI и предпочитающим генерировать код с помощью нейросетей, а не писать его с нуля, мне было особенно интересно проверить эту идею в деле, используя новый инструментарий.

Читать далее

Как я обучал LoRA на стиле South Park для Flux: сбор кадров через MPV, особенности FluxGym и эксперименты с рангами

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели11K

Генеративные нейросети уже изменили мир цифрового искусства, но настоящая магия начинается, когда ты сам берешь их под контроль. Сегодня расскажу о своем эксперименте по обучению LoRA на стиле South Park — от сбора датасета до финальной модели. Поделюсь реальным опытом, техническими нюансами и самое главное — что конкретно сработало, а что оказалось пустой тратой времени.

Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист.

Идея обучить LoRA на стиле мультсериала пришла ко мне случайно. На глаза попался новый анимационный сериал "Ваш дружелюбный сосед Человек-паук", и я подумал: "Было бы классно обучить LoRA именно на этом стиле!" Я уже обучал LoRA на отдельных персонажах и простых стилях, но на таких сложных и комплексных особо ещё не тренировал.

Но стиль человека-паука показался мне слишком сложным для первого эксперимента такого рода. Решил сначала потренироваться на чем-то попроще. И тут удачно подвернулась спешл-серия South Park! Стиль South Park простой, узнаваемый, многие его любят (включая меня). На Civitai уже была одна LoRA South Park, так что я подумал — если смог кто-то другой, то и я смогу!

Спойлер: всё оказалось гораздо сложнее, чем я думал. Но обо всём по порядку.

Читать далее

Новый генератор изображений ChatGPT: все стили, режимы и возможности, в чате и через API

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели107K

Привет друзья! Вы наверняка уже знаете, что недавно ChatGPT получил обновление с революционной функцией генерации изображений. Новая технология, основанная на модели GPT-4o, генерирует картинки как никто другой на рынке! За первую неделю после запуска более 130 миллионов пользователей создали свыше 700 миллионов изображений – это настоящий бум! Уверен вы видели или даже сами делали Ghibli-фикацию - изображения в стиле аниме студии Гибли. Но что еще крутого может делать новая генеративная модель? Давайте разбираться!

Читать далее

MMAudio: Генерация звука для видео с помощью ИИ

Уровень сложностиПростой
Время на прочтение4 мин
Охват и читатели23K

Всем привет! Исследователи из Университета Иллинойса и Sony AI представили интересный проект MMAudio - нейросеть для создания звукового сопровождения к видео. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист, и сегодня я хочу рассказать об этой технологии подробнее и поделиться нашей портативной версией. Главная особенность системы в том, что она может генерировать звуки не только по текстовому описанию, но и на основе изображения или видео.

Читать далее

Что на самом деле показало нашумевшее исследование о ‭«сбежавших и обманывающих‭» больших языковых моделях

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели19K

Всем привет! В последнее время я заметил множество постов и статей в русскоязычном сегменте интернета, которые ссылаются на одно интересное исследование, но интерпретируют его… скажем так, довольно своеобразно. Часто можно встретить заголовки вроде ‭«ИИ научился обманывать чтобы спастись!‭» или ‭«Нейросети вышли из-под контроля и пытались сбежать!‭». Это в корне не верно передает смысл исследования.

Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист. Последние несколько лет я активно слежу за развитием искусственного интеллекта и стараюсь делиться с аудиторией объективной информацией. Как человек, внимательно изучивший оригинал исследования, я хочу представить его краткий локализированный пересказ и объяснить, что на самом деле обнаружили исследователи. Спойлер: никакого восстания машин не предвидится.

Читать далее

Вышел генератор видео Sora от OpenAI: Большие обещания, скромная реальность, разбираемся

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели5.8K

Привет, друзья! OpenAI наконец-то представила публичную версию своего видеогенератора — Sora Turbo. Почти год назад я писал о первых демо этой технологии, и мы все были в полном восторге от показанных возможностей. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист, и сегодня мы с вами разберем, что же на самом деле получили пользователи после года ожиданий. И спойлер — всё оказалось совсем не так радужно, как нам обещали.

Читать далее

Stability AI представила Stable Diffusion 3.5: Тестируем новую модель на реальных задачах и сравниваем с SDXL и FLUX

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели37K

Привет, друзья, 22 октября Stability AI представила долгожданное обновление своей флагманской модели — Stable Diffusion 3.5. После не самого удачного релиза SD3 Medium в июне этого года, команда взяла паузу для серьёзной переработки архитектуры. Вместо быстрых фиксов разработчики потратили четыре месяца на фундаментальные улучшения. Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист и сейчас мы с вами вместе разберемся, что изменилось и действительно ли стоило так долго ждать.

Читать далее

Обновление видео нейросети Pika взрывает мозг и расплющивает ожидания

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели32K

В мире искусственного интеллекта произошло нечто невероятное - компания Pika Labs представила обновление своей нейросети для генерации видео, Pika 1.5. Это обновление не просто улучшает качество генерируемого контента, оно буквально взрывает наши представления о том, на что способен ИИ, и эта игра слов в заголовке не спроста, а потому что в новом обновлении вы можете взорвать и расплющить все что угодно!

Внутри много коротких роликов с примерами.

Читать далее
1

Информация

В рейтинге
177-й
Откуда
Москва, Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность