Статьи / Профиль Wonderlove / Хабр

Владислав @Wonderlove

Занимаюсь созданием музыки и нейросетями

ПрофильСтатьи9ПостыНовостиКомментарии9

Wonderlove 8 мар в 17:10

Озвучка диалогов с помощью нейросети FishSpeech

Простой

3 мин

6.4K

Блог компании Timeweb CloudИскусственный интеллектЗвукБудущее здесьМашинное обучение*

Обзор

Озвучка диалогов из текста может сильно упростить и ускорить работу во многих ситуациях: подкасты, аудиокниги, обучающие материалы, рекламные ролики, создание игр, reels и даже фильмов.

Часто записать аудио крайне трудно: нет доступа к микрофону, шумная обстановка или ограниченные временные рамки. Или просто лень.

Поэтому сегодня на обзоре нейросеть Fishspeech, которая реалистично озвучит текст, сохраняя интонации и эмоциональную окраску. Так ещё можно добавлять свои голоса или использовать уже готовые 50+ голосов от сообщества Нейро-Софт. Вообще сказка! Давайте к обзору.

+35

Wonderlove 13 ноя 2024 в 11:05

Обновление FaceFusion v3.0.0 — ультимативной нейросети для дипфейков

Простой

5 мин

18K

Блог компании Timeweb CloudГрафический дизайн*Искусственный интеллектБудущее здесьДизайн

Обзор

Всем привет!

В этой статье взглянем на FaceFusion версии 3.0.0 — мощный инструмент для замены лиц на изображениях и видео!

Для использования понадобится всего лишь фотография в профиль. Также в статье расскажу, как не париться с установкой и запустить FaceFusion в один клик.

+39

Wonderlove 4 сен 2024 в 17:05

FLUX — новая нейросеть для генерации изображений от создателей Stable Diffusion

Простой

5 мин

53K

Блог компании Timeweb CloudГрафический дизайн*ДизайнИскусственный интеллектБудущее здесь

Обзор

Всем привет!

Flux.1 D — это мощная модель для генерации изображений по текстовому описанию. Меня зовут Вандер, я куратор клуба по нейросети Fooocus и нейро-энтузиаст, и сегодня мы разберемся, почему вам точно стоит обратить внимание на свежеиспеченную Flux.

Разработчики Flux - бывшие создатели Stable Diffusion и Stable Diffusion XL - Робин Ромбах и Андреас Блаттман. Оба выступали за идею, но компания преследовала только коммерческие интересы Как итог - произошел конфликт и ключевые фигуры покинули Stability AI. Недавно ими была создана новая компания The Black Forest Team, которая и представила нам Flux.

Flux основана на 12-миллиардном трансформере и использует инновационный подход, так что достигать высокой производительности и качества изображения возможно даже при запуске на бытовых видеокартах.

Модель очень хорошо следует промпту и распознает текст.

В статье мы посмотрим, как запустить Flux онлайн и локально, а так же на ее возможности.

+61

Wonderlove 21 авг 2024 в 18:02

Resemble Enhance — нейросеть для улучшения голоса и очистки от шума

Простой

3 мин

Искусственный интеллектЗвукБудущее здесь

Обзор

Resemble Enhance - это инструмент на основе ИИ для улучшения качества речи путем шумоподавления и усиления.

Он состоит из двух модулей: шумоподавителя, который отделяет речь от шумного аудио, и улучшателя, который повышает качество звука, устраняя искажения и расширяя полосу пропускания.

Модели обучены на высококачественных речевых данных с частотой дискретизации 44.1 кГц.

Проще говоря, это портативный улучшатель записей голоса, который может пригодиться буквально всем, кто работает с медиа/контентом/звуком.

Это очень хорошая альтернатива плагина GOYO, который на данный момент недоступен. Более того, вам не нужна DAW или другая сторонняя программа, чтобы запустить Resemble, как в случае с GOYO.

Wonderlove 24 июл 2024 в 20:23

AuraFlow — новейшая модель для генерации изображений с открытым исходным кодом

Простой

4 мин

4.7K

Графический дизайн*ДизайнИскусственный интеллектБудущее здесь

Обзор

AuraFlow — крупнейшая и полностью открытая модель генерации изображений по текстовому описанию, основанная на технологии потоковых моделей (flow-based models).
Модель достигает передовых результатов по метрике GenEval и представляет собой значительный шаг вперед в области открытых моделей ИИ для генерации изображений.
Эта модель поддерживается командой FAL. Демо доступно на платформе HuggingFace здесь.

Вы также можете построить несколько крутых рабочих процессов Comfy, загрузив модель весов со страницы HuggingFace.

Ещё мы сделали для вас простую удобную портативную версию с установкой в один клик, если вы хотите локально и без костылей насладиться AuraFlow.

Перед установкой отключите антивирус, он ругается на самораспаковывающийся архив. Если переживаете, то скачивайте ZIP-архив, который нужно просто разархивировать в любое удобное место.

Wonderlove 20 июл 2024 в 21:19

Как создать свой стикер пак с помощью нейросети Stable Diffusion

Простой

9 мин

26K

Графический дизайн*ДизайнИскусственный интеллектБудущее здесь

Туториал

Вы знали, что не обязательно быть дизайнером, чтобы создать свой красивый пак стикеров?

Сегодня я поведаю историю создания своего стикерпака из 20+ стикеров с моим персонажем по имени Эвелинн с помощью нейросетей. Вам не понадобится мощная видеокарта и даже Photoshop(в большинстве случаев): я покажу, как сделать всё это прямиком в браузере. Это простой, доступный и бесплатный способ создания уникальных стикеров, справится даже чайник, надеюсь, он уже закипел, приступим!

+36

Wonderlove 21 июн 2024 в 14:27

Deep Live Cam — нейросеть для дипфейков в реальном времени

Простой

2 мин

40K

Графический дизайн*Искусственный интеллектБудущее здесьДизайн

Обзор

Всем привет!

В этой статье познакомимся с Deep-Live-Cam - это инструмент для замены лиц в реальном времени и создания видеодипфейков с использованием всего одного изображения.

Софт включает встроенную проверку на недопустимые материалы и поддерживает GPU ускорение для улучшенной производительности.

Также расскажу, как не париться с установкой и запустить Deep Live Cam в один клик.

Всё, что нам понадобится, чтобы завести Deep Live Cam - это веб-камера и видеокарта Nvidia или AMD с более чем 6-ью Гб видеопамяти.

P. S. Если вы используете смартфон как веб-камеру то, к сожалению, программа просто не будет распознавать устройство. Возможно, в будущем это пофиксят, было бы очень удобно!

+14

Wonderlove 14 июн 2024 в 13:40

Omost — новый веб-интерфейс от создателя Controlnet, Fooocus и Forge: возможности и примеры

Простой

4 мин

5.5K

Графический дизайн*Искусственный интеллектДизайнБудущее здесь

Обзор

Всем привет!

Omost, разработанный lllyasviel — это новый веб-интерфейс, который совмещает в себе возможности больших языковых моделей (LLM) и возможности генерации и изображений на SDXL моделях. Иными словами, SDXL и ChatGPT в одном флаконе

Название Omost (произношение: "almost") символизирует:

Каждый раз, когда вы используете Omost, ваше изображение почти готово

"O" означает "omni" (мультимодальный), а "most" означает стремление извлечь максимум из каждого изображения

Суть в том, что используются простые промпты, а языковая модель преобразовывает и распределяет текстовый запрос таким образом, чтобы на выходе получать красивые и необычные генерации. Смесь LLM и SDXL позволяет очень гибко управлять генерацией

Wonderlove 22 янв 2024 в 17:33

Самые необычные нейронаушники с выставки CES 2024

2 мин

3.4K

Искусственный интеллектБудущее здесьГаджеты

Из песочницы

Нейротехнологии проникают в нашу жизнь со стремительной скоростью, вплетаясь в самые обычные вещи и предметы нашего повседневного использования. Например, нейронаушники становятся все более распространенными, объединяя функциональность обычных наушников с возможностью взаимодействия с нашими мозгами. В Лас-Вегасе стартовала одна из самых интересных и масштабных выставок потребительской электроники CES-2024 (Consumer Electronics Show). В этом году в ней приняли участие более чем 4 тыс. компаний. Но давайте взглянем на интересные предложения в сфере нейрозвука.

В рейтинге: Не участвует

Откуда: Россия

Зарегистрирован: 21 ноября 2023

Активность: 23 апреля в 19:56

Менеджер сообщества, Менеджер по контенту

Adobe Photoshop

Adobe Premiere

Fl studio

Графический дизайн

Копирайтинг

Рерайтинг

Управление медиа

Монтаж видео

Звукорежиссура

Саунд-дизайн

Озвучка диалогов с помощью нейросети FishSpeech

Обновление FaceFusion v3.0.0 — ультимативной нейросети для дипфейков

FLUX — новая нейросеть для генерации изображений от создателей Stable Diffusion

Resemble Enhance — нейросеть для улучшения голоса и очистки от шума

AuraFlow — новейшая модель для генерации изображений с открытым исходным кодом

Как создать свой стикер пак с помощью нейросети Stable Diffusion

Deep Live Cam — нейросеть для дипфейков в реальном времени

Omost — новый веб-интерфейс от создателя Controlnet, Fooocus и Forge: возможности и примеры

Самые необычные нейронаушники с выставки CES 2024

Информация

Специализация