Как стать автором
Обновить
15
35
Владислав @Wonderlove

Занимаюсь созданием музыки и нейросетями

Отправить сообщение

Озвучка диалогов с помощью нейросети FishSpeech

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров5.4K

Озвучка диалогов из текста может сильно упростить и ускорить работу во многих ситуациях: подкасты, аудиокниги, обучающие материалы, рекламные ролики, создание игр, reels и даже фильмов.

Часто записать аудио крайне трудно: нет доступа к микрофону, шумная обстановка или ограниченные временные рамки. Или просто лень.

Поэтому сегодня на обзоре нейросеть Fishspeech, которая реалистично озвучит текст, сохраняя интонации и эмоциональную окраску. Так ещё можно добавлять свои голоса или использовать уже готовые 50+ голосов от сообщества Нейро-Софт. Вообще сказка! Давайте к обзору.

Читать далее

Обновление FaceFusion v3.0.0 — ультимативной нейросети для дипфейков

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров17K

Всем привет!

В этой статье взглянем на FaceFusion версии 3.0.0 — мощный инструмент для замены лиц на изображениях и видео!

Для использования понадобится всего лишь фотография в профиль. Также в статье расскажу, как не париться с установкой и запустить FaceFusion в один клик.

Читать далее

FLUX — новая нейросеть для генерации изображений от создателей Stable Diffusion

Уровень сложностиПростой
Время на прочтение5 мин
Количество просмотров50K

Всем привет!

Flux.1 D — это мощная модель для генерации изображений по текстовому описанию. Меня зовут Вандер, я куратор клуба по нейросети Fooocus и нейро-энтузиаст, и сегодня мы разберемся, почему вам точно стоит обратить внимание на свежеиспеченную Flux.

Разработчики Flux - бывшие создатели Stable Diffusion и Stable Diffusion XL - Робин Ромбах и Андреас Блаттман. Оба выступали за идею, но компания преследовала только коммерческие интересы Как итог - произошел конфликт и ключевые фигуры покинули Stability AI. Недавно ими была создана новая компания The Black Forest Team, которая и представила нам Flux.

Flux основана на 12-миллиардном трансформере и использует инновационный подход, так что достигать высокой производительности и качества изображения возможно даже при запуске на бытовых видеокартах.

Модель очень хорошо следует промпту и распознает текст.

В статье мы посмотрим, как запустить Flux онлайн и локально, а так же на ее возможности.

Читать далее

Resemble Enhance — нейросеть для улучшения голоса и очистки от шума

Уровень сложностиПростой
Время на прочтение3 мин
Количество просмотров5.7K

Resemble Enhance - это инструмент на основе ИИ для улучшения качества речи путем шумоподавления и усиления.

Он состоит из двух модулей: шумоподавителя, который отделяет речь от шумного аудио, и улучшателя, который повышает качество звука, устраняя искажения и расширяя полосу пропускания.

Модели обучены на высококачественных речевых данных с частотой дискретизации 44.1 кГц.

Проще говоря, это портативный улучшатель записей голоса, который может пригодиться буквально всем, кто работает с медиа/контентом/звуком.

Это очень хорошая альтернатива плагина GOYO, который на данный момент недоступен. Более того, вам не нужна DAW или другая сторонняя программа, чтобы запустить Resemble, как в случае с GOYO.

Читать далее

AuraFlow — новейшая модель для генерации изображений с открытым исходным кодом

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров4.6K

AuraFlow — крупнейшая и полностью открытая модель генерации изображений по текстовому описанию, основанная на технологии потоковых моделей (flow-based models).
Модель достигает передовых результатов по метрике GenEval и представляет собой значительный шаг вперед в области открытых моделей ИИ для генерации изображений.
Эта модель поддерживается командой FAL. Демо доступно на платформе HuggingFace здесь.

Вы также можете построить несколько крутых рабочих процессов Comfy, загрузив модель весов со страницы HuggingFace.

Ещё мы сделали для вас простую удобную портативную версию с установкой в один клик, если вы хотите локально и без костылей насладиться AuraFlow.

Перед установкой отключите антивирус, он ругается на самораспаковывающийся архив. Если переживаете, то скачивайте ZIP-архив, который нужно просто разархивировать в любое удобное место.

Читать далее

Как создать свой стикер пак с помощью нейросети Stable Diffusion

Уровень сложностиПростой
Время на прочтение9 мин
Количество просмотров25K

Вы знали, что не обязательно быть дизайнером, чтобы создать свой красивый пак стикеров?

Сегодня я поведаю историю создания своего стикерпака из 20+ стикеров с моим персонажем по имени Эвелинн с помощью нейросетей. Вам не понадобится мощная видеокарта и даже Photoshop(в большинстве случаев): я покажу, как сделать всё это прямиком в браузере. Это простой, доступный и бесплатный способ создания уникальных стикеров, справится даже чайник, надеюсь, он уже закипел, приступим!

Читать далее

Deep Live Cam — нейросеть для дипфейков в реальном времени

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров39K

Всем привет!

В этой статье познакомимся с Deep-Live-Cam - это инструмент для замены лиц в реальном времени и создания видеодипфейков с использованием всего одного изображения.

Софт включает встроенную проверку на недопустимые материалы и поддерживает GPU ускорение для улучшенной производительности.

Также расскажу, как не париться с установкой и запустить Deep Live Cam в один клик.

Всё, что нам понадобится, чтобы завести Deep Live Cam - это веб-камера и видеокарта Nvidia или AMD с более чем 6-ью Гб видеопамяти.

P. S. Если вы используете смартфон как веб-камеру то, к сожалению, программа просто не будет распознавать устройство. Возможно, в будущем это пофиксят, было бы очень удобно!

Читать далее

Omost — новый веб-интерфейс от создателя Controlnet, Fooocus и Forge: возможности и примеры

Уровень сложностиПростой
Время на прочтение4 мин
Количество просмотров5.4K

Всем привет! 

Omost, разработанный lllyasviel — это новый веб-интерфейс, который совмещает в себе возможности больших языковых моделей (LLM) и возможности генерации и изображений на SDXL моделях. Иными словами, SDXL и ChatGPT в одном флаконе

Название Omost (произношение: "almost") символизирует:

Каждый раз, когда вы используете Omost, ваше изображение почти готово

"O" означает "omni" (мультимодальный), а "most" означает стремление извлечь максимум из каждого изображения

Суть в том, что используются простые промпты, а языковая модель преобразовывает и распределяет текстовый запрос таким образом, чтобы на выходе получать красивые и необычные генерации. Смесь LLM и SDXL позволяет очень гибко управлять генерацией

Читать далее

Самые необычные нейронаушники с выставки CES 2024

Время на прочтение2 мин
Количество просмотров3.4K

Нейротехнологии проникают в нашу жизнь со стремительной скоростью, вплетаясь в самые обычные вещи и предметы нашего повседневного использования. Например, нейронаушники становятся все более распространенными, объединяя функциональность обычных наушников с возможностью взаимодействия с нашими мозгами. В Лас-Вегасе стартовала одна из самых интересных и масштабных выставок потребительской электроники CES-2024 (Consumer Electronics Show). В этом году в ней приняли участие более чем 4 тыс. компаний. Но давайте взглянем на интересные предложения в сфере нейрозвука.

Читать далее

Информация

В рейтинге
219-й
Откуда
Россия
Зарегистрирован
Активность

Специализация

Менеджер сообщества, Менеджер по контенту
Adobe Photoshop
Adobe Premiere
Fl studio
Графический дизайн
Копирайтинг
Рерайтинг
Управление медиа
Монтаж видео
Звукорежиссура
Саунд-дизайн