Обновить
10

Пользователь

6
Подписчики
Отправить сообщение

Привет, статья интересная, очень крутые технологии! Спасибо, что поделились!

Можно ли писать запросы типа такого, когда ищешь не что-то конкретное, а чтобы ИИ порекомендовал что-нибудь? Запрос: подбери подарок на день рождения для мальчика 10 лет в пределах 10к рублей и не машинка?

Это не главное в создании богатства, можно занять деньги или заработать как первый брат. Тут главное именно эффект масштабирования, который приносит богатство. Можно всю жизнь работать как стахановец и не стать миллионером или можно создать что-то что легко масштабируется и сделать на этом миллионы.

Почему все так не сделают и почему все не разбогатеют - это риторический вопрос на который у меня нет ответа

Думаю секрет богатства в масштабировании, вот первый брат, например, может обеспечить поставки для 50 клиентов за день, а для 100 и более уже сил не хватает. А второй брат с насосом может поставить воду 1000 клиентам, а потом купить еще насос и еще 1000 клиентов обеспечить не тратя физические силы. Эффект масштаба решает.

Другое дело что не все можно масштабировать, например, если делать физические объекты, то там ресурсы ограничены, а если продавать курсы или ПО, то оно легко масштабируется.

Привет, спасибо за гайд!

На мой взгляд удобнее разворачивать это в docker compose с проброской gpu. Модели можно скачивать через ComfyUI‑Manager (правда некоторые придется скачивать напрямую в контейнер). Можно будет открыть порт и подключаться с другого ПК или смартфона через браузер.

Я пробовал пример из этого репозитория, но мне нужно было запустить все на cpu (не советую, все очень медленно генерируется, просто тестил возможность).

Спасибо за идею! Проект на С++ для меня сложноват, но я могу поискать что‑то подобное, вдохновиться и реализовать игру на python.

Круто, а можно сделать такую модель чтобы она смогла петь песни как Vocaloid Hatsune Miku?

И еще хотел спросить есть ли какие-то ограничения по запуску модели или технические требования к ПК? Типа нужно 1Гб памяти, до 1000 слов на вход и т.д?

КДПВ - это носимый робот Tomatan или Wearable Tomato, который кормит бегуна помидорами во время марафона

Вроде, нашел способ передавать в байтах и получать в байтах без сохранения файла на диск, код будет типа такого. Попробую еще с помощью mmap, спасибо!

def wav_to_ogg_bytes(in_bytes: bytes) -> bytes:
    command = [
        "ffmpeg",
        "-i", 'pipe:0',         # stdin
        "-f", "ogg",            # format
        "-acodec", "libvorbis", # codec
        "pipe:1"                # stdout
    ]
    proc = subprocess.Popen(
        command,
        stdin=subprocess.PIPE,
        stdout=subprocess.PIPE,
        stderr=subprocess.PIPE
    )
    out_bytes, err = proc.communicate(input=in_bytes)
    return out_bytes

Я просто менял их на текст, например, этот код делает числа словами

# Делаем числа буквами
text = self._nums_to_text(text)

Для Silero и Vosk не нужен. Интернет нужен только для Telegram

Я хотел избавится от сохранения файлов на диск. В примере 'input.mp4' скорее всего лежит на диске, а я хотел чтобы он был в оперативной памяти, что-то типа временного файла в виде io.BytesIO или что-то такое. Это позволит избавиться от постоянного сохранения и удаления файлов на диске при конвертации через ffmpeg. И думаю вся система будет работать быстрее

Здравствуйте! Вот ссылка на 3 файла wav с разным качеством. Silero поддерживает битрейт 8000, 24000 и 48000.

А там встроенные модели уже и ничего скачивать не нужно? Я пробовал ставить нейронку с веб-интерфейсом по гайду, там нужно было модель отдельно качать. А запуск нейронки сделан через bat файл и потом через браузер заходишь по локальному IP.

Есть гайд для запуска сетки Stable Diffusion с web-UI на своем ПК. Результаты иногда получаются хорошими :)

просто так взять и бросить выгорать? нет, пожалуй оставлю все как есть :)

Спасибо, интересно! А что делать если уже попал в состояние выгорания? Есть способы получить дополнительную энергию и перекрыть трату энергии на выгорание?

Круто, спасибо! А есть способ заставить Django делать парсинг одной странички каждые 5 минут? Тут видимо какой-то таймер должен быть, который через API заставляет работать Django, но я не пойму как такое реализовать

Круто, а расскажите как использовать такой аватар? Знаю, что есть ПО типа FaceRig там аватар повторяет мимику человека через камеру. Может есть еще что-то типа open source или хорошее платное ПО. И зачем нужны эти аватары? Для метавселенной или просто дурачиться в интернете?

Спасибо, побольше бы таких решений. А есть ли у Сбера что-нибудь из open source для самостоятельного использования, типа Vosk или Silerio? Интересно попробовать.

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность

Специализация

Бэкенд разработчик
Python
FastAPI