На самом деле качество это интересный вопрос. А что все таки больше смущает/вызывает вопросы- сам текст, пальцы/картинки или русская озвучка? Я в целом ожидаю быстрого прогресса по всем трем этим направлениям. Текст лучше с GPT-4, картинки лучше в Midjourney, озвучка лучше для мейнстрим языков.
Согласен, русский синтезатор не идеален - это всего лишь WaveNet. Можно расставить ударения. Хотя голос B как по мне самый нормальный из всех. А вот в английском и других языках доступны Studio и Neural2 голоса - это просто песня!
В группе у людей с этим проблем нет, уже 10000 картинок нарисовали ? в целом зависит от языка телеграм. Если стоит английский, то переводчик не будет переводить. Так что либо "Нарисуй машинку" либо "Paint a car". Ну и есть ещё режим для гиков "draw a black robot standing on one leg, Akira Toriyama 3d rendering, cgsociety, lesautostites, reimagined with industrial light and magic, steampunk, hard surface modeling". Если draw написана с маленькой буковки, перевода и обогащения стилей не будет. То есть такой сырой режим.
Oracle Free Tier. С always free они дают 4 CPU Ampere server, с 24 Gb RAM и 200 GB SSD. Очень советую, тот случай когда оракл сделала что то хорошее но никто про это не знает )) за 2 года не заплатил им не копейки. Конечно, иногда приходится поискать специфичный контейнер под aarm64, но в итоге все находится и работает. А ещё они дают 2 микроинстанса с АМД. Но ампер круче в разы
Я напишу тут статью подробную как закончу. Надо ещё проблемы с производительностью пофиксить. Манга это не бот, там медиа хостится так что хабраэффект будет сильный ?
Надо поставить ноду 18.0, потом сходить хотя бы в ботфазера и опенаи и добыть их ключи. А их уже в переменные окружения или .env. Ну и запускайте! node index.js
Эм, а такие модели есть?? Киньте ссылку ? Я пока хотел просто микшировать через sox какую то нормальную человеческую музыку
На самом деле качество это интересный вопрос. А что все таки больше смущает/вызывает вопросы- сам текст, пальцы/картинки или русская озвучка? Я в целом ожидаю быстрого прогресса по всем трем этим направлениям. Текст лучше с GPT-4, картинки лучше в Midjourney, озвучка лучше для мейнстрим языков.
Да, фоновую музыку добавлю сегодня-завтра. Надеюсь это не вызовет проблем с авторскими правами
Согласен, русский синтезатор не идеален - это всего лишь WaveNet. Можно расставить ударения. Хотя голос B как по мне самый нормальный из всех. А вот в английском и других языках доступны Studio и Neural2 голоса - это просто песня!
Ну, согласен с пальцами беда ? но они не так уж часто лезут в кадр) и вообще, всегда же можно перерисовать слайд!
В группе у людей с этим проблем нет, уже 10000 картинок нарисовали ? в целом зависит от языка телеграм. Если стоит английский, то переводчик не будет переводить. Так что либо "Нарисуй машинку" либо "Paint a car". Ну и есть ещё режим для гиков "draw a black robot standing on one leg, Akira Toriyama 3d rendering, cgsociety, lesautostites, reimagined with industrial light and magic, steampunk, hard surface modeling". Если draw написана с маленькой буковки, перевода и обогащения стилей не будет. То есть такой сырой режим.
Oracle Free Tier. С always free они дают 4 CPU Ampere server, с 24 Gb RAM и 200 GB SSD. Очень советую, тот случай когда оракл сделала что то хорошее но никто про это не знает )) за 2 года не заплатил им не копейки. Конечно, иногда приходится поискать специфичный контейнер под aarm64, но в итоге все находится и работает. А ещё они дают 2 микроинстанса с АМД. Но ампер круче в разы
Я напишу тут статью подробную как закончу. Надо ещё проблемы с производительностью пофиксить. Манга это не бот, там медиа хостится так что хабраэффект будет сильный ?
.env в корне проекта ?
Надо поставить ноду 18.0, потом сходить хотя бы в ботфазера и опенаи и добыть их ключи. А их уже в переменные окружения или .env. Ну и запускайте! node index.js
Я обычно этой функцией перерисовываю фотки/картины. То есть кидаешь боту фотку, и сразу как распознает - пишешь Нарисуй (без ничего)
Так я для того и выложил исходники! Запустите на своём сервере и никому не платите ?
Ни в коем случае не оскорбили! Да, скормил ей README.txt из репы, и попросил сделать статью для хабра ? потом чуть-чуть отредактировал.
Спасибо! Пока заинтересовался автоматической генерацией комиксов ? пара дней и закончу вот это: https://mangatv.shop/
Сегодня запустил на 5 часов в тестовом режиме - и вот результат! 50 историй.