В статью это не попало, но я написал в техподдержку трех провайдеров и вот что произошло:
В одном (Нидерланды) меня проигнорировали. Совсем и полностью.
В другом (Россия) мне сказали, что заявка зарегистрирована, уровень техподдержки: 9/5, время ответа — 48 часов. Не ответили спустя неделю.
В третьем (Франция) мне отправили заглушку, что разберутся в течение 24-48 часов. И через 24 часа отправили, что от меня мало данных. Им надо мое имя (это часть формы), журнал событий/лог (отправил) и юридическое обоснование почему моя жалоба должна мотивировать их к действиям. А раз этого нет, то заявка закрывается. Раскручивать их дальше на действия я не стал, чего бороться с мельницами.
Приложение загружается как самостоятельный исполняемый файл.
Это для разработки можно использовать эти два подхода, но на выходе получается nfc_crocodile.fap, который пользователь может положить на флешку флиппера и всё, приложение установлено.
Ну я, со своей стороны, выбрал ту игру, в которой мне хочется ковыряться. Плюс «плоские» игры несколько увеличивают аудиторию, VR-шлем + заводской жилет — очень не бюджетное удовольствие
Квантизаций нет. Насчет кэшей и как именно оно там работает — это, наверное, лучше в первоисточнике почитать (https://arxiv.org/abs/2303.06865). Вычисление на несколько машин — нет, максимум умеет на несколько GPU в пределах одной ноды растягивать.
А вот чем лучше... Это в каких задачах. Для диалоговых систем, например, очень сомнительно, что FlexGen лучше. Если вам по каким-то причинам надо пропустить через текстовую модель с кучей параметров (например, 175B) сотни или тысячи документов, то лучше FlexGen, как раз потому что он именно для этого и предназначен. Хотя такие задачи очень и очень специфичны.
Штука может пригодиться, если у вас очень, очень много запросов. В этом случае, конечно, надо бы стучать фронту по голове - так быть не должно, но фильтры пригодятся.
Зачем стучать фронтенду по голове, если количество запросов зависит от схемы данных у бэкэнда? Правда если бэкэндер будет отдавать все за один запрос, то рано или поздно случится ситуация «Зачем вы отдаете мегабайт данных, которые формируете пару секунд, если нам нужно одно поле... Руки бы оторвать этому бэкэндеру» х)
Мы с помощью cypress кроме полного e2e тестирования
e2e тесты напрямую зависят от сложности вашей системы. Если вы можете поднять все на локальной машине (или в CI) по щелчку пальцев, штош, это определенно приятно. Но иногда организация тестового окружения может удвоить стоимость содержания и обслуживания системы и бизнес может не согласиться с такими условиями.
Именно сервер, в серверном корпусе и с серверной видеокартой, вам вряд ли захочется поставить под кровать. У серверных видеокарт обычно пассивное охлаждение, так что нужен соответствующий серверный корпус, в котором вентиляторы орут так, что никакая виртуальная девушка вам будет не нужна. А может и реальная после такого уйдет.
Зато если у вас есть свободная кладовка с шумоизоляцией, то это уже совершенно другой, профессиональный подход. Как-то так мой коллега написал в блог статью о домашнем ДЦ, хотя это вызвало немало дискуссий.
Ну, если есть RTX4090 под кроватью, то может быть и выгоднее х)
Можно снизить затраты путем смены GPU, например, на А5000. Там 24 ГБ VRAM, кажется, под эти задачи подойдет, а цена в два раза меньше.
Ну и если нет серьезных требований к аптайму, то поминутная (посекундная!) тарификация в облаке -- это отличный выбор. Отличный выбор, который можно приправить «прерывайкой» (прервываемыми инстансами), что ещё снизит затраты.
Сделать образ, который при первом запросе стремительно разворачивать, а при отсутствии запросов в течение, например, получаса, также стремительно гасить.
Мечты — это внутренний «продукт». Поэтому я считаю, что вопрос этичности лежит на мечтателе, до тех пор, пока мечты остаются только в голове человека.
Мечтами, конечно, можно сделать контент в виде разговора или действительно написать картину. Но разговоры — это лишь воздействие на собеседника подумать о чем-то конкретном. Это не вызовет ту же картинку и те же желания х)
Написание картины — это нелегкий процесс, требующий (а) умения (б) желания и (в) мотивации. Да и будет грустно, если «модель» (успешно) попытается уничтожить картину.
Современные технологии в этом плане обесценивают старания. Взял чекпоинты для SD, которые натренированы рисовать прекрасных дам без одежды и понеслась.
Гурманы могут взять ещё какую-нибудь модификацию на конкретного человека или что там им нравится. Я пока готовил эту статью, я находил Textual Inversion, которые рисует женщин-бодибилдеров и чекпоинты (не помню, LoRA, кажется) на какую-то известную женщину. Ух, сколько всего можно придумать! На ровном месте сгенерировать сотни правдоподобных изображений, а интернет помнит всё.
Пожалуй, дополню свой предыдущий комментарий замечанием, что делать контент, а затем распространять без согласия — вот это плохо. Пока контент не трогает других людей (и даже так не нарушает законы) — ну штош, пусть будет.
Облачным провайдерам, да. Хотя некоторые из них и железо в аренду дают.
Вот их AS из моего комментария: AS49305 (NL), AS208677 (RU), AS12876 (FR)
Жалобы провайдеру — это вообще интересный зверь.
В статью это не попало, но я написал в техподдержку трех провайдеров и вот что произошло:
В одном (Нидерланды) меня проигнорировали. Совсем и полностью.
В другом (Россия) мне сказали, что заявка зарегистрирована, уровень техподдержки: 9/5, время ответа — 48 часов. Не ответили спустя неделю.
В третьем (Франция) мне отправили заглушку, что разберутся в течение 24-48 часов. И через 24 часа отправили, что от меня мало данных. Им надо мое имя (это часть формы), журнал событий/лог (отправил) и юридическое обоснование почему моя жалоба должна мотивировать их к действиям. А раз этого нет, то заявка закрывается. Раскручивать их дальше на действия я не стал, чего бороться с мельницами.
Результат [исполняемый файл игры] действительно специфичный и мало кому потребуется. Риск был просчитан и я его принял х)
Вместе с тем, результат [статья-туториал] явно будет полезна разработчикам, которые хотят сделать что-то своё на флиппер.
Приложение загружается как самостоятельный исполняемый файл.
Это для разработки можно использовать эти два подхода, но на выходе получается nfc_crocodile.fap, который пользователь может положить на флешку флиппера и всё, приложение установлено.
Ну я, со своей стороны, выбрал ту игру, в которой мне хочется ковыряться.
Плюс «плоские» игры несколько увеличивают аудиторию, VR-шлем + заводской жилет — очень не бюджетное удовольствие
Доступ к шаверма-каналу только после трудоустройства в Selectel ;)
Квантизаций нет.
Насчет кэшей и как именно оно там работает — это, наверное, лучше в первоисточнике почитать (https://arxiv.org/abs/2303.06865).
Вычисление на несколько машин — нет, максимум умеет на несколько GPU в пределах одной ноды растягивать.
А вот чем лучше... Это в каких задачах. Для диалоговых систем, например, очень сомнительно, что FlexGen лучше.
Если вам по каким-то причинам надо пропустить через текстовую модель с кучей параметров (например, 175B) сотни или тысячи документов, то лучше FlexGen, как раз потому что он именно для этого и предназначен. Хотя такие задачи очень и очень специфичны.
Зачем стучать фронтенду по голове, если количество запросов зависит от схемы данных у бэкэнда? Правда если бэкэндер будет отдавать все за один запрос, то рано или поздно случится ситуация «Зачем вы отдаете мегабайт данных, которые формируете пару секунд, если нам нужно одно поле... Руки бы оторвать этому бэкэндеру» х)
e2e тесты напрямую зависят от сложности вашей системы. Если вы можете поднять все на локальной машине (или в CI) по щелчку пальцев, штош, это определенно приятно. Но иногда организация тестового окружения может удвоить стоимость содержания и обслуживания системы и бизнес может не согласиться с такими условиями.
Котики с КДПВ — это генерация MJv5 по запросу, который можно перевести как "коты в серверной комнате"
К сожалению, Inpaint/Outpaint не завезли.
И пока нет надежд, что завезут, так как интерфейс дискорда не очень удобен для таких задач.
Именно сервер, в серверном корпусе и с серверной видеокартой, вам вряд ли захочется поставить под кровать. У серверных видеокарт обычно пассивное охлаждение, так что нужен соответствующий серверный корпус, в котором вентиляторы орут так, что никакая виртуальная девушка вам будет не нужна. А может и реальная после такого уйдет.
Зато если у вас есть свободная кладовка с шумоизоляцией, то это уже совершенно другой, профессиональный подход. Как-то так мой коллега написал в блог статью о домашнем ДЦ, хотя это вызвало немало дискуссий.
Мне захотелось побыть душнилой, извините.
Но ведь... "Пару минут" (для float32) и "20 секунд" (для float16)...
Человеческий мозг -- это тоже нейронная сеть. Так что 100% моих текстов написаны с использованием нейронных сетей.
Ну, если есть RTX4090 под кроватью, то может быть и выгоднее х)
Можно снизить затраты путем смены GPU, например, на А5000. Там 24 ГБ VRAM, кажется, под эти задачи подойдет, а цена в два раза меньше.
Ну и если нет серьезных требований к аптайму, то поминутная (посекундная!) тарификация в облаке -- это отличный выбор. Отличный выбор, который можно приправить «прерывайкой» (прервываемыми инстансами), что ещё снизит затраты.
Сделать образ, который при первом запросе стремительно разворачивать, а при отсутствии запросов в течение, например, получаса, также стремительно гасить.
Все верно, абсолютно бесплатных вариантов нет.
Но можно получить 18$ на тесты у OpenAI и ещё 300$ у Google, которые можно потратить на Text-to-Speech
А я ваш проект в своей статье упоминал, где же взаимность(
На домашнем компьютере примерно 10 секунд, на сервере — 2-3.
Благодарю за уточнения!
Его нет.
Если нет аннотаций, то нужно использовать запросы без
[filewords]
Мечты — это внутренний «продукт». Поэтому я считаю, что вопрос этичности лежит на мечтателе, до тех пор, пока мечты остаются только в голове человека.
Мечтами, конечно, можно сделать контент в виде разговора или действительно написать картину. Но разговоры — это лишь воздействие на собеседника подумать о чем-то конкретном. Это не вызовет ту же картинку и те же желания х)
Написание картины — это нелегкий процесс, требующий (а) умения (б) желания и (в) мотивации. Да и будет грустно, если «модель» (успешно) попытается уничтожить картину.
Современные технологии в этом плане обесценивают старания. Взял чекпоинты для SD, которые натренированы рисовать прекрасных дам без одежды и понеслась.
Гурманы могут взять ещё какую-нибудь модификацию на конкретного человека или что там им нравится. Я пока готовил эту статью, я находил Textual Inversion, которые рисует женщин-бодибилдеров и чекпоинты (не помню, LoRA, кажется) на какую-то известную женщину. Ух, сколько всего можно придумать! На ровном месте сгенерировать сотни правдоподобных изображений, а интернет помнит всё.
Пожалуй, дополню свой предыдущий комментарий замечанием, что делать контент, а затем распространять без согласия — вот это плохо. Пока контент не трогает других людей (и даже так не нарушает законы) — ну штош, пусть будет.