Распознавание речи оффлайн требует установки нейронки у себя. Проблема даже не в том, что нет оффлайн-версии, а в том что нет отдельного приложения, поверх ОС. А не вот этих браузерных калек.
Скормил этим «лучшим» свои промпты. Как обычно. У нейронок максимальное «быдломышление» и ничего даже мало-мальски оригинального они не могут соорудить. Всё плохо. Ну точнее всё хорошо: у иллюстраторов есть работа и будет.
На деле нужен ассистент, который бы распознавал речь, давал поправить или ввести текст, открывал нужные окошки и вбивал указанные цифры. То есть убирал рутину. Сама генерация точного 3д не требуется, ибо и так есть программы.
Многие компании ударились в ИИ, который «умеет всё». Но умеет он плохо. Часто неприемлемо плохо.
Очень туго дела идут с более узкими, точными и эффективными инструментами. Тот же Tencent к своей сетке уже прикрутил а) генератор картинки Т-позы из обычной позы б) определение точек суставов и прикручивание рига к гуманоидным моделям. Да, качество там ужас, но для драфта годится, сильно облегчает работу, а это главное.
При том что есть ряд библиотек с гуманоидами, есть ряд генераторов базовых мешей человека, нет ни одной нейронки, которая бы занималась следующим: Посмотреть на картинку и описание, сделать выводы, какие ползунки в генераторе надо крутнуть, крутнуть эти ползунки, проверить модель на перехлёсты поверхностей, разгладить перехлёсты, надуть/деформировать детали для большего сходства с картинкой (силуэт, карта глубины), сделать несколько рендеров, проверить их на вменяемость (уродливые деформации, соответствие описанию), вправить деформации.
Зачем возиться с генератором? Да затем, что там изначально есть модель с хорошей топологией, развёрткой и регулируемая. То есть итог будет гораздо более пригоден для работы. Возня с этими ползунками и базовыми подправками сжирает пару часов.
«Но есть же метахуман!» скажут многие А метахуман — дерьмина, которая порождает исключительно унылых однообразных и неприятных кукольных симметричных статистов третьего плана. Деформеры, которые там как бы выданы, прибиты гвоздями к лимитам и симметриям, к тому же деформеры являются костями, что сильно смыливает результат. А если экспортировать и переделывать ручками, то сначала нужно уничтожить многое, что сгенерировано и открутить многое прикрученное, что нерационально. Всё на что осмелились эпики — дать делать кривые зубы генератором. А вот свёрнутый или сломанный нос уже никак. В нулевых была какая-то программка примерно такого толка, и даже там был режим «потягать вершины руками».
Как бы да, задача генерировать «каких-то там прохожих массово» закрыта. Только вот прохожих и на стоках валом. И будет ещё больше.
А задача дать автору удобную болванку, частично приближенную к эскизу/описанию даже не начиналась. Тот же Тенцент куда ближе к этому подобрался.
8 миллиардов человек — источники креативности, целеполагания и смысла
Дальше я даже читать не буду. Тут не от всякого специалиста в своём деле и не каждый день креативности можно ожидать, а у тебя аж 8 миллиардов… Угу… 8 миллиардов мясных тушек. Некоторые из которых иногда озаряются. Причём в отличии от мозга, в котором то одни то другие, тут у нас стойкое меньшинство и хомяки
Забавно, конечно, но доверия нет к системе, которая всё ещё не может почитать слово по слогам, если прямо у неё об этом не спросить. Тут вам и суффикс -ое и слоги шн-нш…
Нейросети хороши в том, чтобы выдать набор вероятностей по потенциальным заболеваниям, исходя из большого набора данных о симптомах. Но уязвимы к галлюцинациям из-за малейших расхождений в данных.
Хотя человек тоже может наплести не того, потому что голодный и или хочет писать, а тут вопросы какие-то.
Перевод с озвучкой — дело хорошее. Синтез речи давно уже выше приемлемого уровня. А вот перевод очень страдает даже в мало-мальски специализированных видео.
1. один и тот же термин в течение всего видео переводится по-разному. 2. Термин или слово переводится неправильно, абсолютно в отрыве от темы видео.
Это общая беда нейронок сейчас — отсутствие памяти со знаниями и вообще плотного взаимодействия с классическими алгоритмами. То есть определить тематику видео, собрать слова по применению, найти среди них термины, перевести термины в контексте тематики, сохранить этот перевод термина как правильный, использовать этот перевод термина на протяжении всего видео.
вряд ли прям всегда, но представь это так. Однажды появляется некий инструмент. У него точно есть какие-то рукоятки, стороны, какая-то форма. И этот инструмент лежит потом много лет нетленным. Высока вероятность, что однажды этот кусочек паззла отлично подойдёт куда-нибудь. При бесконечном времени жизни человечества вероятность эта стопроцентна по идее.
Возможно выводы с разных слоёв батареи, чтобы оставалась возможность тасовать последовательно/параллельно не запариваясь с преобразователем и потерями на нём.
Аналогично. Качаю демо-версию в «зелёном Стиме», большую часть удаляю меньше чем через час. Но то что прошёл или понравилось сильно — покупаю за сколько могу. В смысле что-то за полную цену, что-то за скидочную.
Купил пару раз наобум. Оба раза делал рефанд. Например купился на картинку, а внутри баги, не дающие играть или прозрачные стены, усложняющие и затягивающие прохождение.
Например тонкий карниз, по которому персонаж сначала может идти а потом сталкивается этой невидимой стеной, идущей явно наискось. То есть решение как бы есть, оно видимое, но на деле, после запарных прыжков и залезания на карниз оказывается, что «это не то решение, которое разработчик считает единственно верным». ЪУЪ! Потому при современном состоянии игр уж извините, но только постоплата. Ибо если я на 90% пройду игру а потом она баганёт и сотрёт мне все сохранёнки, нагадив в настроение, то почему я должен за такое разочарование ещё и вывалить денег? Мне вот на работе за результат платят.
Не очень понял. А ГПТ пропитан? Можно пример, в чём это выражалось? > обсуждать Щас бы с википедией что-то обсуждать. Обсуждать стоит с умнейшими людьми планеты. Или с разбирающимися в конкретной узкой теме. А в остальном — читать первоисточники. И просто приятно болтать с кем-то ради социального контакта. Обсуждать с чатботом это как играть в игры (играю, люблю, если чо). Без шанса, что ты умрёшь или без шанса почувствовать себя идиотом.
Экскурс занимательный. Но само искусство… кхм… Мне кажется, чтобы такое ценить сейчас, нужно быть человеком прошлого, не насмотренным, неискушённым, не желающим сравнивать.
Глядя на такие фрагменты, я внутренне закипаю. Ну зачем было настолько повторять символьное лицо, причём лишь дважды? Это плохо работает как ритм и скорее читается как клон. Смысл имело бы исключительно в смысле «вторая лишь тень и копия первой, полное подчинение». Но даже с таким смыслом подобный клон-штамп неэстетичен.
Уже сейчас человеческий разум не в силах оседлать то обилие тонких корреляций, которое нейросети могут превращать в простые ответы. Дело в количестве, переходящем в качество. Системное свойство, или как модно ныне говорить «эмерджентность». Человек способен на интуицию. На мой взгляд нейронки базово сейчас как раз работают аналогично интуиции. Только эдакого замороженного состояния интуиции, в силу статичного состояния обученной НС.
Напротив, есть вполне известные варианты. И идём местами туда. Увеличение технологичности. Удешевление энергии Увеличение собственной мощи в области адаптации среды и всей планеты под себя и нужные нам виды. Искоренение войн и полная консолидация человечества. Исправление и улучшение генов модификациями, ибо пока человеки остаются жадными или голодными обезьянами, проблем от этого будет оставаться море чисто обезьяньих. Пока большинство предпочитает идти за крикливыми лидерами, умеющими красиво врать и себя рекламировать, лидерами будут оставаться именно такие особи и их свита (всякие политтехнологи, не дай боже вам с ними «дружить»)
Распознавание речи оффлайн требует установки нейронки у себя.
Проблема даже не в том, что нет оффлайн-версии, а в том что нет отдельного приложения, поверх ОС. А не вот этих браузерных калек.
локально inpaint-модели.
Пока что отличаю, если она не мелкая в шуме и мыле. И если это не рисунок уровня чёрных линий и заливки.
Это для тебя может нереально.
Скормил этим «лучшим» свои промпты. Как обычно. У нейронок максимальное «быдломышление» и ничего даже мало-мальски оригинального они не могут соорудить. Всё плохо. Ну точнее всё хорошо: у иллюстраторов есть работа и будет.
шото его глючит даже на этапе понимания начального промпта.
На деле нужен ассистент, который бы распознавал речь, давал поправить или ввести текст, открывал нужные окошки и вбивал указанные цифры. То есть убирал рутину. Сама генерация точного 3д не требуется, ибо и так есть программы.
Многие компании ударились в ИИ, который «умеет всё». Но умеет он плохо. Часто неприемлемо плохо.
Очень туго дела идут с более узкими, точными и эффективными инструментами.
Тот же Tencent к своей сетке уже прикрутил а) генератор картинки Т-позы из обычной позы
б) определение точек суставов и прикручивание рига к гуманоидным моделям.
Да, качество там ужас, но для драфта годится, сильно облегчает работу, а это главное.
При том что есть ряд библиотек с гуманоидами, есть ряд генераторов базовых мешей человека, нет ни одной нейронки, которая бы занималась следующим:
Посмотреть на картинку и описание, сделать выводы, какие ползунки в генераторе надо крутнуть, крутнуть эти ползунки, проверить модель на перехлёсты поверхностей, разгладить перехлёсты, надуть/деформировать детали для большего сходства с картинкой (силуэт, карта глубины), сделать несколько рендеров, проверить их на вменяемость (уродливые деформации, соответствие описанию), вправить деформации.
Зачем возиться с генератором? Да затем, что там изначально есть модель с хорошей топологией, развёрткой и регулируемая. То есть итог будет гораздо более пригоден для работы. Возня с этими ползунками и базовыми подправками сжирает пару часов.
«Но есть же метахуман!» скажут многие
А метахуман — дерьмина, которая порождает исключительно унылых однообразных и неприятных кукольных симметричных статистов третьего плана. Деформеры, которые там как бы выданы, прибиты гвоздями к лимитам и симметриям, к тому же деформеры являются костями, что сильно смыливает результат. А если экспортировать и переделывать ручками, то сначала нужно уничтожить многое, что сгенерировано и открутить многое прикрученное, что нерационально. Всё на что осмелились эпики — дать делать кривые зубы генератором. А вот свёрнутый или сломанный нос уже никак. В нулевых была какая-то программка примерно такого толка, и даже там был режим «потягать вершины руками».
Как бы да, задача генерировать «каких-то там прохожих массово» закрыта. Только вот прохожих и на стоках валом. И будет ещё больше.
А задача дать автору удобную болванку, частично приближенную к эскизу/описанию даже не начиналась. Тот же Тенцент куда ближе к этому подобрался.
Дальше я даже читать не буду. Тут не от всякого специалиста в своём деле и не каждый день креативности можно ожидать, а у тебя аж 8 миллиардов… Угу… 8 миллиардов мясных тушек. Некоторые из которых иногда озаряются. Причём в отличии от мозга, в котором то одни то другие, тут у нас стойкое меньшинство и хомяки
Я очень надеюсь, что название команды происходит от приставки «фемто».
В противном случае это маркер острого поражения тканей мозга.
Забавно, конечно, но доверия нет к системе, которая всё ещё не может почитать слово по слогам, если прямо у неё об этом не спросить. Тут вам и суффикс -ое и слоги шн-нш…
Нейросети хороши в том, чтобы выдать набор вероятностей по потенциальным заболеваниям, исходя из большого набора данных о симптомах. Но уязвимы к галлюцинациям из-за малейших расхождений в данных.
Хотя человек тоже может наплести не того, потому что голодный и или хочет писать, а тут вопросы какие-то.
если бы параллакс работал через лентикулярную линзу, то есть изображение для двух глаз было бы разным — есть смысл, а так нафик
остаётся начать переводить
Перевод с озвучкой — дело хорошее. Синтез речи давно уже выше приемлемого уровня.
А вот перевод очень страдает даже в мало-мальски специализированных видео.
1. один и тот же термин в течение всего видео переводится по-разному.
2. Термин или слово переводится неправильно, абсолютно в отрыве от темы видео.
Это общая беда нейронок сейчас — отсутствие памяти со знаниями и вообще плотного взаимодействия с классическими алгоритмами. То есть определить тематику видео, собрать слова по применению, найти среди них термины, перевести термины в контексте тематики, сохранить этот перевод термина как правильный, использовать этот перевод термина на протяжении всего видео.
вряд ли прям всегда, но представь это так.
Однажды появляется некий инструмент. У него точно есть какие-то рукоятки, стороны, какая-то форма. И этот инструмент лежит потом много лет нетленным. Высока вероятность, что однажды этот кусочек паззла отлично подойдёт куда-нибудь.
При бесконечном времени жизни человечества вероятность эта стопроцентна по идее.
Возможно выводы с разных слоёв батареи, чтобы оставалась возможность тасовать последовательно/параллельно не запариваясь с преобразователем и потерями на нём.
Аналогично. Качаю демо-версию в «зелёном Стиме», большую часть удаляю меньше чем через час. Но то что прошёл или понравилось сильно — покупаю за сколько могу. В смысле что-то за полную цену, что-то за скидочную.
Купил пару раз наобум. Оба раза делал рефанд.
Например купился на картинку, а внутри баги, не дающие играть или прозрачные стены, усложняющие и затягивающие прохождение.
Например тонкий карниз, по которому персонаж сначала может идти а потом сталкивается этой невидимой стеной, идущей явно наискось. То есть решение как бы есть, оно видимое, но на деле, после запарных прыжков и залезания на карниз оказывается, что «это не то решение, которое разработчик считает единственно верным». ЪУЪ!
Потому при современном состоянии игр уж извините, но только постоплата. Ибо если я на 90% пройду игру а потом она баганёт и сотрёт мне все сохранёнки, нагадив в настроение, то почему я должен за такое разочарование ещё и вывалить денег? Мне вот на работе за результат платят.
Не очень понял. А ГПТ пропитан? Можно пример, в чём это выражалось?
> обсуждать
Щас бы с википедией что-то обсуждать. Обсуждать стоит с умнейшими людьми планеты. Или с разбирающимися в конкретной узкой теме.
А в остальном — читать первоисточники. И просто приятно болтать с кем-то ради социального контакта.
Обсуждать с чатботом это как играть в игры (играю, люблю, если чо). Без шанса, что ты умрёшь или без шанса почувствовать себя идиотом.
Экскурс занимательный. Но само искусство… кхм… Мне кажется, чтобы такое ценить сейчас, нужно быть человеком прошлого, не насмотренным, неискушённым, не желающим сравнивать.
Глядя на такие фрагменты, я внутренне закипаю. Ну зачем было настолько повторять символьное лицо, причём лишь дважды? Это плохо работает как ритм и скорее читается как клон. Смысл имело бы исключительно в смысле «вторая лишь тень и копия первой, полное подчинение». Но даже с таким смыслом подобный клон-штамп неэстетичен.
Уже сейчас человеческий разум не в силах оседлать то обилие тонких корреляций, которое нейросети могут превращать в простые ответы.
Дело в количестве, переходящем в качество. Системное свойство, или как модно ныне говорить «эмерджентность».
Человек способен на интуицию. На мой взгляд нейронки базово сейчас как раз работают аналогично интуиции. Только эдакого замороженного состояния интуиции, в силу статичного состояния обученной НС.
Напротив, есть вполне известные варианты.
И идём местами туда.
Увеличение технологичности.
Удешевление энергии
Увеличение собственной мощи в области адаптации среды и всей планеты под себя и нужные нам виды.
Искоренение войн и полная консолидация человечества.
Исправление и улучшение генов модификациями, ибо пока человеки остаются жадными или голодными обезьянами, проблем от этого будет оставаться море чисто обезьяньих.
Пока большинство предпочитает идти за крикливыми лидерами, умеющими красиво врать и себя рекламировать, лидерами будут оставаться именно такие особи и их свита (всякие политтехнологи, не дай боже вам с ними «дружить»)