Модели не способны создавать принципиально новые парадигмы, без человеческого вмешательства и отбора. Они гениальные плагиаторы, но не самостоятельные творцы в нашем понимании.
Но это же не так. Дифузионные сети буквально создают результат из случайного шума. (обычно псевдослучайного, но не суть - при желании можно и случайную шумелку прикрутить.) Это похоже на то, как люди видят картинки в облаках или хаотичном узоре, они без случайного шума вообще не могут работать. Трансформеры могут, но и там накладывают шум чтобы обеспечить оригинальность результата.
Регулируя параметры сети и взаимодействуя с ее латентом можно получить любое необходимое количество оригинальности, однако судя по всему это не особо кому-то нужно.
Напирмер, для картинок воздействуя на латент можно получить полностью оригинальные стили исполнения. Это впринципе было очевидно уже во времена когда появились модели для переноса стилей - заполните стилевые нейроны случайными или аналитически полученными значениями и вуаля - вы обладаетль оригинального стиля.
Тот же самый фокус можно проделать с актуальными генераторами изображений, но возни конечно побольше. Пример: https://arxiv.org/pdf/2307.12868
Однако люди хотят от сетей предсказуемости, они ее и получают.
В вашем примере надо сравнивать с другим хомяком - который "Sell & Hold" - он больше чем удвоил капитал. Вообще проверять торговую стратегию на случайно сгенерированных данных, да еще и с известным перекосом в одну сторону, это довольно странная идея.
SDXL практически умер от старости, если не считать хентайные файнтюны типа pony/illustrious. У SDXL врожденные проблеммы в виде слабого текст энкодера и маленького VAE Актуальный фотореализм это qwen и z-image-turbo
Большинство видео с припадочными роботами - это китайский Unitree G1. Это по сути исследовательская локомоушин платформа, поставляемая с довольно примитивным софтом и SDK. И он как раз бьется в припадке потому что пытается восстановить равновесие в ситуации когда ситуация вышла за пределы возможностей регуляции. При этом на самом деле определять падение и вставать он умеет, просто по каким-то причинам это бывает отключено/сломано. А еще он не разваливается при падении: https://www.youtube.com/watch?v=bPSLMX_V38E
При всем уважении к промоботу и прочим участникам этого проекта, пока этот aidol выглядит как слишком рано собранный комитетом верблюд. Может начинать с меньшего замаха - сначала тушку ходить научить, а потом уже лицо и LLM прикручивать?
Не очень понятно как тележки Брайтенберга это демонстрируют. Их поведение похоже в лучшем случае на поведение насекомых. При этом по сути своей они и есть - грубая модель нервной системы насекомых. Что и как это доказывает?
Это первый случай, когда настолько быстрая видеогенерация стала доступна в открытом формате.
Self forcing LoRA доступны для Wan 2.1 и Wan 2.2 уже давно. Для генерации в четыре шага в Krea Realtime используется открытая lightx2v которую они не обучали, а взяли готовой.
Фишка здесь не в Self forcing а в преобразовании диффузионной модели в авторегресионную, строящую следующие кадры на основании предидущих.
Значимость новой модели не столько в быстрой видеогенерации - wan 2.2 может и в три шага генерировать (1 high + 2 low) с вполне приличным результатом, а в том что она генерирует не все кадры видео сразу, а в виде потока кадров, что: 1) снимает ограничение на длинну ролика 2) позволяет получать результат покадрово, не дожидаясь полной генерации ролика 3) позволяет менять промт на лету, по мере генерации
Вообще-то умеют, гуглить continual learning. Статей по теме в этом году уже много. Но чат боту это и не нужно, наоброт ему это вредно - так как низкое качество датасета сильно снижает качество модели, то что учиться на обещнии с обычным пользователями идея так себе. А вот для роботов оперирующих в естсественной среде - самое оно.
Из текста этого не следует. В тексте вообще не звучит название модели и говорится о GPT-5. А это вообще не модель, а комплекс моделей объединенных роутером.
Что-то неправдой попахивает. Судя по тому как торопливо OpenAI перевела всех пользователей, в том числе бесплатных, на GPT-5 - новые модели заметно экономнее старых, за исключением возможно топовой Gpt-5-high, которая даже платным пользователям недоступна просто так. Ну и опять же по косвенным признакам - большинство новых моделей это MoE с большим количеством небольших экспертов.
Если ИИ упрется в какой-то невидимый нам сейчас потолок, то того что уже наделали хватит лет на десять освоения, оптимизации и утилизации хотя-бы по минимуму. Так что дешевых бу видеокарт ждать не приходится. Наоброт - они могу появится если зима не наступит, и нейросети переедут на специализированные решения, как было с биткоином.
Не знаю как где, но в Сербии граждане регулярно прогибают чиновников, иногда даже избыточно сильно. Из-за этого иногда суды выдают вердикты не по закону, а потому что собралась достаточно большая толпа и требует. Впрочем, случаи когда государство все-таки упирается тоже бывают. Но можно считать что в этом случае толпа просто недостаточно большая.
Можно считать что это так и есть. История диалогов все равно сохраняется вся, и вполне вероятно что их позже просто включат в контекст бота целиком, или прикрутят к ним какой-то более совершенный механизм индексации и агента с возможностью поиска по ним. И понятно, что ничего не мешает компании хранить все диалоги, а удаленные и приватные просто не показывать пользователю.
Не очень понятен ваш сарказм в этом случае - южнокорейская пресса конечно бывает привирает про соседа, но особенности северокорейской операционки давно известны, это федора с корейским интерфейсом, заблоченным рутом и тонной спайваре поверх. Образы старых версий в сети есть, можете самостоятельно посмотреть.
Институт судебных приставов как система обеспечения судебной власти просуществовал до начала XX века и был упразднен Декретом Совета Народных Комиссаров № 1 от 24 ноября 1917 года одновременно с ликвидацией прежней судебной системы, распустившим все судебные и государственные органы Российской системы.
...
В 1997 году Федеральным законом от 21.07.1997 № 118-ФЗ «О судебных приставах» создана Федеральная служба судебных приставов (ФССП).
В ЕС "резко выросшие цены" это примерно 10-15 процентов за 2023 год. Но так, да, на фоне типичной 2% потребительской инфляции - действительно не привыкли.
Кста, про Ротшильда это конспирология. Если попросить указать его как David M. de Rothschild - возвращалась корректная информация, а без "de Rothschild" там целый список вываливался, да еще и разный в зависимоти от модели и ее настроения. Фильтр применялся к выдаче модели позднее. Т.е. зацензурена не модель, там внешний фильтр для веб пользователей.
Но это же не так.
Дифузионные сети буквально создают результат из случайного шума. (обычно псевдослучайного, но не суть - при желании можно и случайную шумелку прикрутить.)
Это похоже на то, как люди видят картинки в облаках или хаотичном узоре, они без случайного шума вообще не могут работать.
Трансформеры могут, но и там накладывают шум чтобы обеспечить оригинальность результата.
Регулируя параметры сети и взаимодействуя с ее латентом можно получить любое необходимое количество оригинальности, однако судя по всему это не особо кому-то нужно.
Напирмер, для картинок воздействуя на латент можно получить полностью оригинальные стили исполнения. Это впринципе было очевидно уже во времена когда появились модели для переноса стилей - заполните стилевые нейроны случайными или аналитически полученными значениями и вуаля - вы обладаетль оригинального стиля.
Тот же самый фокус можно проделать с актуальными генераторами изображений, но возни конечно побольше. Пример:
https://arxiv.org/pdf/2307.12868
Однако люди хотят от сетей предсказуемости, они ее и получают.
В вашем примере надо сравнивать с другим хомяком - который "Sell & Hold" - он больше чем удвоил капитал.
Вообще проверять торговую стратегию на случайно сгенерированных данных, да еще и с известным перекосом в одну сторону, это довольно странная идея.
Чему там радоваться - это просто концепт.
Хотите качества, используйте Wan 2.2. Хотите сокорость и нативный звук - LTX2. 4080 хватит с избытком.
SDXL практически умер от старости, если не считать хентайные файнтюны типа pony/illustrious. У SDXL врожденные проблеммы в виде слабого текст энкодера и маленького VAE
Актуальный фотореализм это qwen и z-image-turbo
Ну там же вон, здоровые бухты припоя стоят - явно паяют. И модные паяльники с лампочками. Нейросеть явно переоценивает оснащенность школы
Большинство видео с припадочными роботами - это китайский Unitree G1. Это по сути исследовательская локомоушин платформа, поставляемая с довольно примитивным софтом и SDK. И он как раз бьется в припадке потому что пытается восстановить равновесие в ситуации когда ситуация вышла за пределы возможностей регуляции. При этом на самом деле определять падение и вставать он умеет, просто по каким-то причинам это бывает отключено/сломано. А еще он не разваливается при падении:
https://www.youtube.com/watch?v=bPSLMX_V38E
При всем уважении к промоботу и прочим участникам этого проекта, пока этот aidol выглядит как слишком рано собранный комитетом верблюд. Может начинать с меньшего замаха - сначала тушку ходить научить, а потом уже лицо и LLM прикручивать?
Не очень понятно как тележки Брайтенберга это демонстрируют. Их поведение похоже в лучшем случае на поведение насекомых. При этом по сути своей они и есть - грубая модель нервной системы насекомых. Что и как это доказывает?
Self forcing LoRA доступны для Wan 2.1 и Wan 2.2 уже давно. Для генерации в четыре шага в Krea Realtime используется открытая lightx2v которую они не обучали, а взяли готовой.
Фишка здесь не в Self forcing а в преобразовании диффузионной модели в авторегресионную, строящую следующие кадры на основании предидущих.
Значимость новой модели не столько в быстрой видеогенерации - wan 2.2 может и в три шага генерировать (1 high + 2 low) с вполне приличным результатом, а в том что она генерирует не все кадры видео сразу, а в виде потока кадров, что:
1) снимает ограничение на длинну ролика
2) позволяет получать результат покадрово, не дожидаясь полной генерации ролика
3) позволяет менять промт на лету, по мере генерации
Вообще-то умеют, гуглить continual learning. Статей по теме в этом году уже много. Но чат боту это и не нужно, наоброт ему это вредно - так как низкое качество датасета сильно снижает качество модели, то что учиться на обещнии с обычным пользователями идея так себе. А вот для роботов оперирующих в естсественной среде - самое оно.
Из текста этого не следует. В тексте вообще не звучит название модели и говорится о GPT-5. А это вообще не модель, а комплекс моделей объединенных роутером.
Что-то неправдой попахивает. Судя по тому как торопливо OpenAI перевела всех пользователей, в том числе бесплатных, на GPT-5 - новые модели заметно экономнее старых, за исключением возможно топовой Gpt-5-high, которая даже платным пользователям недоступна просто так.
Ну и опять же по косвенным признакам - большинство новых моделей это MoE с большим количеством небольших экспертов.
Если ИИ упрется в какой-то невидимый нам сейчас потолок, то того что уже наделали хватит лет на десять освоения, оптимизации и утилизации хотя-бы по минимуму. Так что дешевых бу видеокарт ждать не приходится. Наоброт - они могу появится если зима не наступит, и нейросети переедут на специализированные решения, как было с биткоином.
Кстати, а что мешает человеку обманывающему работодателя кинуть инфоцыгана? Непонятно...
Не знаю как где, но в Сербии граждане регулярно прогибают чиновников, иногда даже избыточно сильно. Из-за этого иногда суды выдают вердикты не по закону, а потому что собралась достаточно большая толпа и требует. Впрочем, случаи когда государство все-таки упирается тоже бывают. Но можно считать что в этом случае толпа просто недостаточно большая.
Можно считать что это так и есть. История диалогов все равно сохраняется вся, и вполне вероятно что их позже просто включат в контекст бота целиком, или прикрутят к ним какой-то более совершенный механизм индексации и агента с возможностью поиска по ним.
И понятно, что ничего не мешает компании хранить все диалоги, а удаленные и приватные просто не показывать пользователю.
Не очень понятен ваш сарказм в этом случае - южнокорейская пресса конечно бывает привирает про соседа, но особенности северокорейской операционки давно известны, это федора с корейским интерфейсом, заблоченным рутом и тонной спайваре поверх. Образы старых версий в сети есть, можете самостоятельно посмотреть.
В ЕС "резко выросшие цены" это примерно 10-15 процентов за 2023 год. Но так, да, на фоне типичной 2% потребительской инфляции - действительно не привыкли.
С яйцами уже все кончилось, сейчас в моде паниковать из-за говядины.
Кста, про Ротшильда это конспирология. Если попросить указать его как David M. de Rothschild - возвращалась корректная информация, а без "de Rothschild" там целый список вываливался, да еще и разный в зависимоти от модели и ее настроения. Фильтр применялся к выдаче модели позднее. Т.е. зацензурена не модель, там внешний фильтр для веб пользователей.