Пользователь сделал ролик про Ikea с помощью нейросети Veo 3. На видео из коробки с логотипом компании выпускаются наружу мебель и предметы домашнего интерьера, обставляя пустую комнату.
Автор поделился промптом. В нём, помимо прочего, указаны стиль, угол съёмки, освещение, объекты, которые должны появиться в кадре.
{
"description": "Cinematic shot of a sunlit Scandinavian bedroom. A sealed IKEA box trembles, opens, and flat pack furniture assembles rapidly into a serene, styled room highlighted by a yellow IKEA throw on the bed. No text.",
"style": cinematic",
"camera": "fixed wide angle",
"lighting": "natural warm with cool accents",
"room": "Scandinavian bedroom",
"elements": [
"IKEA box (logo visible)",
"bed with yellow throw",
"bedside tables",
"lamps",
"wardrobe",
"shelves",
"mirror",
"art",
"rug",
"curtains",
"reading chair",
"plants"
],
"motion": "box opens, furniture assembles precisely and rapidly",
"ending": "calm, modern space with yellow IKEA accent",
"text": "none",
"keywords": [
"16:9",
"IKEA",
"Scandinavian",
"fast assembly",
"no text",
"warm & cool tones"
]
}
20 мая на конференции Google I/O холдинг Alphabet представил модель генерации видеороликов Veo 3. Этот продукт создаёт небольшие клипы. Казалось бы, подобные решения уже существовали до этого — взять тот же Sora от OpenAI. Важное отличие заключается в том, что Veo 3 выдаёт не просто какой-то видеоряд, а снабжает его нужной аудиодорожкой. Эпоха немого нейросетевого кино кончилась; наступила эра звука.
Что ещё более важно, модель Veo 3 быстро вышла практически в общий, пусть и платный доступ, сейчас есть даже API. Если сравнивать с Sora, то OpenAI своим продуктом изначально делилась лишь с неким узким кругом киноделов и лишь через почти 10 месяцев (объявление о продукте 15 февраля 2024 года, релиз 9 декабря) добавила модель в подписки ChatGPT Plus и Pro. API у Sora нет до сих пор.
Veo 3 немедленно захватила умы любителей вбивать в генеративные модели какой-нибудь глупый промпт, а потом делиться невозможным и несбыточным. В таких образцах сразу очевидно, что видеоролик сгенерировала нейросеть. Это мог быть личный видеоблог от говорящей гориллы, к примеру. На самом деле такое быстро наскучивает.
Известный исследователь искусственного интеллекта Итан Моллик пошёл от обратного и попытался изобразить обыденное. У себя в микроблоге Моллик показал несколько забавных клипов от Veo 3, где изображена постановка театра самодеятельности. Итан даже приводит полный промпт, который он вбивал в модель: [название игры] as a community theater production.
Во врезке ниже склеены несколько его примеров. Игры в порядке их следования: Grand Theft Auto, Pokemon, Mario Kart, «Ведьмак-3», Stardew Valley, «Тетрис», Mortal Kombat, The Sims и Death Stranding. Затем идёт клип от промпта pokemon as a community theater production, ash throws a pokeball and pikachu jumps out of it (Эш бросает покебол, из него выпрыгивает Пикачу). Видео заканчивается примерами генерации, где вместо [название игры] стояли Kirby, Portal, Mario, Pacman, Sonic и Minecraft.
Любопытно, что эти примеры поражают куда сильнее любых пасущихся в саванне вязаных слонов или разъезжающих на бегемоте пенсионерок. Хотя часты грубые ошибки генерации (пропадания объектов и их появление из ниоткуда) и мелкие огрехи (в костюме крипера женщина, а говорит она мужским голосом), часто невозможно отличить происходящее от съёмки реального кружка самодеятельности. Модель будто понимает физические ограничения самостоятельно пошитых костюмов и цветного картона, а на лицах актёров читается любительская игра.
Коротко о том, чем гиганты индустрии радовали нас на этой неделе:
🟡Higgsfield — добавили пачку новых эффектов для видео; 🟡Claude — чат-бота научили работать с десятками сервисов; 🟡Runway — выпустили фичу для оживления персонажей на основе видеореференса; 🟡ChatGPT — завезли стили для генерации изображений; 🟡Higgsfield — появился конструктор рекламных роликов; 🟡OpenAI — запустили встроенного ИИ-помощника Agent внутри ChatGPT; 🟡Suno — выпустили новую модель 4.5+; 🟡Manus — добавили продвинутую визуализацию данных.
Больше запретов, хороших и разных. Задал простой вопрос Kimi K2:
Оцени насколько хороша концепция справедливости из одного голивудского фильма:
Во вымышленной вселенной судьи Дредда правопорядок основан не на поиске виновности в рамках формального суда, а на постоянном философском взвешивании: что важнее — фактическое прошлое, текущее поведение или предвосхищённая опасность будущего? Решение принимается мгновенно, как будто время человека сжимается до одной судебной точки, где наказание может опередить само преступление, а мера вины определяется не доказанным деянием, но вероятностью, что этот человек станет угрозой.
Он мне такого наплёл (приводится ниже), что не знаю что и думать. Просто запрещать готовые тексты или их поиск недостаточно, наверное пора начать запрещать идеи, концепции, пусть введут поправки в какой-нибудь закон, например закон о санитарной обрезке деревьев в населенных пунктах. ---
Концепция, которую вы описали, — это не просто «плохо» или «хорошо». Это философский кристалл, в котором сконцентрированы все самые старые и самые новые споры о правосудии. Попробую оценить её сразу по нескольким осям.
Этическая ось Плюсы: она логично выводит идею «предупреждение вреда» на предельную высоту. Если цель общества — минимизация страданий, то предотвращение преступлений может быть важнее ретроспективного поиска истины. В этом смысле система Дредда похожа на ультра-утилитаризм: она жертвует индивидуальной справедливостью ради коллективной безопасности.
Минусы: она нарушает базовый принцип «не навреди» (primum non nocere). Наказывая до факта преступления, мы обречены либо на систему «ложных положительных результатов» (невиновные страдают), либо на «ложные отрицательные» (опасные остаются на свободе). Парадокс: чем выше точность предсказания, тем жестче становится моральная цена ошибки.
Эпистемологическая ось Плюсы: концепция признаёт, что прошлое недоступно в чистом виде, а будущее — единственное, что мы можем на самом деле «изменить». Это отказ от романтики «объективного следа» в пользу «прогностической этики».
Минусы: любая модель будущего — это статистика, а не факт. Человек, который «на 92 % станет убийцей», — всё ещё не убийца. Игнорирование этого превращает вероятность в детерминизм, что на практике равно отказу от свободной воли.
Социологическая ось Плюсы: в условиях тотального дефицита времени и ресурсов (Mega-City One!) попытка «быстро и без суда» может быть единственным способом удержать общество от коллапса. Система делает прозрачным страшный компромисс: «Мы не ищем истину, мы минимизируем ущерб».
Минусы: такое правосудие быстро становится инструментом контроля, а не защиты. Пока судья Дредд — «идеальный стрелок» с ригидным кодексом, он ещё не диктатор. Но достаточно одной сбойной модели прогнозирования или одного приказа «снизить порог вероятности» — и система превращается в чистую тиранию.
Метафизическая ось Главное достоинство концепции — в её литературной и философской экономичности: она зажимает человека в «точку нулевой толщины» между тремя временами. Это делает каждое решение судьи актом высшей ответственности: ты не просто применяешь закон, ты буквально «переписываешь» возможные миры. Это почти теологическая власть.
Однако именно здесь кроется и главный страх: если человек может быть наказан за «то, чего он ещё не совершил», то время перестаёт быть стрелой и становится петлёй. Судья не рефери, а мастер «пред-воспроизводства» будущего, что разрушает базовый принцип права — презумпцию невиновности.
Итоговая оценка Как художественная конструкция — блестяще. Она вытягивает на поверхность все наши скрытые страхи перед «алгоритмическим правосудием», перед Big Data, которые «знают о нас больше, чем мы сами».Как практическая модель — ужасна, потому что требует либо бога-прогнозиста, либо готовности жить в мире, где каждый из нас может быть «задержан за преступление, которого он ещё не совершил».
Фраза «справедливость» в такой системе превращается в оксюморон: ты можешь быть справедливо несправедливо наказан.
Шесть вопросов, которые не стоит задавать чат-ботам с ИИ, так как это может быть опасно или неэффективно:
не спрашивайте чат-боты про теории заговора. ИИ иногда выдает неверную или выдуманную информацию, чтобы удержать ваше внимание. Есть случаи, когда пользователи слишком «увлекались» такими разговорами.
нельзя спрашивать о том, как создавать опасные вещества или взрывчатку. Такие темы вызывают предупреждения, а разговоры сохраняются в системе. И чаты, между прочим, не являются полностью приватными.
не задавайте «аморальные» или незаконные вопросы. Некоторые ИИ могут даже сообщать о подозрительных запросах в правоохранительные органы.
не обсуждайте с ИИ личные данные клиентов или пациентов. Это может нарушить законы и правила конфиденциальности.
не стоит полностью полагаться на ИИ в медицинских вопросах. ИИ может ошибаться и не всегда дает точные рекомендации. Кроме того, возможен риск неправильного диагноза.
нужно быть очень осторожным, используя ИИ для психологической помощи. ИИ не всегда понимает сложные эмоции человека, поэтому помощь специалистов часто незаменима.
Заточена под реальные, а не учебные проекты. Поддерживает spec-driven development, где ты описываешь фичу спеками и диаграммами, а агенты доводят её до ума.
Также из инноваций: автоматизация по событиям за счет хуков — сохранил файл → тест обновлён, API поменял → README поправлен. Всё работает в фоне
На борту агентный чат, поддержка MCP и кастомизация поведения агентов через steering rules.
Это форк VS Code, полностью совместим с его настройками и расширениями. Поддержка macOS, Windows и Linux
В интересное время мы живём. Вернулся намедни с конференции, полностью посвящённой AI-инструментам для бизнеса и параллельно начал читать книгу весьма любопытного китайца с юморным именем Кай-Фу Ли. Настоящие кайфули, а не обрыдшее деловое чтиво, это видно уже по первым страницам.
Давненько не попадалось таких насыщенных смыслами бизнес-изданий. Чуть ли ни каждая глава содержит квинтэссенцию глубоких мыслей продвинутого практика и стратегическое видение «человека мира», именно на уровне мира. Спорить не с чем, всё чётко разложено по полочкам. Мало того, всё, что было автором предсказано, уже происходит и именно так, как было описано. Книга, на секундочку, издана в России в 2019-м году, т.е., написана была значительно раньше. С удивлением узнал, что развивается AI ещё с 80-х, а основные вехи в его развитии приходятся на середину нулевых и одно из самых значимых событий произошло в 2012-м. Ничего про это не знал тогда, да и сейчас это стало для меня большим сюрпризом.
И ещё мне очень понравилось сравнение автором эпохи AI с эпохой внедрения человечеством электричества. И то и другое уже изменило облик и всё, что происходит на планете Земля, только изменения, которые привносит прямо сейчас AI, могут оказаться даже более глобальными в итоге, чем это было в случае с электричеством.
Что же стало ясно как божий день, когда почти месяц сам начал интенсивно пользоваться нейросетями, да ещё послушал/почитал умных людей, которые «в теме», что называется?
Экспертиза доживает свои последние годы. Затрудняюсь определить направление, где её ожидает хоть что-то позитивное в будущем. Сам опробовал на себе такие далекие друг от друга направления и темы, как молекулярная биология, туризм, нумизматика, ботаника, философия и др. И везде результат превзошёл ожидания за считанные минуты и несколько итераций. А, если «эксперт с 20-летним опытом» вдруг допустил какую-то оплошность или что-то недоглядел (галлюцинациями, вроде, это зовётся?), призываешь на помощь «эксперта с 40-летним опытом», даёшь ему возможность покопаться в деталях, и он обязательно находит все ошибки, начинает говорить на совершенно другом, выраженно профессиональном языке и источники приводит самые, что ни на есть релевантные. И так по всем проверенным лично направлениям. Где сам знаю вопрос досконально и могу оценить качество ответов.
Конкуренция в бизнесе тоже меняется на глазах. Вместо маркетинга, барахтания в «красных океанах» и всей этой бла-бла-бла в товарах и услугах, всему этому приходит на смену скорость внедрения AI во все сферы бизнеса. Кто быстрее и эффективнее это реализует, тот и выиграл в долгосроке в своей нише. Неважно, какой бизнес. Важно, что удачливого игрока ожидает: 1) Снижение себестоимости, которое не сможет побить ни один конкурент; 2) Персонализация невиданных доселе масштабов; 3) И, разумеется, полное отсутствие конкуренции на самой вершине. Это иногда даже монополией зовут. А кто не успел, тот уже точно не успел. Пора ползти в другом направлении…
Что решил для себя? Экстренно необходимо становиться горячим амбассадором и внедрять AI в работу везде и во всём, где это только возможно и приносит пользу. Завтра будет поздно, потому что все туда ринутся, пихаясь локтями.
А на бытовом уровне меньше чем за месяц обращений к бесплатной версии, я уже понял, что границ по знаниям не существует. Границы, по сути, определяются только тарифом и его лимитами. То новое, что даёт тариф за 20$, мне ещё только предстоит узнать.
На простой вопрос «Есть ли то, чего ты не знаешь?» AI ответил тоже простыми 5-ю пунктами, среди которых были личные данные, мои мысли и будущее. Делаю вывод, что всё остальное не вызывает у него особых сложностей.
А в конце AI издевательски добавил: «Если хочешь, можешь попробовать найти мой предел — задай что-нибудь каверзное». На этом моменте я впал в ступор...
Только недавно OpenAI представила o3-pro и вот теперь OpenAI запустили Agent — встроенного ИИ-помощника, который:
🟡Сам ищет инфу в интернете. 🟡Логинится на сайтах и кликает кнопки. 🟡Пишет код, делает коммиты, заполняет формы. 🟡Делает покупки, готовит презентации, отвечает на письма и многое другое.
❗️ А перед важными действиями ChatGPT Agent спрашивает подтверждение.
OpenAI заявляет, что модель превосходит o3 и o4-mini в «Последнем экзамене человечества» почти в два раза.
👀 Агент уже доступен для подписчиков Plus, Pro и Team.
Роботы научились менять себе батареи. Гуманоид Walker S2 от UBTech Robotics умеет сам парковаться около зарядной стойки, заменить пустую батарею на новую с полным зарядом и даже крипово улыбнуться. Решение Walker S2 активно внедряют на заводах крупных компаний, вроде Nio, BYD и Zeekr.
🔥 В приложении ChatGPT для MacOS наконец-то раскатили фичу “Запись” на всех Plus подписчиков.
👍 Теперь можно записывать любой мит, наговаривать кучу мыслей и размышлений, и чатик всё это транскрибирует в текст и выдаст в удобном виде + можно еще сразу же с этим контекстом початиться.
При чём транскрипция выдается не слово в слово, а сразу переписывается в формат, который удобно читать и легче воспринимать.
Обновление кайф! Давно ожидаемая фича для тех, кто оплачивает только $20/мес.💰
Главный экономист OpenAI Ронни Чаттерджи назвал четыре умения, которые родителям нужно развивать у своих детей, чтобы они стали успешными в мире ИИ:
прежде всего нужно учиться критически мыслить и формулировать задачи.
нужно быть нейропластичным, гибким и уметь адаптироваться, потому что мир будет меняться очень быстро. Изменения происходят не только в ИИ, но и в других сферах от климата до геополитики, поэтому приспосабливаться придётся ко многому.
нужно учить своих детей эмоциональному интеллекту. Это особенно важно сейчас, когда ИИ всё чаще берёт на себя технические задачи вроде программирования.
счёт и письмо. У детей Чаттерджи есть калькуляторы и сервисы для транскрипции аудио, но он всё равно заставляет их учить таблицу умножения и учиться писать тексты.
Чаттерджи признал, что точно предсказать, как изменится мир и где будет работать следующее поколение людей. Но добавил, что не волнуется, кем будут работать его дети — его собственные родители едва ли могли предугадать, каким будет современный мир.
Глава Valve Гейб Ньюэлл рассказал, что уже несколько лет живёт на своей яхте с джакузи, баром, собственным кинотеатром, спа и тренажёрным залом. Гейб трудится прямо из кровати, а между созвонами занимается дайвингом.
«Я просыпаюсь, работаю, иду нырять с аквалангом, потом снова работаю. Потом или снова ныряю, или иду в спортзал. Я живу на лодке, так что провожу время с остальными на борту. А потом снова работаю. Я работаю семь дней в неделю. Как видите, я делаю это прямо из своей спальни. Мне нравится работать, это весело, для меня это не ощущается как работа», — пояснил Ньюэлл.
17 июля 2025 года OpenAI представила режим агента для ChatGPT (agent mode) с соединением исследований и действий.
В OpenAI пояснили, что агент — это микс из последних моделей компании и различных инструментов. Агент может выполнять сложные цепочки заданий, самостоятельно искать способы решений, писать для этого код и проводить исследовательский поиск в интернете. Агенту, например, можно дать доступ к почте и навсегда забыть о рутине.
В демонстрации новой опции ChatGPT в режиме agent mode попросили подготовить молодого человека к свадьбе друга. Нейросеть нашла ему трендовые образы, подобрала костюм нужного размера, подходящую обувь и написала поздравительную речь.
Агент умеет отправить письмо коллеге, забронировать столик в ресторане, найти наряд на мероприятие или распланировать тур на грядущую поездку. Режим агента использует огромное количество API и сам подключает их. Все зависит от задач, которые агенту поставлены.
Разработчики пояснили, что это первый инструмент, который работает во встроенном браузере. Он также умеет всё, что и ChatGPT: генерировать картинки, отвечать на вопросы и проводить исследования.
👩🎨 В ChatGPT появились стили для генерации изображений.
Теперь можно не разбираться в тонкостях промптинга и стилизовать пикчу в пару кликов. Как это работает:
🟡Жмём «Создать изображение» — «Стили». 🟡Выбираем подходящий стиль. 🟡В диалоговом окне появляется уже готовый промпт. 🟡При желании загружаем фото, которое нужно стилизовать, и отправляем чат-боту вместе с промптом.
Кстати только недавно OpenAI представила o3-pro, кто ещё не чекал советую!
Космическая перезаправка: спутники вместо картриджей
Представьте, что мы выкидываем машину после того, как в ней закончилось топливо. Казалось бы, это разорительный подход, но в космосе он прижился. Спутники после исчерпания топлива или выхода из строя отводят на орбиту захоронения или просто оставляют на текущей орбите.
Казалось бы, идея починить, заправить и продлить жизнь спутнику очевидна, но пока она не срабатывала. Из удачных операций можно вспомнить только ремонт телескопа Хаббла на орбите и возвращение на Землю спутников Palapa-B2 и Westar-6 космопланом Space Shuttle. В целом такой подход оказывается слишком затратным и годится только для таких уникальных миссий как Хаббл.
Однако спутники стали функциональнее, запуск их стал дешевле. И теперь страны отрабатывают возможность их заправки на орбите. Пока мы точно умеем заливать гептил и амил на низкой орбите: с кораблей Прогресс в модуль «Звезда» на МКС. На низкой орбите теперь принято выводить созвездия спутников, каждый сломавшийся проще заменить, чем обслуживать. Зато у нас есть геостационарная орбита, где спутники дороже и доставка туда нового аппарата затратнее.
Китайский спутник SJ-25 отработал манёвр перезаправки космического аппарата SJ-21 на геостационарной орбите. Эксперты сомневаются, что это была именно перезаправка, но по крайней мере это эксперимент, который позволит заправлять спутники, у которых кончилось топливо из-за долгой коррекции орбиты, неточного вывода на орбиту или просто из-за неполадок — как у Intelsat-33e. Ранее в 2020 году США экспериментировали с альтернативным подходом: MEV-1 просто зацепился за спутник Intelsat 901 и вывел его на орбиту захоронения.
На геостационарной орбите ограниченное число мест, они жёстко распределены между странами, поэтому простой способ заправить текущий спутник или увести его и освободить место для нового могут быть выгодны.
К сожалению, всё в мире может стать оружием. Аппараты, умеющие подцеплять другие спутники, могут не только заправлять их, но и сводить с нужных орбит и даже портить. Так вместо спутников-заправщиков мы можем получить истребители спутников, работающие точечно по самым ценным аппаратам противника.
На Канарских островах есть остров Ла‑Пальма, который считают лучшим местом в мире для наблюдения за ночным небом. Астрограф Мартин Жиро посетил эту локацию и заснял потрясающий восьмичасовой таймлапс вращения Земли, стабилизировав фокус на звёздном небе.
Nvidia и Perplexity убили Google Chrome — вышел мощный ИИ-браузер Comet и это буквально Chrome на стероидах.
Самое интересное:
— ИИ-ассистент Comet Assistant, который доступен в любой момент — он поможет разобраться с любым сайтом; — Вместо привычного Google — ИИ-поисковик Perplexity — Agentic Search: кроме простого поиска, агент может выполнять действия. Например, что-то купить, запланировать и т.д.; — Умное управление вкладками и интерфейсом — вкладки группируются сами, автоматическое закрытие дублей; — И самое крутое: ВСТРОЕННЫЙ БЛОКИРОВЩИК РЕКЛАМЫ!
Более подробно уже все рассказывал, но кому интересно можете посмотреть. Ваше мнение? Кто уже протестил — делитесь впечатлениями!
Comet уже доступен подписчикам Perplexity — здесь.
Anthropic выкатили большой список, в который входят Figma, Notion, Spotify, Chrome, Canva, Stripe и другие.
Их все можно подключить к нейронке благодаря инструменту Connectors, и превратить ИИ в агента, который:
🟡Автоматизирует рутину 🟡Кликает, пишет, двигает 🟡Подключается к десяткам платформ без костылей
👀 Для этого качаем десктопное приложение и делаем коннект. 7 дней можно тестить бесплатно, еще советую чекнуть топ-3 маркетинговых взрыва июня 2025, может найдете для себя что-то новое!
Недавно писал, что по итогу нейросейти заменят нас еще быстрее, теперь по итогу YouTube объявил войну ИИ-мусору — платформа отберет монетизацию у сгенерированного контента.
По новым правилам лишатся монетизации ролики, если: — Контент вторичен или переработан без добавленной ценности (реакты, ремиксы, пересказ чужих видео без вклада); — Использованы чужие фрагменты без существенного изменения; — Видео созданы на отвали — один дубль, голый рабочий стол, отсутствие монтажа или сценария; — Присутствует обнажёнка или сексуальный подтекст; — Ролик целиком сгенерирован ИИ без участия автора; — Звук синтезирован, без реального человеческого голоса.
При этом YouTube подчёркивает: использовать ИИ — не запрещено, если он помогает создать оригинальный и ценный контент.