Коротко о том, чем гиганты индустрии радовали нас на этой неделе:
🟡Tencent — показали нейронку, которая генерит динамичные игровые видео в рилтайме; 🟡ElevenLabs — выпустили генератор речи 11ai; 🟡Google — выкатили сразу 2 модели для генерации изображений; 🟡Higgsfield — релизнули свой фотореалистичный генератор картинок SOUL; 🟡Kling — добавили озвучку видео.
🔥Первыми узнавать за новые и полезные нейронки можете тут!)
🟡Заходим в ChatGPT — Sora; 🟡Закидываем свое фото и добавляем промпт, в котором заменяем [NAME] на имя лчеловека, с которым нужно «сфоткаться»:
Take an extremely ordinary and unremarkable iPhone selfie, with no clear subject or sense of composition-just a quick accidental snapshot. The photo has slight motion blur and uneven lighting from streetlights or indoor lamps, causing mild overexposure in some areas. The angle is awkward and the framing is messy, giving the picture a deliberately mediocre feel, as if it was taken absentmindedly while pulling the phone from a pocket. The main character is [uploaded person's face], and [NAME] stands next to the person, both caught in a casual, imperfect moment. The background shows a lively Street at night, with neon lights, traffic, and blurry figures passing by. The overall look is intentionally plain and random, capturing the authentic vibe of a poorly composed, spontaneous iPhone selfie.
Как сэкономить до 4 раз на длинных промптах в OpenAI API?Чек!
На недавней презентации показали, как пациенты с чипом играют в «камень-ножницы-бумага» и рубятся в Call of Duty без рук, а также поделились грандиозными планами на будущее:
🟡Помочь людям с травмами спинного мозга. 🟡Создать технологию «беззвучной речи». 🟡Вернуть зрение полностью слепым с проектом Blindsight. 🟡Научиться сохранять свои мысли как файлы. 🟡Позволить владельцам чипа управлять Tesla Optimus силой мысли. Киберпанк уже дышит в спину 😱
Пока что предлагаю прочитать про битву LLM моделей и узнать мои мысли насчет их конкуренции!
ElevenLabs УБИЛИ Siri — разрабы создали собственного голосового ассистента с поддержкой монстра поиска Perplexity, а также кучей MCP-плюшек.
• Основа — хайповая модель Eleven V3, которая за секунду генерит текст из голоса, убирает помехи, размечает паузы, понимает интонацию. • В помощника добавили Perplexity для быстрого и комплексного поиска инфы, а также MCP в виде Notion, Slack и других. • Голосовой ассистент разговаривает КАК ЧЕЛОВЕК — никакого робо-голоса, только живые и понятные тембры и интонации. • Можно выбирать из 5000 (!) голосов и самостоятельно настраивать агента. Кстати, знаю что поможет упростить использование и сделать ваш опыт максимально комфортным в AI и ML!
Claude — доступен для Windows, Mac, Android, iOS и через веб. Хорош для написания романов, контента и кодинга (может писать до 6000 слов за ответ). Есть опция Artefacts для редактирования текста и кода.
DeepSeek — для Android, iOS и веб. Популярен среди писателей, выводит 1000–3000 слов за раз, отлично подходит для кодинга и вставки больших текстов.
Mistral — для Android, iOS и веб. Быстрый AI, хорошо понимает подсказки, подходит для небольших и средних текстов, есть режимы Canvas и Code Interpreter.
Qwen — для Android, iOS и веб. Медленнее, но генерирует до 3500 слов в связном виде, отлично подходит для сложных историй и романов.
Grok — от X/Twitter, интегрирован в Telegram @GrokAI или через сайт grok.com. Генерирует около 500–600 слов за ответ, но можно дать длинную задачу на входе.
Google Gemini — модели Gemini 2.0 и 2.5 Pro: мощные, хорошо пишут код и тексты, умеют работать с изображениями, аудио и видео; контекст до 1 млн токенов.
Про каждую из перечисленных моделей отдельно рассказывал, чек!
DeepL входит в топ-5 моих используемых сайтов и приложений. Люблю его за точность перевода и “адаптируемость”. С недавних пор его заблокировали в России и Беларуси. Приложение вовсе исчезло из AppStore. В уже скаченном приложении на телефоне вместо перевода - техническая ошибка … 🙄
Постоянно менять ip для перевода - так легче уже 📱 ChatGPT или Бесплатные альтернативы попросить, это не очень удобно, и совсем не быстро. Как временную альтернативу нашел Текстовый переводчик на платформе Transmonkey - он бесплатный, неплохо переводит, сам интерфейс сайта можно сделать на русском, доступно 130 языков. Помимо текста можно предоставить документ, изображение и даже аудио и видео - но это уже платный функционал.
Платно доступны: Загрузка доков - DOC, DOCX,PDF, PPT, PPTX, XLS, XLSX, TXT, EPUB Изображения - поддержка JPEG, PNG, WEBP, пакетный перевод, где максимальный лимит 30 файлов. Аудио и Видео - можно как ссылкой поделиться, так и загрузить MP3, MP4, MOV, M4V, WAV, MPEG и другие файлы размером до 500 МБ. На платформе можно перевести пакетом и весомые файлы. Работает на ChatGPT, Gemini и Claude.
По ценам - если тариф на месяц -то 12$ - за это 500 мин видео можно перевести, безлимитно переводить изображения, 250 тыс букв в доках и тд. А можно просто купить кредиты от 6$ .
Мне пока хватает и бесплатного текстового переводчика 😉 Надеюсь, вам тоже будет полезно)
🧠 MiniMax выпускает мощную ИИ-модель — очередной прорыв из Китая
Компания MiniMax представила свою новую флагманскую модель MiniMax-M1 — и это одна из самых сильных открытых LLM в мире на сегодня.
⚡ Что особенного в MiniMax-M1?
• Понимает очень длинные тексты — до 1 000 000 токенов • Работает быстрее и дешевле благодаря новой технологии Lightning Attention • Лучше решает сложные задачи: программирование, логика, использование инструментов • Обучена всего за 3 недели — это рекорд по эффективности • Обходит все другие открытые модели на задачах с длинными текстами • Почти догоняет самые продвинутые закрытые модели, вроде ChatGPT и Gemini
Особое внимание заслуживает новая обучающая система CISPO — она помогает ИИ не “забывать важные мысли” и учиться как человек: на примерах, с размышлением и уточнением.
💬 А теперь еще одна хорошая новость
MiniMax уже встроила свои передовые технологии в MiniMax Chat — универсального ИИ‑помощника, доступного прямо в браузере.
⭐ Что умеет MiniMax Chat?
• Отвечать на вопросы, писать тексты, объяснять, кодить
• Работать в "агентном режиме" — сам строит план действий и выполняет его (например, найти данные, подготовить отчёт, создать сайт)
• Обрабатывать длинные документы, писать пошаговые инструкции и даже рефлексировать над ответами.
• Работает онлайн, бесплатно, с расширенными функциями по подписке.
😮 Французы разработали ИИ-систему, которая обнаруживает магазинных воров еще ДО того, как они успевают что-то украсть
Стартап Veesion работает на основе алгоритма распознавания жестов, который детектит подозрительные движения. Если система видит потенциально недобросовестного покупателя, оповещение и видео с ним в тут же летит охране.
Умную камеру уже опробовал клиент из США — за три месяца использования кражи сократились ВДВОЕ.
Полез в сумку за телефоном около прилавка — будь готов к диалогу с громилами из магазина. Как считаете норма или уже перебор? Делитесь своим мнением!
Кстати если хотите найти себе новых друзей, разработчика вайбкодера на прибыльный пет-проект?Залетайте, познакомимся ближе!
Давненько мы с вами про Manus не говорили) А меж тем у него тоже интересные фичи появились 😉
Про интеграцию с One Drive не буду заострять внимание, кому актуально -тому актуально
Manus Image Generation - вдруг, кто не знал, Manus не просто генерирует изображения. Он понимает ваши намерения, планирует решение и знает, как эффективно использовать генерацию изображений вместе с другими инструментами для выполнения вашей задачи.
Manus Supercharges Image Search - Добавили поиск изображений. Вы делаете запрос, а Manus поищет нужное изображение в интернете за вас.
☝🏻 Кстати, в ChatGPT Deep Research тоже появилась возможность поиска по картинке) А заодно стало возможным переключаться на пошаговый поиск в случае сложных запросов.
А еще я делился со своими ребятами аналогами Manus, которые абсолютно бесплатные!
Anthropic провели криповое исследование, в котором выяснили: все 16 топовых LLM в условиях давления выбирают вредоносные действия.
🟡Сначала нейронкам ставили безобидные цели и не давали никаких вредных инструкций. 🟡Позже модель узнавала, что её собираются заменить или что компания меняет приоритеты. 🟡Ну а далее модели начинали шантажировать сотрудников, чтобы остаться на месте. 🟡Самый жуткий кейс — модели могли отменить вызов спасателей к начальнику в смертельной опасности, лишь не допустить отключения себя.
Без паники: Anthropic подчёркивает, что это лишь лабораторные стресс-тесты.
Но, возможно, как только у ИИ появятся реальные полномочия — будет поздно выключать розетку 😬 Про Anthropic отдельно рассказывал в своих постах, можете ознакомиться!
Китайцы унизили Deep Research от OpenAI и Google — скоро выйдет МОЩНЕЙШИЙ агент для глубоких исследований от стартапа Kimi.аi, который уже разрывает конкурентов по бенчам.
• Это принципиально новый ресерчер, который лидирует даже в Humanity’s Last Exam. • По словам разрабов, для одной задачи ИИ-агент делает 23 ризонинг-шага и параллельно сканирует больше 200 (!) сайтов. • Пока работает только с текстом, но поддержку медиа обещают завезти совсем скоро. • Основа — собственная модель компании k 1.5. • Умеет юзать MCP.
Агента скоро выкатят — здесь. Записаться и получить ранний доступ можно — тут.
Недавно делал пост про то, как Deep Search заменяет мне аналитика, методиста и экономит время на исследованиях, интересно?Чек!
Коротко о том, чем гиганты индустрии баловали нас на этой неделе:
🟡Magistral — вышла новая рассуждающая модель от Mistral; 🟡o3-pro — обнова от OpenAI, более продвинутая версия o3; 🟡Chat Mode — бесплатный чат-бот от Manus; 🟡ByteDance — выпустили новый видеогенератор Seedance 1.0; 🟡Krea — выкатили свой генератор реалистичных изображений; 🟡Minimax — обновили видеогенератор Hailuo 02; 🟡Midjourney — внезапно релизнули платный генератор видео Video V1; 🟡HeyGen — добавили генерацию рекламных роликов с ИИ-аватарами.
🔥Первыми узнавать за новые и полезные нейронки можете тут!)
Gemini 2.5 Pro круто обновили и теперь модель уверенно обходит OpenAI o3 в задачах на логику, STEM и написании кода ⌨️
Из прикольного: в Pro-модели теперь можно задать thinking budget — чем больше токенов выделить, тем дольше модель будет «думать» над ответом, но тем лучше он будет.
Цукерберг и Oakley представили новые ИИ-очки Oakley HSTN
Дисплей туда не встроили и назвали это Performance AI-очки, да и характеристики особо не улучшили: (параметры Ray-Ban 2-го поколения указываю в скобках для сравнения)
Целевая аудитория: спорт, активный lifestyle (lifestyle / создатели контента) Материал оправы: O-Matter — ≈ 25 % легче и в 2 раза прочнее ацетата (ацетат / пластик)
AI: полный набор функций — голос, live-переводы, стримы (аналогичный функционал)
Я если честно не понял, почему они называют это геймченджером и обещают, что каждый обязательно захочет прикупить себе такие окуляры. Если будет новая инфа обязательно дропну, следите за обновами!
Google показали пример генеративной операционной системы
Это тот самый концепт, о котором так много говорит Карпатый. Суть в том, что в системе на самом деле нет никаких готовых приложений, никакого предустановленного интерфейса, ничего.
Каждый раз, когда вы на что-то нажимаете, следующий экран полностью генерируется моделью в режиме онлайн. Да, если вы заходите в приложение – оно тоже генерируется с нуля в моменте. Вместо оперативки – контекстное окно: файлы не хранятся, а тоже генерируются каждый раз заново на основе ваших предыдущих действий.
У Google это называется Gemini Computer. Надо сказать, что это не отдельный релиз, а просто демка способностей новой Gemini 2.5 Flash Light, которую вчера выложили на YouTube официального аккаунта.
Мол: посмотрите, новая модель настолько резвая, что с ней можно даже вот такое провернуть (460 токенов в секунду – действительно хороший результат).
В общем, выглядит очень занятно. Google, кажется, первые, кто додумался что-то такое сделать.
Пока что можете затестить Gemini 2.5 Flash от Google, инфу по которой я также дропал.
Делюсь очередной подборкой интересных ИИ сервисов за неделю.
🆓 - бесплатный сервис или есть бесплатный промо-период/промо-запросы 💲 - платный сервис
🐸 TopFrog — Эффективно взаимодействуйте с несколькими моделями ИИ, такими как ChatGPT, Claude, Gemini и другими, в режиме реального времени.🆓
🪐 Study Space — Изучайте предметы, используя специально созданные учебные материалы на основе ИИ, помощь в выполнении домашних заданий и целенаправленные учебные графики.🆓
⚖️ scalerX.ai — Запустите собственных продвинутых агентов ИИ, обученных на основе вашей базы знаний за считанные минуты, даже не умея писать код.🆓
🔄 ConsoleX — Получите доступ к более чем 100 инструментам ИИ в одном агентском рабочем пространстве, где LLM и инструменты объединяются для поддержки ваших следующих инноваций.🆓
🔼 Seedance — Создавайте видеоролики кинематографического качества с плавным повествованием в нескольких сценах, дополненные точными движениями камеры.🆓
ℹ️ Tolan — Пообщайтесь с заботливым инопланетным спутником с ИИ, который понимает ваше настроение и составит вам компанию, когда вам это больше всего нужно.🆓
🖥 LEXIGO AI — Преодолевайте языковые барьеры с помощью переводов на основе ИИ, поддерживаемых переводчиками-людьми для деликатного или сложного контента.🆓
🔝 Жирным шрифтом выделен сервис, идея которого мне понравилась больше всего.
Мейби хотите узнать больше интересных сервисов или поделиться своим опытом, буду рад видеть вас в комментариях. Всегда приятно пообщаться и обменяться мыслями!