🔥 Вышел самый ЭМОЦИОНАЛЬНЫЙ генератор голоса — тулза Dia генерит любые голоса и выдаёт ЖИВОЙ диалог.
— Эмоции получаются насыщенными — на видео несуществующие люди паникуют из-за пожара; — Модель легкая — можно запустить на домашнем ПК; — Нет цензуры; — БЕСПЛАТНО.
Seedream 3.0 — обновленный генератор изображений от CapCut.
Упор сделали на реалистичность, киношные визуальные эффекты и точную типографику (работает даже с русским языком). Плюс обещают ультрареалистичные текстуры и материалы, а также разрешение 2К.
Тут же можно улучшить качество своей генерации, расширить её, удалить лишние объекты и даже оживить.
Потестить всё это можно уже сейчас, да ещё и бесплатно
Еще не так давно Alibaba выпустила опенсорсный генератор изображений и видео — Wan 2.1, а тут уже и это подъехало)
📌 Сохраняем самые интересные нейросети за неделю, которые вы могли пропустить.
• Higgsfield — генератор видео научился комбинировать несколько эффектов одновременно; • Kling 2.0 Master — вышла обновленная модель для генерации видео; • Veo2 — Google открыли доступ к своему видеогенератору; • Bohrium — бесплатная нейронка для поиска исследований; • o3 и o4-mini — OpenAI выпустили новые модели; • Wan2.1 — в видеогенератор добавили ключевые кадры; • Videohunt — вырезает самые интересные моменты из видео; • Gemma 3 — Google выпустил квантизированные версии модели; • Krea — добавили генерацию 3D-сцен.
На хабре и в своём телеграм-канале всегда делюсь новой инфой про нейронки!)
🚀 Google представляет Gemma 3 QAT: мощный ИИ для обычных видеокарт
Google анонсировала Gemma 3 QAT — новую версию своей модели искусственного интеллекта, оптимизированную с помощью Quantization-Aware Training (QAT). Эта технология позволяет запускать передовые ИИ-модели на потребительских GPU, таких как NVIDIA RTX 4090, без значительной потери качества.
Что нового в Gemma 3 QAT:
🔹 Поддержка 4-битного и 8-битного квантования: значительно снижает требования к памяти и ускоряет работу модели.
🔹 Сохранение высокой точности: даже при сниженной разрядности модель сохраняет точность, близкую к оригинальной.
🔹 Доступность для широкого круга разработчиков: теперь запускать мощные ИИ-приложения можно на более доступном оборудовании.
📌 Круто, что Google делает передовые ИИ-технологии более доступными, позволяя разработчикам создавать мощные приложения без необходимости в дорогостоящем оборудовании.
Google представила мощного клона ChatGPT, который можно запустить даже на обычном домашнем ПК
Используя уникальную технологию сжатия, компания значительно снизила системные требования без ущерба для качества
Гайд по установке: ➖ Скачайте LM Studio с сайта: lmstudio.ai ➖ Перейдите в раздел "Discover" и найдите модель Gemma 3; ➖ Выберите вариант, подходящий под ваше железо (обратите внимание на требования к видеопамяти); ➖ Нажмите "Download"; ➖ После загрузки откройте вкладку "Chat" и наслаждайтесь
Недавно выходил Gemini 2.5 Flash, о котором я рассказывал у себя в телеграм-канале, а тут уже и это...🔥
🚀 Google представила InstructPipe — революционный инструмент для визуального программирования с помощью ИИ
Представьте, что вы описываете свою идею словами, а ИИ превращает её в рабочий прототип подкрепляя визуальной блок схемой.
🔍 Что такое InstructPipe?
InstructPipe — это AI-ассистент, интегрированный в платформу Visual Blocks, который преобразует текстовые описания в визуальные пайплайны. Пользователь вводит инструкцию, выбирает категорию (например, "язык", "визуализация" или "мультимодальность"), и система генерирует соответствующую блок-схему.
Ключевые особенности:
- Использование больших языковых моделей (LLMs) для генерации псевдокода.
- Интерпретатор кода, который преобразует псевдокод в визуальные блоки.
- Интерактивный редактор, позволяющий пользователю доработать и настроить пайплайн.
Чем интересен продукт?
- Если вы хотите сделать пайплайн на коленке, вам туда
- Быстрое прототипирование идей
- Если вам не нужно полноценное внедрение, а решение быстро и просто
⚡️Gemini 2.5 Flash уже здесь: только что вышла новая модель для кодеров, которой по плечу даже сложные запросы.
По ряду показателей она превосходит Claude Sonnet 3.7 и Grok-3, несмотря на существенно меньшие затраты на разработку.
Фишки: — ИИ самостоятельно определяет необходимое время для решения задачи, учитывая её сложность, и чётко планирует весь ход размышлений; — Пользователь впервые может контролировать мышление ИИ: сам задать количество токенов для каждой «мысли» и, таким образом, контролировать глубину рассуждений; — Доступно бесплатно.
В сети вышла тулза, которая подключает ваших ИИ-агентов к 4000 приложений одновременно.
Теперь можно автоматизировать абсолютно всё:
— Подключаем приложения, к которым должен быть доступ у ИИ-агента (VSCode, GitHub, Slack и т.д.). — Просим у ИИ автоматизировать что угодно в какой угодно проге. — Toolbox автоматически перенаправляет ИИ-агента в нужную тулзу в зависимости от задачи.
👍 OpenAI выпустили сразу две новые модели — o3 и o4-mini.
— o3 — самая мощная рассуждающая модель, которая умеет пользоваться всеми инструментами ChatGPT (генерация изображений и графиков, поиск актуальной информации, кода и т.д);
— o4-mini — небольшая модель, но более быстрая. Сильные стороны: математика, код, визуальная инфа. Также имеет доступ к инструментам ChatGPT.
Пользователи ChatGPT Plus, Pro и Team смогут потестить модели уже сегодня, o4-mini будет доступна даже для бесплатных пользователей (выбираем режим «Think» перед отправкой запроса).
Плюс в ближайшие пару недель OpenAI обещали выпустить o3‑pro, об этом сразу же сообщу в своём телеграм-канале.
Сегодня OpenAI анонсировала две новые модели искусственного интеллекта — o3 и o4-mini, расширяя возможности ИИ за пределы обработки текста, включая веб-браузинг, генерацию изображений и визуальное восприятие. Axios
🧠Модель o3 o3 — как заявили OpenAI это самая продвинутая модель на сегодняшний день, обладающая улучшенными способностями к рассуждению и пониманию изображений. Изначально планировалось выпустить o3 как часть GPT-5, но было решено представить её отдельно вместе с o4-mini.
🧠Модель o4-mini o4-mini — более компактная и эффективная версия, предназначенная для выполнения задач, таких как математика, программирование и визуальный анализ, при меньших затратах.
Добавили интересные апдейты и прощание с более старыми моделями:
Натаскали модельки на качественный поиск в браузере и генерацию изображений
Ризонинг поверх изображений!Добавили интеграцию изображений в процессы рассуждения.
Добавят доступ в ChatGPT Plus, Pro и Team для моделей o3, o4-mini и o4-mini-high.
Постепенное прекращение поддержки старых моделей, таких как o1, o3-mini и o3-mini-high.
🤖 Разбираем топ-5 промптов для ChatGPT, которые помогут развить критическое мышление — они заставят вас пересмотреть собственные убеждения и взглянуть на мир более объективно.
Когда ты полностью уверен в чем-то: Я верю, что [твоя убеждённость]. Какие скрытые предположения я делаю? Какие доказательства могут это опровергнуть?
Когда ты считаешь, что нашёл идеальное решение, но стоит оценить его с другой стороны: Я собираюсь [твоя идея]. Если бы ты хотел убедить меня, что это ужасная идея, какие были бы твои самые веские аргументы?
Если проблема не уходит, несмотря на все усилия: Я всё ещё сталкиваюсь с [проблема], несмотря на [твои попытки решить её]. Какие факторы я могу упускать из виду?
Когда перед тобой стоит решение, которое может кардинально изменить твою жизнь: Я подумываю о [потенциальное решение]. Помимо очевидных последствий первого порядка, какими могут быть неожиданные последствия второго и третьего порядка?
Когда привычные методы больше не работают, и нужно нестандартное решение: Мы всегда [текущий подход], но он больше не работает. Почему этот традиционный подход может быть неэффективным, и какие радикальные альтернативы существуют?
Хотите больше крутых промптов? 🚀 Присоединяйтесь к нашему телеграм-каналу, где мы делимся ими и не только!
OpenAI представили GPT-4.1, и это не просто апдейт — это серьёзный шаг вперёд. Модель с контекстным окном в 1 МИЛЛИОН токенов (да, догнали Gemini спустя год!) и возможностями на уровне (а то и выше) топовых open-source моделей вроде o3-mini — и всё это без цепочек рассуждений.
GPT-4.1 уже показывает отличные результаты по кодингу и бенчмаркам. ⚠️Но есть нюанс: доступна только через API, в чатах OpenAI (пока) её не будет.
А вайбкодеры сегодня принимайте подарок!🎁
Целую неделю GPT-4.1 можно использовать бесплатно в Windsurf — это альтернатива Cursor с полноценной интеграцией новой модели.
Это первая базовая модель, которая по коду реально обходит многие хайповые open-source решения. Отличный повод затестить и вкатиться в новую волну AI-кодинга.
GPT-4.1 уже здесь, но только для разработчиков. Остальным придётся немного подождать.
Нижний Новгород • Екатеринбург • Новосибирск • Владивосток • Ижевск • Казань • Тюмень • Уфа • Иркутск • Челябинск • Самара • Хабаровск • Красноярск • Омск
💡 Собрали промты, которые помогут освоить любой язык за месяц.
Используем эти 10 промтов в любой нейросети:
— Ежедневный разговорный тренер: Давай поговорим на [язык] о [тема]. Исправляй мою грамматику, улучшай формулировки и учи естественным выражениям.
— Персонализированный словарь: Создай список слов на [язык] по моим интересам ([хобби, работа, путешествия]) с произношением и примерами в предложениях.
— Упрощатель грамматики: Объясни грамматическое правило в [язык]: [вставь правило]. Сравни с английским и приведи запоминающиеся примеры.
— Корректор ошибок: Вот что я только что сказал: [вставь предложение]. Скажи, правильно ли это, и как бы это произнёс носитель.
— Генератор аудирования: Дай мне короткий рассказ или диалог на [язык], озвучь его, а затем задай вопросы по содержанию.
— Флюент-план на 30 дней: Составь 30-дневный план перехода от новичка к разговорному уровню в [язык], с ежедневными упражнениями на говорение, чтение, аудирование и письмо.
— Культурный наставник: Научи, что считается вежливым, грубым или неформальным в [язык], чтобы я не звучал как робот.
— Тренер произношения: Научи произносить [трудное слово/звук], включая положение рта и типичные ошибки, которых стоит избегать.
— Расшифровщик фраз: Переведи фразу, которую я услышал на [язык], и объясни её скрытый смысл, включая сленг и культурный контекст.
— Промт уверенности: Играй роль доброжелательного преподавателя. Задай мне 3 вопроса начального уровня на [язык] и помоги уверенно ответить, даже если я ошибаюсь.
Хотите больше крутых промптов? 🚀 Присоединяйтесь к нашему телеграм-каналу, где мы делимся ими и не только!
Кстати, недавно сам начал изучение разговорного английского языка и наткнулся на крутого бота в тг - Speakadora AI. За 30 дней неплохо подкачался даже!
🖥 В Google AI Studio можно БЕСПЛАТНО попробовать новую фичу: нативная генерация изображений той же моделью, что и обрабатывает ваш текст. То самое, что показали OpenAI ещё в мае '24-го (но так и не выпустили, хотя обновления приложений/сайта подсказывают, что скоро должны).
Модель И видит вашу картинку, И рисует сама новую, без вызова отдельной модели, занимающейся генерацией. Это позволяет ей делать попиксельную копию, внося нужные изменения — смотрите примеры. И да, можно загрузить СВОЮ картинку, и после этого просить её перерисовать — так я сделал с крестиками-ноликами.
Можно придумать много всякого крутого, жду ваших креативов в комментариях!
Попробовать тут (справа нужно выбрать модель «Gemini 2.0 Flash Experimental»)
Еще недавно выходил Firebase Studio — новый интересный сервис от Google, более подробно я рассказал у себя в телеграм-канале.
Теперь чат-бот помнит историю всех диалогов, может ссылаться на них и отвечать с учетом предыдущего опыта общения. Так ИИ начет подстраиваться под ваш стиль общения, интересы и задачи, а ответы станут более точными и персонализированными.
Память можно отключить в настройках или редактировать. Доступно для подписчиков Pro и Plus.
🟣 Единственная модель с двумя режимами reasoning (low/high).
🟣 На презентации показала лучшие результаты, чем Grok 3, из-за более долгого обучения.
Хотя разработчики обещают дообучить Grok 3, но сроки не ясны.
3. Стоимость (в пересчете на 1 млн токенов):
🟣 Grok 3:
- Стандартная скорость: $3 (input) / $15 (output)
- Fast mode: $5 / $25 (но работает *медленнее* по тестам OpenRouter 😅)
🟣 Grok 3 Mini:
- Стандарт: $0.3 / $0.5
- Fast mode: $0.5 / $4
В целом Grok 3 Mini выглядит выгодно: цена ниже, чем у аналогов (например, o3 mini), а качество на уровне.
Grok 3 пока видимо проигрывает конкурентам (GPT-4.5, Gemini 2.5 Pro, Sonnet 3.7) по функционалу и скорости. Сам же Fast mode вызывает вопросы: высокая цена при текущей скорости выглядит странно.
Посмотрим, как дообучат Grok 3, но mini сейчас выглядит интересно!
*P.S. Кто уже тестил? Делитесь впечатлениями в комментах!* 👇
🤯 Кодеры, для вас подгон: VSCode получил бесплатную замену Cursor — Agent Mode. Он анализирует кодовую базу и исправляет ошибки, пока код не выполнится успешно.
Что ещё может Agent Mode: — Предлагает внести изменения в файлы; — Выполняет команды в терминале; — Работает с расширениями, а следовательно может ещё и: управлять браузером и автоматизировать действия, лазить по GitHub, чтобы разобраться с багами, интегрироваться с облачными платформами.
Инструкция по включению прилагается: — Обновляем Visual Studio Code до последней версии; — Запускаем VSCode и переходим в режим Chat, нажав на соответствующую кнопку справа; — Авторизуемся через GitHub; — В настройках устанавливаем параметр chat.agent.enabled; — В окне чата выбираем Agent из выпадающего списка.
Про сам Cursor, кстати, неоднократно рассказывал у себя в телеграм-канале!