Обновить
32K+

Google API *

API, предоставляемый сервисами Google

5,45
Рейтинг
Сначала показывать
Порог рейтинга

Google представила Lyria 3 Clip и Lyria 3 Pro: две новые модели для генерации музыки

25-30 марта 2026 года Google официально представила две специализированные версии своей модели генерации музыки Lyria 3.

Модели стали доступны разработчикам через Gemini API, Google AI Studio и платформу-агрегатор OpenRouter (openrouter.ai).

Lyria 3 Clip Preview: скорость и эффективность

Lyria 3 Clip оптимизирован для быстрой генерации и работы с большими объемами запросов. Модель создает высококачественные 30-секундные аудиоклипы со следующими характеристиками:

  • Цена: $0.04 за клип

  • Качество аудио: 48kHz стерео

  • Контекстное окно: 1,048,576 токенов

  • Идеальные сценарии использования: быстрое прототипирование, фоновые музыкальные петли, контент для социальных сетей, превью.

Lyria 3 Pro Preview: студийное качество

Lyria 3 Pro — флагманская модель для создания полноценных композиций профессионального качества. Модель обеспечивает сложную структурную согласованность на протяжении всей песни:

  • Цена: $0.08 за песню

  • Длительность: до 3 минут

  • Качество аудио: 48kHz стерео премиум-класса

  • Структура: куплеты, припевы, бриджи с профессиональной координацией

  • Богатая инструментальная часть и нюансированная выразительность

Ключевые возможности обеих моделей

Мультимодальный ввод

Lyria 3 поддерживает генерацию музыки не только из текстовых промптов, но и из изображений!
Вы можете загрузить фотографию или иллюстрацию, и модель создаст музыкальную композицию, соответствующую настроению, стилю и атмосфере изображения.

Реалистичный вокал и мультиязычность

Обе модели генерируют реалистичный вокал с выразительными нюансами и улучшенной четкостью. Lyria 3 поддерживает вокал на разных языках и охватывает широкий спектр жанров — от поп-музыки до фанка, соула, джаза, рока и классики.

Точный контроль композиции

Lyria 3 предоставляет разработчикам и пользователям гранулярный контроль над создаваемой музыкой:

  • Tempo conditioning — установка точного темпа (быстрый, медленный и т.д.)

  • Time-aligned lyrics — возможность указать прогрессию песни и контролировать, когда начинаются и заканчиваются тексты в треке

  • Composer mode в Google AI Studio позволяет создавать песню по секциям: от интро до куплетов, бриджей и других частей с индивидуальной настройкой тайминга, интенсивности и описания для каждой части

Синтез с учетом контекста

Модели обеспечивают структурную согласованность от первой до последней ноты, создавая связные композиции с естественным потоком. Lyria 3 Pro особенно сильна в создании сложных музыкальных структур с несколькими куплетами, припевами и переходными секциями.

Безопасность и водяные знаки
Google подчеркивает, что разрабатывала Lyria 3 в тесном партнерстве с профессиональными музыкантами и продюсерами, чтобы ИИ служил дополнением к человеческому творчеству, а не его заменой. Каждый трек, созданный с помощью Lyria 3, содержит цифровой водяной знак SynthID. Эта технология обеспечивает прозрачность и доверие, позволяя любому пользователю идентифицировать и верифицировать аудио, сгенерированное Google AI, даже после модификации аудиофайла.
Google использует обширную фильтрацию и маркировку данных для минимизации вредоносного контента в датасетах.

Через OpenRouter модели доступны по следующей схеме:

  • Lyria 3 Clip Preview: $0.04 за 30-секундный клип (эквивалентно $37.39 за 1M выходных токенов)

  • Lyria 3 Pro Preview: $0.08 за песню (эквивалентно $14.71 за 1M выходных токенов)

  • Входные токены: бесплатно

Lyria 3 Clip идеален для:

  • Разработчиков, создающих приложения с фоновой музыкой

  • Создателей контента для социальных сетей

  • Быстрого прототипирования музыкальных идей

  • Генерации музыкальных петель и превью

Lyria 3 Pro подойдет для:

  • Профессиональных музыкантов и продюсеров

  • Создания полноценных саундтреков

  • Студийной записи демо-версий песен

  • Приложений, требующих длинных музыкальных композиций

Источники:

  1. https://blog.google/innovation-and-ai/technology/developers-tools/lyria-3-developers/

  2. https://slashdot.org/software/p/Lyria-3-Clip/

  3. https://deepmind.google/models/lyria/

  4. https://ai.google.dev/gemini-api/docs/models/lyria-3-pro-preview

Теги:
-1
Комментарии1

Gemini представляет GenUI: Новый стандарт адаптивных интерфейсов

Google совершает очередной прорыв в области взаимодействия человека и ИИ, анонсируя Gemini GenUI (Generative User Interface). Это не просто обновление модели, а концептуальный сдвиг от статичных UI к интерфейсам, которые создаются «на лету» под конкретную задачу пользователя.

Что такое GenUI?

Основная идея GenUI заключается в том, что ИИ больше не ограничен текстовыми ответами или стандартными виджетами. Модель теперь способна генерировать динамические элементы интерфейса в реальном времени.

Если раньше вы получали список рейсов текстом, то с GenUI система отрисовывает интерактивную таблицу с фильтрами, карту маршрута и кнопки бронирования, оптимизированные именно под ваш запрос.

Ключевые возможности:

Контекстуальная верстка: Интерфейс перестраивается в зависимости от сложности задачи. Для простых вопросов — минимализм, для аналитики — дашборды с графиками.

Мультимодальная интеграция: Плавный переход между генерацией текста, изображений и функциональных UI-компонентов.

Интерактивность «из коробки»: Сгенерированные элементы не просто картинки. Это рабочие инструменты, с которыми можно взаимодействовать (двигать ползунки, сортировать данные, переключать режимы).

Адаптация под девайс: GenUI автоматически учитывает форм-фактор устройства, создавая удобный интерфейс как для десктопа, так и для мобильных платформ.

Почему это важно для разработчиков?

Для создателей приложений GenUI открывает путь к «бесформенному» дизайну. Вместо того чтобы прорисовывать тысячи сценариев (Edge Cases), разработчики могут предоставить Gemini набор высокоуровневых компонентов и правил, а модель сама решит, как лучше их скомпоновать для решения проблемы клиента.

«Мы переходим от эры, где пользователь учится понимать интерфейс, к эре, где интерфейс учится понимать пользователя».

Теги:
Всего голосов 4: ↑3 и ↓1+3
Комментарии0

А так ли надежен AI от Google?

Я публично веду исследование и собираю статистику причин провалов игровых проектов.  Часто, как первичную точку для анализа того или иного игрового проекта я использую Google.

Однако, сегодня google меня немного удивил. На мой запрос: "What were the key issues with civilization vii game at the release"? Вот что сегодня, 20.01.2026 выдал Google:

AI Overview

Sid Meier's Civilization VII is scheduled for release on February 11, 2025 [1, 2]. As of today, January 20, 2026, the game has not been released, and therefore, it is impossible to identify key issues from its actual launch. 

Однако, скорректировав запрос с уточнением "What were the key issues with civilization vii game at the release in 2025", я уже получил более разумный ответ:

AI Overview

Sid Meier's Civilization VII faced a rocky, "mixed" reception upon its February 2025 release, with many players describing it as unfinished and in a "rough" state. The launch was marked by complaints regarding fundamental gameplay changes, a poor user interface (UI), and missing quality-of-life features that left many long-term fans disappointed. 

Обратил внимание, что часто от ИИ ожидают больше, чем он сейчас может дать. Тем более не стоит считать информацию формируемую генеративным AI полностью достоверной и не подлежащей проверке. Проводите кроссвалидацию с первоисточниками того, что вы получаете от генеративных нейросетей в форме утверждений.

Ранее я разбирал риски присущие ИИ в статье "Риски, присущие работе искусственного интеллекта".

Удачи в построении эффективных и устойчивых процессов.

С уважением,

Максим Торнов

P.S. Если вы заметили опечатку или неточность, буду искренне благодарен за сообщение об этом в личные сообщения.

Теги:
Всего голосов 5: ↑2 и ↓3+1
Комментарии0

RCS (Rich Communication Services) — это эволюция SMS/MMS, протокол, который мобильные операторы и Google продвигают как «мессенджер по умолчанию». Если SMS = plain text, то RCS = полноценные интерактивные сообщения с кнопками, каруселями, картинками, видео, QR-кодами и встроенной аналитикой.

Ключевые моменты

  • Протокол: работает поверх IP, а не через старую SMS-сеть, но доставляется в «стоковое» приложение сообщений (Google Messages, Samsung Messages).

  • API: доступ через Google Jibe Hub (фактически, центр маршрутизации), плюс нужно согласование с операторами. Прямо в код «в лоб» не залезешь — всё через провайдеров/агрегаторов.

  • Безопасность и доверие: каждая компания-отправитель проходит верификацию бренда, чтобы на экране у пользователя сообщения выглядели не как «спам», а с логотипом и цветами бренда.

  • UX: разработчик не отправляет просто текст, а собирает карточку или интерактив через шаблон/SDK → пользователю приходит сообщение, похожее на push или мини-приложение внутри SMS.

То есть RCS = «SMS на стероидах», но с кучей бизнес- и бюрократических ограничений. Главная боль — доступ к API и вся регуляторка, поэтому на рынок вышли «коробочные» сервисы (как Smobi), которые берут эти сложности на себя

Кодик и ссылки у меня в канале

——————
Менеджер? Давай сюда!
Ищи работу здесь
Технологии и архитектура

Теги:
Всего голосов 2: ↑0 и ↓2-2
Комментарии0

$hyoo_lingua - удобный интерфейс перевода текстов.

В отличие от оригинального google translate, $hyoo_lingua не пытается транслитерировать английский текст при вводе в русское поле. В отличие от yandex translate, он не меняет языки сам как попало. В $hyoo_lingua ваш родной язык всегда слева, а чужой - справа, что очень удобно. Особенно, когда переводишь текст в обе стороны, чтобы убедиться в корректности перевода.

Ну и в отличие от обоих он не пытается переводить на лету текст в процессе ввода, вызывая мельтешение, изменение размера текста и исчерпание лимитов перевода, а ждёт сабмита (поддерживается и ctrl+enter).

Раньше он юзал нейронки с huggingface.co, но качество перевода было низким, а потом там закрутили гайки и всё сломалось.

Теперь используется гугловый движок через балансировку по шести бесплатным API с rapidapi.com, что даёт суммарный лимит в 10К переводов в месяц.

Кому не лень зарегаться - пришлите мне ключик, и подключите к нему бесплатные планы перечисленных тут апишек, чтобы кратно увеличить лимиты.

Программно же, в экосистеме MAM сейчас доступны следующие модули:

$mol_lang_iso639 - словарь всех 2-буквенных кодов языков и их названия на английском.

$mol_locale_select - компонент выбора языка.

$hyoo_lingua_translate( lang, text ) - перевод любого текста на заданный язык, используя веб-сервисы перевода.

Последней апишкой лучше не злоупотреблять, ибо лимиты у сервисов не резиновые.

Следите за остальными новостями из нашей экосистемы на канале @mol_news.

Теги:
Всего голосов 8: ↑6 и ↓2+4
Комментарии2

Сбор семнтики из Гугла (Гугл Вордстат существует)!

В общем такая ситуация - я писал не так давно пост, про парсинг семантики для Гугла, вот он - https://habr.com/ru/articles/867876/

В конце статьи я уточнил, что главная подлянка этой схемы - необходимость одобрения Гуглом базового доступа вашего аккаунта, иначе вся эта затея окажется просто текстом на экране. И не скрою, на момент написания статьи, у меня этого базового доступа не было, но вся правда в том, что я его наконец-то получил!

В общем, схема, описанная мною в статье полностью работоспособна, можно использовать, но быть аккуратнее при общении с техподдержкой Гугла (мне пришлось с ней переписываться по почте, а сперва и вовсе потребовалось обратить на себя внимание в на их форуме).

Но оно того реально стоит, за 5 дней я обработал 50000 входящих ключевых слов и вытащил около 70к ключей для дальнейшей обработки.

Да, абсолютно бесплатно! Вот в эти моменты становится хорошо!!!

Не превышайте лимиты!!!

Теги:
Всего голосов 1: ↑0 и ↓1-1
Комментарии0

Удаление неактивных аккаунтов Google

Google оповестил пользователей о том, что может удалить аккаунт, если им не пользовались 2 года. Цитата: "Во всех наших продуктах и сервисах допустимый период неактивности аккаунта Google будет составлять два года. Изменение вступает в силу сегодня и распространяется на все аккаунты Google, в которых в течение двух лет не совершались никакие действия и не выполнялся вход. С 1 декабря 2023 г. будет возможно удаление неактивных аккаунтов вместе со всем контентом в них. ... Перед тем как удалить неактивный аккаунт, мы отправим несколько писем на его основной и резервный адреса электронной почты. Только спустя восемь месяцев с отправки этих уведомлений в отношении аккаунта начнут применяться какие-либо меры. После удаления аккаунта Google вы не сможете создать новый с тем же адресом Gmail".

Есть некоторые исключения, например, если аккаунт "использовался для покупки продукта, приложения, услуги или подписки Google, срок действия которых ещe не истек" и несколько других специфичных случаев.

Для того, чтобы сохранить аккаунт, надо заходить в него хотя бы раз в два года, либо смотреть что-то в Youtube, использовать Google Диск, входить с помощью аккаунта Google в сторонние приложения и сервисы или просто гуглить.

В целом позиция интернет гиганта понятна – желание освободиться от одноразовых и мусорных аккаунтов. Возможно это неприятно, но рано или поздно это должно было произойти.


Рейтинг0
Комментарии8