Обновить
256K+

Звук

Это «ж-ж-ж» неспроста

144,43
Рейтинг
Сначала показывать
Порог рейтинга

Запилили TG-бота для склейки голосовух - https://t.me/voicemixbot

👍 Зачем.

  1. Сложно наговорить длинную 3-минутную мысль за раз красиво. Вместо этого, ясно произнеси отдельные фразы по 5 сек друг за другом, продумав каждую.

  2. Мысль приходит только на улице во время прогулки и с собой только телега, монтировать дома никто не будет, а итоговая цельная голосовуха с красивой мыслью нужна уже сейчас чтобы кому-то переслать.

  3. Хочешь записать инновационный трек из склейки пердежа, скрипа двери и крика бомжей в метро, но прямо сейчас без инвестиций в монтаж и продюсирование.

🧰 Как пользоваться.

  1. Заходим в @voicemixbot - ему уйдёт команда start.

  2. Шлем голосовухи друг за другом. После каждой видим ADD N, где N - её порядковый номер (начиная с нуля). Это значит, голосовой кусок вставился в ряд. Не говори следующую голосовуху, пока не получил ADD.

  3. Удалить последнюю голосовуху - pop. Когда понял, что последней голосовухе нужен новый дубль. Вернёт SIZE N, где N - новое общее число эпизодов в проекте.

  4. Всё сказал: пишем makeили go. Получаем цельный файл. Забыл что-то сказать - докидываем голосовух в конец и снова make .

  5. Пишем clear если надо начать новый файл.

💎 Команды.

  • clear - забыть всё, начать новый проект

  • info - статус текущего проекта

  • make - склеить текущий проект (цепь голосовух) в один файл

  • name TEXT - указать название TEXT для вашей итоговой записи

  • pop - удалить последнюю голосовуху из стека

  • amp 1 или amp 0 - включить или выключить автоусиление тихой речи.

  • bitrate N - установить битрейт, где N - между 2000 и 50000
    23000 - достаточно для прилично звучащей речи

  • mk N MESSAGE - поставить текстовую метку MESSAGE перед куском номер N. Нумерация с нуля. N - это тот номер, который фигурирует в ответе "ADD"

  • fade N, N - число миллисекунд: длительность плавного перехода между фразами.

Метки.

00:00 - Приветствие
00:21 - Музыка
00:31 - Новости
01:04 - О погоде

Чтобы получить такую таблицу временных меток под записью, отправляй нужный текст перед той голосовухой, на начало которой этот текст должен ссылаться. Текстом считается любой текст, которого нет в таблице команд. Если вы хотели поставить метку перед уже отправленной голосовухой, но забыли это сделать, то используйте команду mk N (см выше).

🔌 Технические детали.

Кодируем речь кодеком OPUS, он прекрасно звучит даже на битрейте 24k, где mp3 бы уже умер. "/" в начале команды не важен. /pop и pop работают одинаково. Цепь голосовух мы называем "проект". У каждого проекта есть уникальное случайное служебное имя вида d7_uaUcUXc0. Помнить его не надо. Команда clear создаёт новый проект с новым именем, забывая предыдущий навсегда. Лимит кусков в проекте - 200, но лучше не рисковать. make 13 минутного файла будет работать 3 минуты. Написано на голимом C++20, libopus, libogg, epoll.

⌛ Лимиты.

  1. Одна голосовуха - не более 60 секунд.

  2. Число голосовух в проекте - 200 штук.

  3. Получается суммарно более 2 часов на один файл, но стало страшно. В будущем возможно порежем лимит результирующего файла чем-то на уровне 10 минут.

🔒Безопасность и надёжность.

clear удаляет голосовухи с сервера бота. Бекапов нет. ФС сервера - в ramdisk. Наговорил, скомпилил - забери себе, не растягивай проект на неделю. Сервер не стабилен, падает раз в неделю с переналивом всей OS с нуля. У админа доступ ко всем голосовухам (как у админы телеграм к личкам), но чаще падает сервер с данными, чем админу охота покопаться. Если придёт майор с бутылкой - всех сдадим, но рамдиск (может быть уже нечего). Метаданные о пользователях не собираем, спамить не будем - даже БД нет. Точнее, есть, но в рамдиске. Если сервер не отвечает, то он либо сдох и ему скоро автоматически нальют образ по вотчдогу, либо занят компиляцией чьего-то проекта - отправь команду info и подожди. Устраивать DoS и хакерство с отправкой гиговых видосов и фоток не надо: бот даже не начнёт качать. В целом, наверное вы можете его положить, но мы просто пнём сервак и он забудет всё плохое в жизни, рамдиск же.

https://t.me/voicemixbot в общем.

Теги:
-5
Комментарии7

Микрофоны ДЭМШ-1А, которыми оснащался скафандр первого космонавта Юрия Гагарина, были разработаны на тульском предприятии «Октава» (позже Особое конструкторское бюро «Октава»). Речь идет о дифференциальном электромагнитном малогабаритном шумостойком микрофоне ДЭМШ-1А. Именно эта модель, а точнее два таких микрофона — основной и резервный — были встроены в скафандр «СК-1» первого космонавта. Они являлись частью гарнитуры шлема и работали в составе бортовой аппаратуры связи «Заря». 

Юрий Гагарин с Сергеем Королёвым перед полетом. В шлеме скафандра виден встроенный микрофон ДЭМШ-1А. Кадр снят 12 апреля 1961 года. Фото: Минобороны РФ
Юрий Гагарин с Сергеем Королёвым перед полетом. В шлеме скафандра виден встроенный микрофон ДЭМШ-1А. Кадр снят 12 апреля 1961 года. Фото: Минобороны РФ
Теги:
+4
Комментарии2

Представлен открытый генератор речи OmniVoice, который может создавать аудио на более чем 600 языках. Решение клонирует любые голоса без цензуры. Достаточно короткой записи на 5-10 секунд. Скорость модели в 40 раз быстрее, чем генерация в реальном времени. Можно настроить любые параметры аудио: пол, возраст, шёпот. Есть онлайн-демо, сама модель на HuggingFace,

Теги:
+5
Комментарии1

Представлен открытый мультиплатформенный проект Snowify. Это аналог Spotify в виде музыкального плеера с кодом на JavaScript без рекламы и без регистрации. Музыка стримится с YouTube Music. Все функции Spotify на месте: списки треков, текст песен, плейлисты с рекомендациями и даже синхронизация с облаком. При этом в интерфейсе нет ничего лишнего, что отвлекало бы от музыки. Проект поддерживает кастомные плагины.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии2

Сделал тут небольшое приложение для прослушивания музыки из сине белой соцсети

• бесплатно 
• без рекламы
• с офлайн режимом
• не нужно скачивать

Актуально больше всего для ios, так для андроидов есть всякие vkX, но при этом моё приложение не требует авторизации 

Написано на $mol

P.S. Закрепите на рабочем столе как веб приложение

P.P.S Если актуально и нужны новые функции, сделаю за небольшой Донати

накидал за 1 вечер, пишу пост в тот же день
накидал за 1 вечер, пишу пост в тот же день
Теги:
Всего голосов 3: ↑1 и ↓2-1
Комментарии0

Краткая история развития ЭВМ - от механических счётов до современных LLM в рифму за две минуты!

Теги:
Всего голосов 5: ↑1 и ↓4-3
Комментарии0

Изучаем гитару, басс, пианино и музыкальную теорию дома. В сети собрали все нужные сайты с теорией и практикой:

Теги:
Рейтинг0
Комментарии0

Вышел открытый проект Voicebox — локальная нейросеть‑клонер, по сути бесплатная альтернатива ElevenLabs. Это буквально «голосовой фотошоп» без ограничений и подписок. Работает просто: загрузили короткий кусок аудио — получили голос.

  • Клонирует голос по короткому аудио.

  • Генерирует речь из текста любым клоном.

  • Собирает разговоры/подкасты из нескольких голосов.

  • Записывает и расшифровывает аудио.

  • Все работает локально. Все проекты и озвучки хранятся на ПК. Дальше можно озвучивать тексты, видео, презентации, мемы или делать диалоги из нескольких голосов.

Теги:
Всего голосов 5: ↑5 и ↓0+5
Комментарии0

Представлена открытая бесплатная ИИ-студия для работы с голосом MimikaStudio.

Проект умеет:

  • клонировать голос по трём секундам;

  • генерировать речь;

  • создавать аудиокниги и озвучивать текст;

  • поддерживает 23 языка, включая русский;

  • работает на ПК с требованием 8 ГБ ОЗУ;

  • работает на macOS, Windows и в веб-версии;

  • есть локальные модели.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии1

Два проекта, с которыми можно выучить нотную грамоту и начать играть на музыкальных инструментах:

  • Muted — музыкальная теория. Гаммы, интервалы, кварто‑квинтовый круг, лады, тональность и остальная нотная грамота. Авторы объясняют материал максимально подробно и чётко, любые звуки можно прослушать и запомнить.

  • Musicca — прокачиваем музыкальный слух и отрабатываем теорию, которую получили с Muted. Ставим аккорды, учимся попадать в ритм, читаем ноты и даже учим сольфеджио.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии0

Открытый проект ebook2audiobook превращает любую электронную книгу в полноценную аудиокнигу. Работает просто: закидываете epub, pdf или даже обычный txt и на выходе получаете готовый аудиофайл с главами, нормальной озвучкой и метаданными. Подойдёт, если не любите читать глазами, но хотите слушать книги в дороге или на тренировке. Работает локально на ПК и поддерживает множество языков и даже умеет клонировать голос. Можно озвучить книгу своим голосом или профессиональным диктором. Идеально для студентов, тех кто учит языки, или просто хочет слушать свои книги офлайн без подписок и облаков.

Теги:
Всего голосов 4: ↑4 и ↓0+5
Комментарии0

Представлен бесплатный открытый проект HeartMuLa, который генерирует музыку на уровне платных ИИ-студий. Это полноценная музыкальная «студия всё в одном»: можно создавать треки по описанию, делать песни в стиле любимых артистов и работать с готовым аудио.

Что умеет HeartMuLa:

  • пишет тексты песен через встроенный чат-бот;

  • генерирует треки с вокалом и текстом длиннее 4 минут;

  • можно загрузить любой аудиофайл, и ИИ перенесёт его вайб и стиль в новый трек;

  • работает даже на слабом железе: локальная версия требует всего ~3 ГБ видеопамяти;

  • простой и понятный интерфейс. Фактически: бесплатный аналог Suno, но без подписок, ограничений и облака;

  • можно ставить локально и делать музыку прямо на своём ПК.

Теги:
Всего голосов 4: ↑2 и ↓2+2
Комментарии6

Ближайшие события

Nvidia представила нейронку PersonaPlex: Voice and Role Control for Full Duplex Conversational Speech Models, которая умеет разговаривать как реальный человек: без пауз, без остановок, без подхалимства и клишированных фраз. Можно вести диалог, перебивать друг друга, исправлять ИИ-собеседника, перестраивать общение. ИИ делает смысловые паузы, варьирует интонацию, использует междометия и даже «угукает», чтобы показать активное слушание. Подстраивается под речь и ситуацию за один промпт.

Проект на GitHub. Ссылка на Hugging Face.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Alibaba выпустила Qwen3-TTS, которую можно запустить локально на ПК. Нейростеть знает 10 языков, включая русский, работает с разными голосами — меняет пол, возраст, национальности, акценты, темп, тембр, а также различные звуковые эффекты. Работает за 0,1 секунды. Токенизатор на 12 Гц — можно максимально сжимать любое аудио без потери качества.

Ссылка на GitHub. Онлайн-демо доступно тут.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии0

Представлен проект нейросети для звуковой генерации HeartMuLa, которая умеет создавать треки студийного качества, клонировать голоса и вставлять их в песни, умеет также делать транскрибции треков через Whisper.

Репозиторий проекта, ссылка на Hugging Face и на портал ModelScope

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии0

Представлен открытый проект Handy, который освобождает руки пользователя и превращает микрофон в клавиатуру. Работает в Word, Telegram и даже в VS Code. Можно диктовать тексты в любом формате, приложении и любым голосом. Под капотом: Whisper от OpenAI или Parakeet от Nvidia. Все нейронки понимают русский. Проблем со вводом не будет. Работает полностью локально — все вычисления идут только на ПК. Сервис отсекает шумы, помехи, чихи и шмыганья — на выходе получается чистый звук, который идёт в такой же выверенный текст. Работает на macOS, Windows и Linux. Простой и понятный интерфейс. Разработчик регулярно обновляет решение.

Теги:
Всего голосов 8: ↑7 и ↓1+6
Комментарии6

Как подключить беспроводные наушники к... чему угодно.

В моём случае было желание подключить беспроводные наушники к телевизору, чтобы иметь возможность смотреть кино и не мешать (звуком) другим.

Ранее использовал радио наушники, база у которых подключалась через 3.5мм джек к аудио входу, но это были полноразмерные наушники (полностью закрывают уши), а я часто использую либо левый, либо правый наушник, чтобы иметь связь с окружающей реальностью ))) Так что начал искать вариант для моих Bluetooth наушников.

Итоги поисков завершились покупкой устройства, которое можно найти на AliExpress в поиске как "многофункциональный Bluetooth аудио приемник-передатчик".

В моём случае подключен через оптический аудио выход на телевизоре. В наличии также обычный 3.5мм jack, переходник jack на тюльпаны и coaxial. Работает и как приемник, и как передатчик.

Позволяет подключать 2 пары наушников.

...может кому то пригодится.

Теги:
Всего голосов 4: ↑4 и ↓0+4
Комментарии0

Открытый проект SpotX позволяет бесплатно слушать Spotify без рекламы и со всеми Premium-опциями. Всё, что нужно — актуальная версия Spotify и запустить на ПК одну команду.

Для Windows пишем в Powershell: iex "& { $(iwr -useb 'https://raw.githubusercontent.com/SpotX-Official/SpotX/refs/heads/main/run.ps1') } -new_theme".

Для MacOS, пишем в Терминале: bash <(curl -sSL https://spotx-official.github.io/run.sh).

Теги:
Всего голосов 2: ↑1 и ↓1+2
Комментарии1

$500 тысяч долларов в месяц заработал разработчик будильника для iPhone. Разработчик выпустил приложение, где просто сделал сигнал в несколько раз громче стандартного решения от Apple. Приложение стало популярным в App Store.

Теги:
Всего голосов 7: ↑6 и ↓1+6
Комментарии0

Команда Google Magenta представила экспериментальное приложение Lyria Camera для создания ИИ‑музыки на основе изображения с камеры смартфона. Приложение анализирует видео с камеры и с помощью Gemini описывает сцену текстовыми музыкальными промптами, например, «спокойный городской пейзаж». Эти промпты используются для создания музыки в реальном времени. Приложение подстраивает музыку под кадр и движение в реальном времени. Проект Lyria RealTime создаёт музыку без слов и с частотой 48 Гц. Приложение Lyria RealTime доступно бесплатно в веб‑версии Google AI Studio с иностранных IP‑адресов.

Теги:
Рейтинг0
Комментарии1

Рейтинг лучших наушников на основе тысяч отзывов с Reddit — пользователь платформы собрал темы вроде «лучшие беспроводные наушники» с помощью нейросетей и проанализировал ответы. С огромным отрывом победили AirPods Pro всех поколений, на втором месте обычные AirPods. В списке также оказались Sony WF-1000XM5, Soundcore Liberty 4 и флагманы Bose. В исследовании участвовало около 13 тысяч ответов — отдельно по сабреддиту про наушники и по всему Reddit.

Теги:
Всего голосов 2: ↑1 и ↓10
Комментарии1

Привычку курения обошли ультразвуком. Учёные доказали, что всего минута прослушивания звуков на определённой частоте отбивает желание закурить. Ещё раз: никаких пластырей, никотиновых спреев и даже вживления чипов в мозг — только минута. Волны звука влияют на «центры удовольствия» в мозге и запускают выброс дофамина за выполнение полезного действия, а не за счёт убийства организма.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии9

В открытом доступе появился реалистичный генератор речи Dia2: создаёт озвучку, которую вообще не отличить от реального голоса, генерит речь в реальном времени. Видео получает озвучку, пока проигрывается. Можно склонировать любой голос, есть множество готовых ИИ-спикеров с разными голосами, тембрами, интонацией и даже акцентами. Создавать можно до двух минут аудио. Нейронка учитывает эмоции: может волноваться, смеяться, запинаться, «жевать» слова.

Модель на HuggingFace.

Код на GitHub.

Демка в вебе.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии0

OpenAI + Google Studio и немного Python = создаем бесплатную аудиокнигу без лишних заморочек

Ведущая Coral c Openai.fm
Ведущая Coral c Openai.fm

 В своё время моё отношение к аудиокнигам изменилось благодаря легендарному проекту «Модель для сборки» с Владом Коппом. Именно благодаря МДС я понял, что книги можно не только читать, но и прекрасно воспринимать в формате аудио. Аудиоформат даёт возможность знакомиться с произведениями в дороге или во время прогулок. Прекрасно помню времена, как загружал в свой MP3-плеер на 512 МБ выпуски МДС и, вместо того чтобы ехать с работы в тесной маршрутке, устраивал себе полуторачасовые прогулки в компании очередного фантастического рассказа.

Эпоха аудиоизобилия

Сегодня выбор аудиокниг несравним с тем, что было пятнадцать лет назад. В интернете можно найти огромное количество как профессионально озвученных произведений, так и любительских версий. Однако даже при всём этом богатстве выбора нередко встречаются книги, которые до сих пор никто не озвучил.

Например, один из моих любимых циклов — «Зоны мысли» Вернора Винджа. «Пламя над бездной»«Глубина в небе» и «Болтушка» легко найти в сети. А вот заключительную часть — «Дети неба» — увы, никто не озвучил.

Поскольку мы живём в эпоху искусственного интеллекта, решение приходит само собой: если нужной аудиокниги нет — сделай её сам. Требования у меня простые, без претензий:

  1. Качество должно быть приемлемым;

  2. Платить не хочется, поэтому все должно быть полностью бесплатным.

Голос

Вспомнил я про сайт OpenAI FM — демо-площадку голосовой модели gpt-4o-mini-tts . Она звучит естественно и хорошо справляется с русским языком. Выбор из 11 разных дикторов. А так же есть классная фитча - промт инструкции для стиля речи, благодаря чему можно управлять «подачей» — делать её более спокойной, вдохновлённой или нейтральной . Поигравшись с промтами и выбрав голос, переходим к следующему этапу. На сайте можно бесплатно генерировать небольшие аудиофрагменты длиной до 999 символов. Ограничение не стало проблемой. Берем Python + Selenium WebDriver, и получаем программу, которая:

  • делит текст книги на чанки нужной длины,

  • отправляет их на сайт,

  • сохраняет аудиофайлы,

  • затем объединяет всё в одно произведение с помощью FFmpeg.

Результат получился неожиданно достойным. Да, между фрагментами иногда чувствуется разница в тембре, особенно в первые секунды. А ударения не всегда точны и изредка проскакивает лёгкий акцент. Но в целом — получилась полноценная озвученная аудиокнига.

Музыкальная подложка

После того как книга была готова, захотелось добавить фоновую музыку. Можно было просто подобрать подходящий трек, но ради спортивного интереса я решил сгенерировать музыку самостоятельно.

Платные сервисы вроде Suno или Udio я сразу отбросил. Зато вспомнил про Google AI Studio, где в разделе Build есть приложение PromptDJ MIDI. Оно позволяет создавать музыку прямо в браузере — достаточно задать стиль и параметры.

Скопировал прямо в Studio приложение, в промпте указал стиль space ambient и добавил возможность скачивания получившегося трека. Поигравшись с настройками в полученном приложении, получил именно то, что меня устроило.

Оставалось объединить музыкальную дорожку с голосом — снова помог FFmpeg.

Инструменты:

  • OpenAI FM — генерация речи;

  • Google AI Studio (PromptDJ MIDI) — генерация фоновой музыки;

  • Python + Selenium + FFmpeg — автоматизация и сборка.

Затраты: 0 долларов и несколько часов времени.

Итог: Получилась аудиокнига приличного качества с музыкальным сопровождением. Конечно, это не уровень профессиональных дикторов , но для личного использования — IMHO более чем достойно. Плюс абсолютно бесплатно.

Теги:
Всего голосов 8: ↑7 и ↓1+7
Комментарии23

Представлен музыкальный сервис OpenSpot Music с треками со многих стримингов с высоким качеством музыки. Алгоритмы подборки помогут найти новые песни, можно собрать собственные плейлисты.

Теги:
Рейтинг0
Комментарии0

Представлен проект Chatterbox Multilingual, который умеет бесплатно клонировать любой голос с короткой записи. Решение умеет озвучивать любой текст с эмоциями, поддерживает 23 языка, среди которых и русский. Также там можно расставлять акценты, делать паузы, выделять слова голосом, контролировать тон и тембр. А ещё есть библиотека голосов, которые можно использовать в проектах.

Теги:
Всего голосов 2: ↑2 и ↓0+3
Комментарии0

Учёный нашёл мелодию, которая усиливает вкус шоколада — с ней плитка прямо тает во рту, доставляя неописуемое наслаждение. Гений-сладкоежка воспользовался исследованиями за 60 лет, который доказывают — правильный темп, высота тона, скорость и тональность могут обманывать мозг и влиять на вкусовые рецепторы. В итоге это вылилось в трек «Galaxy Sweetest Melody».

Теги:
Всего голосов 4: ↑2 и ↓2+2
Комментарии3

Представлен сервис Strudel, который превращает строки кода в мелодии. В качестве основы используется — JS, по этому гайду можно сделать любую композицию из кода. Если есть синтезатор или целый музыкальный сетап, то его можно забустить через MIDI или OSC.

Теги:
Всего голосов 1: ↑1 и ↓0+1
Комментарии1

Команда Riffusion выпустила музыкального ИИ-агента Producer, который генерить музыку прямо в чате, работает с готовым текстом или сам набросает его из идей пользователя, усиливает или убирает нужный/ненужный инструмент, генерит красивые обложки, может написать код для визуализатора под песню, создаёт целые музыкальные клипы, в один клик делает ремиксы: reverb, slowed или dark synth.

Теги:
Рейтинг0
Комментарии0

Во время китайского музыкального фестиваля человекоподобный робот по имени «Адам» появился на сцене, представив собой нечто среднее между перформансом и маркетинговым ходом. Он был наполовину замаскирован в свободную толстовку с капюшоном, которая плохо скрывала его механические ноги и руки, что ясно показывало, что это действительно робот.

«Адам» был в длинной маске и кроссовка в стиле Yeezy, но, будем честны, без штанов. Он играл на клавиатурном синтезаторе вместе с виртуозным барабанщиком и певцом Ху Юйтуном и его группой на музыкальном фестивале VOYAGEX в Чанчуне, Китай.

Эта модель Adam-SP весит около 60 кг и производится китайским стартапом PNDbotics.

Теги:
Всего голосов 2: ↑2 и ↓0+2
Комментарии1

Представлен бесплатный сервис для транскрибации аудио и видосов в текст — TranscribeAI. Система вытащит текст из любого медиа, даже если там много помех. Внутри — Whisper от OpenAI. Поддерживает больше 100 языков и знает русский. Принимает файлы до 4 ГБ во всех популярных форматах — MP3, WAV, MP4, AVI, MOV, MKV. Перегоняет всё в текстовый файл, расставляет таймкоды и маркеры. Может создать субтитры в формате SRT.

Теги:
Всего голосов 3: ↑1 и ↓20
Комментарии13

Представлен расслабляющий трек, который за несколько минут убирает любую тревожность и депрессию — это эмбиент-композиция Weightless британской группы Marconi Union. Инструментал готовили вместе с командой звукотерапевтов, чтобы замедлить реакцию организма на стресс. Трек полностью повторяет сердцебиение человека — тело подстраивается под ритм и ловит релакс.

Теги:
Всего голосов 6: ↑6 и ↓0+6
Комментарии5

Релизнулся бесплатный и без регистрации загрузчик видео с Youtube — Cliply, который может скачать любой ролик в высоком качестве, любые отрезки и клипы по нужным таймингам.

Теги:
Всего голосов 5: ↑5 и ↓0+7
Комментарии2

Некто Broksh опубликовал видеоролик, где пенсионерка демонстрирует необычного домашнего питомца. В типичной пятиэтажке старушка содержит гиппопотама. Понятно, что это ещё одна демонстрация недавно вышедшей модели генерации видео со звуком Google Veo 3.

Нелегко оценить конкретные человеческие усилия, приложенные для создания этого видеоролика. Broksh — это не человек, а целый продакшн полного цикла с опытом работы в съёмках реалити-шоу, клипов, рекламы и коротких фильмов. Если судить по шоурилам студии (1, 2), навыков вполне хватает на сложную композицию, VFX, CGI и прочий постпродакшн. Вполне возможно, что творчество генеративных моделей Veo 3 или Sora было сильно доработано человеческими руками.

В комментариях автор видеоролика признаётся, что пришлось правильно составить промпты для модели, расставить кадры, прописать текст и интонации несуществующих актёров. Также указывается, что были дополнительно доработаны звук, цветокоррекция и постпродакшн в целом.

Бегемот Булька легко оттягивает на себя всё внимание зрителя, но огрехи работы ИИ всё равно заметны. Внимательный глаз зацепится за то, что старушка меняется от сцены к сцене: то она чуть выше, то её лицо становится другим. В одном случае хозяйка нарушает правила геометрии и достаёт из холодильника нереалистично огромный пластиковый таз, набитый игрушками Labubu — «трендами» для питомца. При этом таз издаёт совсем не похожий на пластик звук. Также по показанному нет никакой возможности хоть как-то оценить геометрию квартиры. Выглядит даже так, будто в квартире две кухни.

Иногда угадываются промпты, всем требованиям которых ИИ пытался удовлетворить. В одном из кадров бабулька едет в магазин, оседлав гиппопотама. При этом заметны сразу два одноэтажных здания магазинов и излишне близко стоящие, в нарушение любых строительных норм, жилые многоквартирные дома. Очевидно, что в реальной жизни значительную площадь крупного двора между домами занимала бы детская площадка, а продуктовые магазины так близко не встречаются и часто располагаются на первых этажах жилых домов.

Наконец, в средней полосе подсолнухи начинают цвести в лучшем случае в конце июня, а вот у героини клипа они украшают подоконник кухни, из окна которого почему-то видны сугробы. В некоторых сценах обычно изображено подобие начала мая с его голыми ветвями деревьев и едва проросшей травой, хотя иногда листва уже есть.

Теги:
Всего голосов 3: ↑2 и ↓1+1
Комментарии8

Музыкант и композитор Moby выложил 500 своих треков в свободный доступ — их можно бесплатно использовать в кино, рекламе, играх и ремиксах без лицензий и авторских отчислений. По словам самого музыканта, он просто хочет увидеть, что из этого сделают креативные люди. В ближайшее время Moby опубликует ещё около 1000 треков.

Теги:
Всего голосов 8: ↑8 и ↓0+9
Комментарии5

Группа OK Go использовала 29 роботов и более 60 зеркал для съемок своего нового музыкального клипа на песню под названием Love, в котором использованы калейдоскопические эффекты. Снимали клип в течение двух дней на заброшенном железнодорожном вокзале Будапешта. Всего было сделано 39 дублей, а сорежиссером выступил Дамиан Кулаш из OK Go, который также написал песню.

Теги:
Рейтинг0
Комментарии1

Apple выпустила в Apple Online Store в продажу аудиокабель с USB-C на 3,5 мм, который позволяет слушать музыку в lossless-качестве через AirPods Max.

При подключении к AirPods Max кабель также обеспечивает сверхнизкую задержку, что полезно для игр и создания контента.

Кроме того, кабель "USB-C to 3.5 mm Audio Cable" совместим с наушниками Beats Studio Pro и любыми устройствами с аудиоразъёмом 3,5 мм.

Стоимость кабеля составляет $39 (~3200 рублей), он имеет длину 1,2 метра.

Теги:
Всего голосов 1: ↑1 и ↓0+3
Комментарии2

🗓 04.03.1955 — Выпуcк первых кapмaнных тpaнзиcтopных paдиoпpиeмников [вехи_истории]

В этот день малоизвестная в то время японская компания Sony начала выпуск первых карманных транзисторных радиоприемников, открыв новую эпоху в портативной электронике. Эти устройства стали революцией, поскольку были компактными, энергоэффективными и доступными, в отличие от громоздких ламповых радиоприемников, использовавшихся до этого.

🗓 04.03.1955 - Выпуcк первых кapмaнных тpaнзиcтopных paдиoпpиeмников
🗓 04.03.1955 — Выпуcк первых кapмaнных тpaнзиcтopных paдиoпpиeмников

Первые модели, такие как Sony TR-55 и TR-63, быстро завоевали популярность, особенно в США, сделав радио мобильным и персональным. Успех транзисторных радиоприемников способствовал превращению Sony в ведущего производителя бытовой электроники и заложил основы для будущих инноваций, включая кассетные плееры Walkman и цифровые гаджеты.

📝 Пишите в комментарии или кидайте картинкой — какой был ваш первый плеер? Был ли это кассетник или сразу iPod?

💙 И ставьте лайк, если хотите увидеть ролик про компанию Sony)

Теги:
Всего голосов 5: ↑5 и ↓0+10
Комментарии2