Обновить
126.4

Звук

Это «ж-ж-ж» неспроста

Сначала показывать
Порог рейтинга
Уровень сложности

Загадочный чёрный Explorer

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели14K

Привет, Хабр! В результате очередного обмена у меня появилась ещё одна электрогитара, кастомизированная предыдущим хозяином в стиле обработанной тунговым маслом тонированной древесины с открытыми порами.

Инструмент оказался на удивление играбельным и хорошо звучащим, однако ремонт и доработка, как это всегда бывает, тоже потребовались.

Читать далее

Новости

Чип, который умеет говорить (SI4703)

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели10K

В этом тексте я хотел бы рассказать про свой опыт работы с однокристальным радио приёмникои SI4703 от компании Silicon Laboratories.

SI4703 - это миниатюрный настраиваемый FM радио приемник c DSP обработкой, управляемый по I2C, с возможностью принимать бинарные данные от радиостанций по протоколу RDS .

Чип производит демодуляцию частотно модулированного сигнала, пропускает его через цифровой гетеродин и выдает на наушники аналоговый сигнал. Тут есть два смесителя: первый аналоговый, второй цифровой. Аналоговый смеситель снимает FM сигнал с несущей. Цифровой смеситель подстраивает цифровой гетеродин на конкретную радиостанцию. Это классический гетеродинный приемник.

Читать далее

Музыкальный движок для Денди: FamiTone

Уровень сложностиПростой
Время на прочтение25 мин
Охват и читатели15K

Сегодня я решил поведать миру очередную историю одного из множества моих восьмибитных деяний дней давно минувших. Это одновременно обзор и своего рода «постмортем» довольно успешного проекта, правда, припозднившийся на добрых полтора десятка лет. Погреться в лучах славы былых успехов никогда не поздно!

Речь пойдёт о некогда созданной мной библиотечкe, музыкальном «драйвере» или движке под названием «FamiTone», предназначенной для озвучки любительских (homebrew) игр для 8-битной игровой приставки Famicom, она же NES, она же «Денди». По пути разберёмся, что это, как устроено, кому и зачем вообще могло понадобиться, и пригодилось ли в итоге. Спойлер: да.

Читать далее

Наш новый LLM-based синтез речи

Уровень сложностиПростой
Время на прочтение16 мин
Охват и читатели12K

Рассказываем о нашем новом синтезе речи.

Мы так и называем его — «новый синтез», или GigaTTS. Под капотом у него GigaChat 3b, аудио адаптер, собственный токенизатор речи и 30 тысяч часов данных. Никаких диффузий. Очень много работы было проделано над обучением модели, на студии и при подготовке данных для обучения.

Новый синтез до мурашек естественный. Он говорит как живой человек, умеет смеяться и выражать эмоции со всеми нюансами. По метрикам он обгоняет наши прошлые модели в 2-4 раза, особенно большой выигрыш по естественности голоса.

Под катом вас ждем большой технический обзор того, как мы пришли к такому качеству. Покажем freespeech и специально сделанные голоса операторов колл-центров. Поделимся деталями, как у нас получился синтез текста любой длины, prompt following и клонирование голосов

Читать далее

Гитарные эхо: цифровой и аналоговый дилей

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели8.6K

Привет, Хабр! Эффекты эха для инструментальной и вокальной музыки построены по единому несложному принципу: пакет мгновенных значений напряжений сигнала за определённый промежуток времени записывается в цифровом формате либо в виде реальных потенциалов на затворах полевых транзисторов, а затем воспроизводится с задержкой.

Ранее для этого применялась магнитная лента, а иногда даже электретная плёнка. Существуют и механические линии задержки, основанные на величине скорости звука в различных средах. Это могут быть стальные пружины, а также трубки, наполненные воздухом или иными материалами, включая ртуть. Последний вариант использовался для организации оперативной памяти в архаичных компьютерах.

В любом случае, суть состоит в том, чтобы просто воспроизвести короткую звукозапись или иные данные из недалёкого прошлого. Но тогда почему в мире так много различных эффектов задержки аудиосигнала, причём звучат они действительно по-разному? Сегодня мы это узнаем.

Читать далее

Громче, ещё громче. Новые умные телевизоры Sber с голосовым управлением — технологией Farfield

Время на прочтение9 мин
Охват и читатели9.4K

Салют, Хабр!

Сегодня мы представили новые умные телевизоры Sber серии 7000 с голосовым управлением без пульта. Его обеспечивает технология Farfield. Этим телевизорам достаточно дать голосовую команду, чтобы включить фильм, поставить его на паузу, изменить громкость и так далее. 

Сегодня расскажем, что нового (и как именно) реализовали в серии 7000. В статье:

Farfield, loopback и особенности настройки звука в умных ТВ;

зачем обходить дерево для голосового управления в сторонних приложениях;

ГигаЧат в умных ТВ.

Читать далее

Сказ о том, как мы автоматизировали озвучку видео через нейросети

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели8.1K

Всем привет!

Мы — сотрудники команды локализации и переводов, которые рассказывали вам про то, как мы брались за крупный проект по локализации обучающих видеороликов. Напомним, что нам прилетела следующая задача: в достаточно ограниченные сроки локализовать и озвучить аж более 600 обучающих видеороликов на узбекский язык. В предыдущей части речь шла про субтитрирование и локализацию сценариев видеороликов, теперь поговорим про великую и ужасную нейроозвучку. Мы решили сравнить два подхода: классическую работу с профессиональным диктором через агентство и нейроозвучку.

Спойлер: результаты оказались неожиданными.
Расскажем, как мы тестировали разные решения для синтеза речи, с какими проблемами столкнулись и почему в итоге выбрали именно нейросети. Поехали!

Читать далее

Краткая история создания аудиокассеты. Часть вторая

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели10K

В предыдущей части мы подробно рассказали о первых разработках конца XIX-начала XX века. Мы продолжаем наш разговор о создании привычной нам аудиокассеты.

Попытки создать коммерчески выгодный диктофон с магнитной проволокой продолжались, и, пожалуй, самым известным их результатом были «Blattnerphone» 1924 года немецкой компании Ferdinand Schuchardt AG и «Textophon BW 1» 1932 года также немецкой компании C. Lorenz AG.

Читать далее

Hi-tech наушники Sony WH-1000XM6: мой опыт использования и впечатления из первых рук

Время на прочтение7 мин
Охват и читатели25K

Давно хотел купить хорошие наушники для поездок и работы, и в прошлом году решился. Выбрал Sony WH-1000XM5 — и не разочаровался. Они подключались мгновенно, держали заряд весь день и позволяли спокойно слушать подкасты или музыку даже в гудящем метро или шумном офисе. К сожалению, музыка играла не очень долго — что в прямом, что в переносном смысле. Примерно через год пластик крепления одной чашки дал трещину, и металлическое крепление выскользнуло наружу — не от удара, а от обычного ношения в сумке и постоянного складывания. Заказывал на Amazon в Испании, там без лишних вопросов вернули деньги и предложили обмен. В тот момент как раз вышли XM6, и я решил не чинить старое, а взять новое — посмотреть, что изменилось за пару лет. В обзоре расскажу, как XM6 ведут себя в деле — от распаковки до повседневного ношения, — и сравню с XM5, чтобы понять, стоит ли менять.

Читать далее

Стерео из моно: ревербератор на модуле Accutronics (Belton) Digi-Log BTDR-2

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели13K

Привет, Хабр! Сегодня я расскажу и покажу, как собрать радиоконструктор гитарной педали реверберации от китайской компании Landtone с добавлением интересной и полезной модификации — стереофонического выхода.

Это позволит сделать звучание электрогитары более живым и объёмным, особенно в случае записи через аудиоинтерфейс без цифровой постобработки. Тогда ревербератор целесообразно включить последним в цепи эффектов, если вы не используете другие стереофонические педали.

И разумеется, все мы сможем послушать, что получилось в итоге.

Читать далее

Краткая история создания аудиокассеты. Часть первая

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели9.4K

Если уместить историю аудиокассеты в одно предложение, то сделали ее немцы, только большую, похожую на гантель, габаритами 38,5 x 12,5 x 4,5 см и весом около килограмма; довели до нынешнего вида и размера голландцы; сделали ее знаменитой и сказочно богатой те же голландцы вместе с немцами, американцами и японцами, но на 101 году своей жизни (включая внутриутробный период) она, не выдержав конкуренции с цифровыми компакт-дисками, разорилась и впала в кому, в коей пребывает до сих пор, лишь время от времени подавая признаки жизни при подключениях ее к аппарату искусственного финансового обеспечения бизнесменами-хипстерами, надеющимися заработать на ностальгии.

Что же касается патентной истории создания аудиокассеты, то традиционно ее принято начинать с датчанина Вальдемара Поульсена и его патента 1899 года на «Устройство для запоминания речи и сигналов», в котором звук записывался и воспроизводился с намагниченной стальной проволоки, намотанной на барабан с винтовой резьбой.

Читать далее

Звуки в прототипе на примере нашей игры с Siberian Game Jam. Иерархия для целостной картины

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели11K

При разработке игры в условиях 72-часового джема звук часто становится последней линией защиты, на которую заканчиваются силы. Главная задача прототипа — создать ощущение, что игра «живая и отзывчивая», а звук главный инструмент для этого. В этой статье мы разберем иерархию звуков на реальном примере нашей игры «Выход из строя», созданной на Siberian Game Jam — Ноябрь 2025

Что такое полезное действие и почему оно важно для звука?

Читать далее

Ультрадешёвая гитарная квакушка ZORY DF2210

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели15K

Привет, Хабр! Отличительными особенностями данного изделия китайской промышленности, встречающегося на просторах Алиэкспресса и других торговых площадок, являются пластиковый корпус и экстремально низкая цена.

Моё хобби — приобретать самые дешёвые электрогитары и педали эффектов, а затем доводить их до играбельного и применимого в музыкальных контекстах состояния.

Сегодня мы увидим и услышим, насколько плоха квакушка из Поднебесной, насколько хорошей её можно сделать, и что для этого потребуется.

Читать далее

Ближайшие события

Реставрация, которая меня сломала: Почему убрать смех из Скуби-Ду сложнее, чем сделать ремастер Тома и Джерри в 2к

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели27K

Наверняка многие из вас с теплотой из детства вспоминают «Скуби-Ду, где ты!» 1969 года. Я тоже был в вашем ряду, однако я решился пересмотреть. И внезапно закадровый смех, который и сейчас то даже в ситкомах считается «артефактом древности», налеплен на детективный, комедийный мультик. Мне это очень сильно начало ломать впечатление от просмотра, — невозможно выстоять, когда каждые полминуты из 20 минут серии по поводу и без повода тебе указывают «где смеяться».

Так и начался мой личный ад на целый месяц, сподвигнутый наивным, но сильным желанием — сделать идеальную версию Скуби-Ду, такую, какую я помнил из детства.
История же эта обернулась гораздо серьёзнее, чем нажать на кнопку «удалить закадровый смех» в Adobe Premiere Pro.

Узнать, что пошло не так

Как мы доработали фреймворк Rasa, чтобы сделать своего ИИ-секретаря для ответа на звонки

Время на прочтение7 мин
Охват и читатели5.6K

Привет, Хабр! Меня зовут Игорь Козлов и я — ведущий разработчик в команде «Membrana Голос» от МТС. Наш продукт — это сервис, который принимает звонки, когда вы заняты, и общается со звонящими почти как живой человек. Он основан на полноценном диалоговом фреймворке, десятках моделей машинного обучения и тщательно продуманной логики обработки интентов. Мы взяли за основу open source-фреймворк Rasa, но сильно его доработали, чтобы превратить в гибкую платформу для управления голосовыми диалогами.

В этом материале я покажу, как мы переписали Action Server и обучили DIETClassifier, а также расскажу, как нам удалось обойти ограничения Rasa и сделать умного, настраиваемого и устойчивого к ошибкам телефонного ассистента.

Читать далее

Ухо не выполняет преобразование Фурье

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели9.1K

Давайте поговорим о том, как улитка уха вычисляет звук!

Барабанная перепонка приводится в колебания изменениями давления воздуха (звуковыми волнами). Кости среднего уха усиливают и передают эти колебания в заполненную жидкостью спиралеобразную улитку. Колебания перемещаются по жидкости к базилярной мембране, которая выполняет разделение частот1: более жёсткое и лёгкое основание (base на иллюстрации) резонирует с высокочастотными компонентами сигнала, а более гибкая и тяжёлая вершина (apex) резонирует с низкими частотами. Между двумя концами резонирующие частоты логарифмически снижаются в пространстве2.

Волосковые клетки в разных частях базилярной мембраны колеблются вперёд и назад на частоте, соответствующей их расположению на мембране. Но как колебания волосковых клеток преобразуются в электрические сигналы? Этот механико-электрический процесс похож на кадры из фантастического фильма: пружины, соединённые с концами волосковых клеток, открывают и закрывают ионные каналы с частотой колебаний, что затем вызывает выброс нейромедиаторов.

Читать далее

Akai: от гиганта аудиотехники до банкрота

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели20K

Когда-то техника Akai была пределом мечтаний многих любителей качественного звука. Магнитофоны этой фирмы старались привезти из-за заграницы (если, конечно, хватало валюты), да и в наши дни многие оригинальные Akai продолжают служить своим владельцам верой и правдой. Но, как это часто бывает, что-то пошло не так, и многомиллиардная фирма с тысячами сотрудников обанкротилась и перестала быть японской. О непростой судьбе легенды звука — в нашем материале  

Читать далее

Как создавали уникальный советский синтезатор АНС и что с ним сейчас

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели9K

В России в 1957 году был создан синтезатор, чьи возможности в своё время потрясли весь мир. Он был способен извлекать звуки, напоминающие людям о космических пространствах, и с его помощью озвучивали фильм «Космос», который показывали на выставках в Париже и Лондоне. Можно проследить историю его создания — от идеи до воплощения в жизнь.

Читать далее

Музыкальные программы на игровых приставках

Уровень сложностиПростой
Время на прочтение23 мин
Охват и читатели18K

С приходом в каждый дом технологического чуда под названием персональный компьютер мы привыкли, что каждый школьник может сочинять и записывать дома музыку, не обладая музыкальными инструментами и особыми знаниями. Некоторые даже умудряются делать из этого успешную карьеру.

Однако, уже в 1990-х годах создание музыки стало доступно не только обладателям «настоящих» ПК, но и пользователям куда более простых и узкоспециализированных компьютерных устройств. Речь про игровые приставки, они же консоли. Для них тоже существовали музыкальные редакторы, и за годы их накопился целый исторический пласт. Покопаемся!

Читать далее

Как музыканты издеваются над программистами

Время на прочтение7 мин
Охват и читатели27K

Музыканты - ребята творческие. И называют они себя и свои произведения тоже творчески. Иногда так заковыристо, что программистам стримингов и музыкальных сервисов остается только посочувствовать.

Вот, казалось бы, что может быть проще: создать базу треков и исполнителей. Пишем имя артиста/группы, название альбома, список треков и даем возможность по ним искать. Но потом натыкаемся на исполнителя Prince, который изменил своё имя на знак, который не существует и начинаем печалиться, потому что непонятно, как его искать после переименования. Фанаты вроде как нашли выход и предложили использовать 4 спец.символа юникода Ƭ̵̬̊, что тоже похоже на костыль, а задавать старое имя как псевдоним, вроде как концептуально неправильно. Ну или попадаются металлюги Brouillard, у которых каждый альбом называется так же - Brouillard. А каждый трек внутри альбома имеет такое же название.

Но это еще цветочки, потому дальше тесты целостности библиотеки начинают падать, так как в ней попадаются треки длиной либо одну секунду, либо 639 часов. Ну или встречаются треки с нулевым номером, потому что это так называе "секретные" композиции, которые можно было найти включением первого трека и переключением плеера назад. Как вы понимаете, сегодня мы поговорим о музыкальных edge-случаях. Заходите, будет интересно.

Читать далее
1
23 ...

Вклад авторов