Обновить
83.71

Звук

Это «ж-ж-ж» неспроста

Сначала показывать
Порог рейтинга
Уровень сложности

ML-аналитика, какие проблемы решает, инструменты, зачем выделять ресурсы

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели5.8K

Привет, Хабр! Меня зовут Игорь Миленький, я руководитель отдела ML-аналитики в музыкальном сервисе Звук. Расскажу об еще одной профессии в Data Science, ML-аналитике, и покажу на практике, как устроена работа команды в Звуке. В статье хотел бы дать общее представление о профессии ML-аналитика и примерах задач.

Читать далее

Новости

Глушение нежелательных шумов в помещении, с помощью метаматериалов, на базе резонатора Гельмгольца

Время на прочтение8 мин
Охват и читатели14K

John Heisz - Speakers and Audio Projects

Борьба с шумом окружающей среды является весьма важным фактором личного комфорта проживания в условиях современного мира. Особенно это важно для профессий с потребностью в высокой мыслительной активности, так как шум может не позволить достичь высоких результатов. 

В прошлой статье мы рассмотрели 2 основных варианта такой борьбы: экстенсивный и интенсивный. Но, на самом деле, способы глушения нежелательных звуков не ограничиваются только рассмотренными и существует еще, как минимум, один вариант — использование «звукопоглощающих метаматериалов»… 

Читать далее

От голосовых к тексту: делаем Telegram-бота для расшифровки аудио на модели от СБЕР — GigaAM-v3

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели6.8K

Привет, Хабр! Недавно Сбер выкатил новые модели распознавания речи, и мне захотелось проверить их не в абстрактном демо, а в реальном сценарии. В этой статье я расскажу о практическом кейсе – разработке Telegram-бота, который преобразует голосовые сообщения в текст. Посмотрим, на что способна новая отечественная модель GigaAM-v3, и соберём на её основе расширяемого Telegram-бота.

▁ ▂ ▃ ▅ ▃ ▂ ▁ ▂ ▃ ▅ ▆ ▅ ▃ ▂ ▁

Электрогитара с семью «вкусными» звучаниями, доступными моментально

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели16K

Привет, Хабр! Я продолжаю совершенствовать любимые электрогитары, и сегодня подробно расскажу о текущих доработках одной из них — дизайнерского суперстрата Tinar GT500.

Речь пойдёт о выборе доступных недорогих звукоснимателей, их правильной фазировке и маленьких секретах темброблока, способных весьма расширить исполнительские возможности инструмента.

Читать далее

Про борьбу с шумом городской среды — концептуально, с точки зрения физики

Время на прочтение9 мин
Охват и читатели13K

Dundas Football Club, Manuguf

Городская среда изобилует громкими звуками, что, поневоле, заставляет задуматься о защите — как это лучше сделать (с концептуальной точки зрения), и какими некоторыми интересными свойствами звук обладает, обо всём этом мы и поговорим в статье ниже!

Читать далее

Как исправить причуды HDMI-CEC с помощью Raspberry Pi и кабеля за 500 р

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели16K

Долгие годы я воспринимал систему HDMI-CEC как домового: иногда полезная, часто непредсказуемая и всегда загадочная. У меня в гостиной собран несложный мультимедиа-центр — ТВ Samsung с поддержкой ARC (не eARC, которая заслуживает отдельного поста), Denon AVR-X1700H, спрятанный в кладовке, Apple TV, несколько подключённых к Denon игровых приставок и Raspberry Pi 4, управляющий системой Homebridge. Что касается CEC, то в Apple TV эта фича работает прекрасно, но вот приставки ведут себя так, будто едва с ней знакомы. Они будят ТВ, переключают источник, но оставляют Denon в режим ожидания, вынуждая меня переключать вывод аудио вручную.

Читать далее

Два китайских хоруса, одинаковых с лица: сравнение и ремонт

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели11K

Привет, Хабр! Гитарные педали из Поднебесной в корпусе формата «Сникерс» из двух гнутых П-образных алюминиевых профилей привлекают своей дешевизной, компактностью и лёгкостью, однако проигрывают в плане надёжности.

Последнее особенно касается ножного переключателя, который нередко быстро выходит из строя, либо даже оказывается неисправным прямо из коробки.

Сегодня я расскажу, как преодолеть этот конструктивный недостаток без замены переключателя. Ещё мы познакомимся с типовой схемотехникой аналоговых хорусов. И, разумеется, сможем послушать, как они звучат.

Читать далее

Запись на проволоку или… как собрать Бумажный Жёсткий Диск?

Время на прочтение11 мин
Охват и читатели8.9K

Если попробовать выбрать наиболее технологичный и, в то же время, интересный, а также существенно повлиявший на историю цивилизации способ сохранения информации, то, среди таковых, несомненно, особняком будет стоять магнитная запись на проволоку! 

Появившись достаточно давно, она положила начало целым направлениям в науке и технике и, любопытным следствиям из этого, которые сулят интересные перспективы!

Читать далее

Кросс-трекеры: ретро-музыка на современном ПК

Уровень сложностиПростой
Время на прочтение29 мин
Охват и читатели15K

Я не раз обращался к теме музыкальных редакторов системы «трекер». Казалось бы, сколько можно, горшочек, не вари. Но этих программ насчитывается сотни, и несмотря на сходство до степени смешения, созданы они с разными намерениями, посвящены решению различных задач, а к их появлению привели исторические причины разной степени занимательности. В то же время, эта нишевая тема, развивавшаяся десятилетиями, почти не имела выхода за пределы специализированных сообществ в формате обзорных публикаций для массового читателя. А значит, можно и нужно продолжать её раскрывать.

Сегодня уделю пристальное внимание явлению «кросс-трекеров» — программ для современных ПК и операционных систем типа Windows и Linux, позволяющих создавать музыку для различных старых компьютеров, игровых приставок и прочих подобных устройств, а точнее, для их музыкальных синтезаторов. Зачем, почему, что происходит, кто здесь — как обычно, сейчас разберёмся во всех этих животрепещущих вопросах.

Читать далее

Хроника о том, как новые технологии поселились в нашем видеопроизводственном пайплайне, или чему нас научили нейросети

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели8K

И снова здравствуйте! В этой части завершаем разбор рабочего процесса локализации видео и нейроозвучки. В предыдущих публикациях (раз, два) мы говорили о том, как возникла задача оптимизировать процесс и почему нашей команде стало критично ускорить подготовку десятков обучающих роликов для наших заказчиков в Узбекистане, а также к чему по итогу пришли в ходе наших изысканий.

Теперь давайте поговорим про оставшиеся этапы нового рабочего процесса.

Читать далее

Красивые китайские звукосниматели для электрогитары

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели14K

Привет, Хабр! Пока виртуозные музыканты создают прекрасную музыку, обаятельные артисты радуют слушателей выразительными представлениями, а техничные высекатели совершенствуются в и без того умопомрачительной скорости извлечения нот, ухитряясь при этом ещё и попадать в такт, почтенные гитарные коллекционеры дегустируют антикварные звукосниматели, лампы, транзисторы, трансформаторы и деревянные конструкции инструментов, а опытные продюсеры просто берут подходящие громкоговорители и расставляют микрофоны правильным образом.

В тени всех этих титанов электрогитары мне тоже хочется чем-то заняться. Например, опробовать несколько новых идей касательно дальнейшего улучшения звучаний двух любимых гитарных самоделок — ультралёгкой летящей стрелы и котообразного даблката со светомузыкальным эффектом.

Читать далее

Звучит: история и интеллектуальная собственность Мелодии

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели8.6K

Мелодия — одна из самых значимых звукозаписывающих компаний в истории СССР и постсоветской России. Основанная в 1964 году, она стала монополистом в производстве грампластинок в Советском Союзе. За десятилетия существования фирма «Мелодия» выпустила огромное количество записей классической, эстрадной, джазовой и народной музыки, а также литературных и детских программ. Ее виниловые пластинки стали культовыми, а логотип — узнаваемым символом советской музыкальной индустрии.

Читать далее

Радар для прослушки телефона с трёх метров

Время на прочтение3 мин
Охват и читатели73K

Современные технологии машинного обучения (ML) позволяют извлечь полезный сигнал из массива данных, который раньше считался просто шумом. Это открывает новые возможности для разведки и шпионажа, в том числе прослушки телефонов и слежки за гражданами.

Группа исследователей Университета Пенсильвании разработала аппаратно-программный комплекс WirelessTap, который снимает звук по вибрации телефона. Это принципиально новый способ прослушки, который не использовался ранее.

Теоретически, такие системы транскрибирования речи можно установить в общественных и публичных местах, школах, больницах, снимая в реальном времени текстовую расшифровку телефонных переговоров в помещении. Полученные тексты могут использоваться для профилирования граждан и обучения ИИ.

Читать далее

Ближайшие события

Классический фленджер Harley-Benton

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели12K

Привет, Хабр! Сегодня мы изучим недорогую, но весьма качественную педаль для электрогитары, реализующую эффект фленджера, знакомый нам по множеству культовых записей любимых музыкальных групп.

Читать далее

Разбираемся, что слышит умная колонка. О нелинейных искажениях и метрике FRR

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели8.6K

Салют, Хабр!  

Меня зовут Александр. Я DSP-инженер, то есть специалист по цифровой обработке сигналов, и в SberDevices занимаюсь VQE — Voice Quality Enhancement, блоком улучшения качества звука. Мы разработали методику, которая позволяет прогнозировать качество распознавания голоса (так называемую метрику FRR) по объективным показателям работы эхоподавления, а измерения и оценку параметров стандартизировали. Благодаря этому методику можно использовать для любых устройств без сложного дополнительного оборудования. Сегодня расскажу о ней.

Читать далее

Загадочный чёрный Explorer

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели17K

Привет, Хабр! В результате очередного обмена у меня появилась ещё одна электрогитара, кастомизированная предыдущим хозяином в стиле обработанной тунговым маслом тонированной древесины с открытыми порами.

Инструмент оказался на удивление играбельным и хорошо звучащим, однако ремонт и доработка, как это всегда бывает, тоже потребовались.

Читать далее

Чип, который умеет говорить (SI4703)

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели12K

В этом тексте я хотел бы рассказать про свой опыт работы с однокристальным радио приёмникои SI4703 от компании Silicon Laboratories.

SI4703 - это миниатюрный настраиваемый FM радио приемник c DSP обработкой, управляемый по I2C, с возможностью принимать бинарные данные от радиостанций по протоколу RDS .

Чип производит демодуляцию частотно модулированного сигнала, пропускает его через цифровой гетеродин и выдает на наушники аналоговый сигнал. Тут есть два смесителя: первый аналоговый, второй цифровой. Аналоговый смеситель снимает FM сигнал с несущей. Цифровой смеситель подстраивает цифровой гетеродин на конкретную радиостанцию. Это классический гетеродинный приемник.

Читать далее

Музыкальный движок для Денди: FamiTone

Уровень сложностиПростой
Время на прочтение25 мин
Охват и читатели19K

Сегодня я решил поведать миру очередную историю одного из множества моих восьмибитных деяний дней давно минувших. Это одновременно обзор и своего рода «постмортем» довольно успешного проекта, правда, припозднившийся на добрых полтора десятка лет. Погреться в лучах славы былых успехов никогда не поздно!

Речь пойдёт о некогда созданной мной библиотечкe, музыкальном «драйвере» или движке под названием «FamiTone», предназначенном для озвучки любительских (homebrew) игр для 8-битной игровой приставки Famicom, она же NES, она же «Денди». По пути разберёмся, что это, как устроено, кому и зачем вообще могло понадобиться, и пригодилось ли в итоге. Спойлер: да.

Читать далее

Наш новый LLM-based синтез речи

Уровень сложностиПростой
Время на прочтение16 мин
Охват и читатели13K

Рассказываем о нашем новом синтезе речи.

Мы так и называем его — «новый синтез», или GigaTTS. Под капотом у него GigaChat 3b, аудио адаптер, собственный токенизатор речи и 30 тысяч часов данных. Никаких диффузий. Очень много работы было проделано над обучением модели, на студии и при подготовке данных для обучения.

Новый синтез до мурашек естественный. Он говорит как живой человек, умеет смеяться и выражать эмоции со всеми нюансами. По метрикам он обгоняет наши прошлые модели в 2-4 раза, особенно большой выигрыш по естественности голоса.

Под катом вас ждем большой технический обзор того, как мы пришли к такому качеству. Покажем freespeech и специально сделанные голоса операторов колл-центров. Поделимся деталями, как у нас получился синтез текста любой длины, prompt following и клонирование голосов

Читать далее

Гитарные эхо: цифровой и аналоговый дилей

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели9.1K

Привет, Хабр! Эффекты эха для инструментальной и вокальной музыки построены по единому несложному принципу: пакет мгновенных значений напряжений сигнала за определённый промежуток времени записывается в цифровом формате либо в виде реальных потенциалов на затворах полевых транзисторов, а затем воспроизводится с задержкой.

Ранее для этого применялась магнитная лента, а иногда даже электретная плёнка. Существуют и механические линии задержки, основанные на величине скорости звука в различных средах. Это могут быть стальные пружины, а также трубки, наполненные воздухом или иными материалами, включая ртуть. Последний вариант использовался для организации оперативной памяти в архаичных компьютерах.

В любом случае, суть состоит в том, чтобы просто воспроизвести короткую звукозапись или иные данные из недалёкого прошлого. Но тогда почему в мире так много различных эффектов задержки аудиосигнала, причём звучат они действительно по-разному? Сегодня мы это узнаем.

Читать далее
1
23 ...

Вклад авторов