Pull to refresh
  • by relevance
  • by date
  • by rating

Исследователи работают над слуховым аппаратом, который помогает сосредоточиться на одном из голосов

Machine learning *Brain The future is here

15 мая инженеры из Колумбийского Института Цукермана опубликовали в журнале Science Advances промежуточные итоги своего экспериментального проекта – слухового аппарата, способного фокусироваться только на тех звуках, которые интересуют его владельца.
Читать дальше →
Total votes 9: ↑8 and ↓1 +7
Views 1K
Comments 2

Простая компрессия звука в Audacity

Lumber room
В принципе, записанный голос сразу же можно выкладыать в виде подкаста. Но лучше немного посидеть, разобраться хотя бы в азах и провести простую обработку звука. Есть одно минимальное действие, совсем не сложное ни в понимании, ни в реализации, при этом структура звучание резко изменится в лучшую сторону. Речь идет о компрессии звука.

Когда я впервые услышал о компрессии, я конечно подумал о mp3 или ogg, или любых других форматах, позволяющих сжать звуковые файлы в размере. Как оказалось, компрессия — вовсе не сюда :)

Чтобы понять, что такое компрессия, давайте сразу начнем с практики и по ходу будем вникать в суть дела. Перед вами фрагмент моей речи без какой-либо обработки (из какого-то выпуска первого сезона «Кадров»):

Читать дальше →
Total votes 27: ↑22 and ↓5 +17
Views 22K
Comments 12

Программные гитарные процессоры

Lumber room
Доброго времени суток, уважаемые. Не стал писать этот топик в блог «Звук и Музыка» ибо особой информационной нагрузки он не несет. Мне хотелось бы обратиться к сообществу и задать вопрос, возможно не совсем относящийся к тематике Хабра. Использовал ли кто-нибудь программные гитарные процессоры? Какие требования при этом к железу компьютера (думаю в первую очередь к звуковой карте)? Предыстория моего вопроса: являясь поклонником рок-музыки и всяческого хэви-метала, решил самостоятельно освоить «ремесло» игры на электрогитаре, прикупил собственно недорогую гитару и комбо-усилитель. Работает вроде все сносно, но для различных звуковых эффектов необходимо приобретать всяческие гитарные процессоры или устройства все-в-одном. Естественно такой технике цены не сложишь, а мое умение игры в настоящее время уж точно не заслуживает таких финансовых вложений. Вдруг меня осенила идея: «зачем мне все эти примочки? у меня ведь есть очень неплохая примочка в хозяйстве, с ним всякое можно сделать:)». Подключил комбо-усилитель к линейному входу звуковой карты, настроил микшер, звук пошел через компьютер. «Пол дела сделано» — подумал я. Тут началось самое интересное, я стал пробовать различный софт, который смог нагуглить на описанную тематику. В результате — ничего, может у меня руки кривые, а может железо не то — не знаю. Либо вобще нет никакого звука, либо просто свист в колонках. Пробовал Guitar Rig, Waves… Использовал ли кто-нибудь аналогичный софт? Сталкивался ли с такой задачей? Заранее благодарен за любую информацию.
Total votes 17: ↑12 and ↓5 +7
Views 1.5K
Comments 60

Летний спецэпизод ФППП для любителей обработки звука

Habr
После небольшого перерыва мы, как обычно, запускаем очередной эпизод нашей Федеральной Программы Поддержки Пользователей. На этот раз при поддержке компании iProLab и не в глобальном масштабе, а на строго определенную тему — обработка звука.

Условия следующие: в течение следующих трех недель мы ожидаем увидеть в блоге «Звук и Музыка» посты на тему цифровой обработки звука. Автор лучшего топика получит возможность бесплатно посетить 4-дневный курс обучения работе с одним из самых мощных инструментов компьютерной обработки аудио — программой Logic Studio!

Правила просты:
— данный этап конкурса проводится в период с 00:00 29.06.09 по 23:59 19.07.09;
— награду получает пользователь, чей топик были опубликован в период проведения данного этапа конкурса и при этом на момент его окончания имеет наибольший рейтинг среди всех топиков, опубликованных в блоге «Звук и Музыка» (http://habrahabr.ru/blogs/sound_and_music/) в период проведения данного этапа конкурса;
— в программе участвуют только обычные топики, топики-переводы и подкасты (т.е. не участвуют топики-ссылки и вопросы. Даже Внутренний Голос не участвует!);
— топик должен быть самостоятельным трудом автора (тексты, картинки, файлы с других сайтов не принимают участия; допускается использование чужих картинок только в качестве сопроводительных иллюстраций);
— топик должен быть оригинальным, то есть впервые опубликован в Сети (при этом последующая параллельная публикация в другом месте разрешена, не разрешается только использовать тексты, ранее опубликованные в своих блогах);
— топик не должен быть обсуждением Хабра, других проектов «Тематических Медиа» и компаний-спонсоров, их услуг и продукции;
— в конкунрсе не имеют права участвовать сотрудники компаний Тематические Медиа и компаний-спонсоров, их родственники, родственники их родственников, а также их виртуалы :)
— топик должен стать лидером честно, т.е. никакие обходы правил, накрутки с использованием виртуалов, скрытых и открытых уязвимостей запрещены. Мы будем следить;
— если два или более топиков одного автора занимают призовые места, учитывается только лучший топик;
— если топики разных авторов набирают одинаковое количество голосов, победа присуждается автору, чей топик был опубликован первым.

Поехали!
Total votes 24: ↑16 and ↓8 +8
Views 463
Comments 4

Победитель летнего спецэпизода ФППП

Habr
По итогам нашего очередного конкурса в рамках ФППП, на сей раз посвященного обработке звука, был определен победитель, который благодаря компании iProLab получит возможность бесплатно посетить 4-дневный курс обучения работе с одним из самых мощных инструментов компьютерной обработки аудио — программой Logic Studio.

Итак, победителем стал хабрапользователь tozx и его топик про порядок в медиатеке. Да, тема топика не совсем соответствует заданной теме — «цифровая обработка звука», но пост был хорошо оценен читателями, и я не вижу причин не подарить Антону возможность научиться профессионально работать со звуком.

Сам курс обучения будет проходить в Москве с 23 по 26 июля, преподавать науку цифровой обработки звука в Logic Audio будет известный специалист в этой области — Андрей Дементьев.
Total votes 5: ↑4 and ↓1 +3
Views 353
Comments 0

Обработка гитарного звука в реальном времени на ПК

Sound
Гитара — инструмент простой. И играть на ней — дело, в принципе, не хитрое. Но стоит только заменить старую потрепанную акустическую шестиструнку на лаковую электрогитару — сразу начинаются проблемы.

Электрогитара без усилителя и процессора (ампа, примочки, педали) — немой инструмент. Самый простой и эффективный способ озвучить ее — подключить к вашему компьютеру. Итак, хочу поделится своим опытом в обработке звука от гитары на ПК.

Подключить электрогитару к ПК — дело двух минут — стоит лишь подсоединить гитарный шнур к линейному (или микрофонному) входу звуковой карты. Только вот звучать она будет обычно. Чтобы окрасить звук — необходимо его обработать в специальной программе. Но, обо всем по порядку.
Читать дальше →
Total votes 37: ↑29 and ↓8 +21
Views 98K
Comments 46

Вувузела фильтр

Sound
В этом посте хочу рассказать, о том, как справиться с «роем мух», как его называет aguares, в трансляциях с Чемпионата Мира по футболу 2010. Звук этот появляется из противных южноафриканских дудок — название которым — Вувузелы.

Постановка инженерной задачи следующая:
Отфильтровать частоты звучания Вувузел в реальном времени из аудио потока онлайн трансляции, не применяя записи сигнала на жесткий диск.

Данная проблема разбивается на следующие подзадачи:
1) Считать поток аудио до вывода его на колонки
2) Произвести подавление основных частот вувузел
3) Подать обработанный звук на аудио выход
+ все это в режиме реального времени.

Из методов цифровой обработки аудио сигналов, доступных для Windows 7, мною была выбрана концепция VST.
Читать дальше →
Total votes 131: ↑119 and ↓12 +107
Views 3K
Comments 95

Управление воспроизведением музыки с помощью кулера

Sound
Чего только не придумают люди с «очумелыми ручками». Один умелец, используя систему на Arduino, собрал установку, которая проигрывает музыку со старого кассетного плеера с помощью кулера, причем скорость воспроизведения регулируется скоростью вращения кулера. Первоначально задумывалось, что кулер просто будет крутиться в такт музыке, но потом это все было усовершенствовано, и вот что получилось.



P.S. Прошу прощения, если было, так как наткнулся только сегодня.

Upd: Статья самого автора девайса (спасибо за ссылку Ocelot).
Total votes 31: ↑25 and ↓6 +19
Views 2.5K
Comments 13

Звуковые отпечатки: распознавание рекламы на радио

Python *Algorithms *
Sandbox
Из этой статьи вы узнаете, что распознавание даже коротких звуковых фрагментов в зашумленной записи — вполне решаемая задача, а прототип так вообще реализуется за 30 строчек кода на Python. Мы увидим, как тут помогает преобразование Фурье, и наглядно посмотрим, как работает алгоритм поиска и сопоставления отпечатков. Статья будет полезна, если вы сами хотите написать подобную систему, или вам интересно, как она может быть устроена.
Читать дальше →
Total votes 30: ↑29 and ↓1 +28
Views 32K
Comments 26

Адаптивное шумоподавление речевого сигнала

Self Promo
В процессе работы над диалоговой системой (http://habrahabr.ru/post/235763/) мы столкнулись с непреодолимой, на первый взгляд, проблемой – в реальных, боевых условиях работы, производительность системы ASR оказывалась значительно ниже ожидаемой. Одним из компонентов, сказывающимся на производительности, неизменно оказывался шум на заднем фоне, принимающий самые разнообразные формы. Особенно неприятными для ASR в наших экспериментах были трудно-нейтрализуемые шум городской улицы и шум массовых скоплений людей.

Стало ясно, что проблему придется решить, или реальной ценности от голосовой системы просто не будет.
Читать дальше →
Total votes 18: ↑16 and ↓2 +14
Views 11K
Comments 25

Теория звука. Что нужно знать о звуке, чтобы с ним работать. Опыт Яндекс.Музыки

Яндекс corporate blog Algorithms *Mathematics *
Звук, как и цвет, люди воспринимают по-разному. Например, то, что кажется слишком громким или некачественным одним, может быть нормальным для других.

Для работы над Яндекс.Музыкой нам всегда важно помнить о разных тонкостях, которые таит в себе звук. Что такое громкость, как она меняется и от чего зависит? Как работают звуковые фильтры? Какие бывают шумы? Как меняется звук? Как люди его воспринимают.



Мы довольно много узнали обо всём этом, работая над нашим проектом, и сегодня я попробую описать на пальцах некоторые основные понятия, которые требуется знать, если вы имеете дело с цифровой обработкой звука. В этой статье нет серьёзной математики вроде быстрых преобразований Фурье и прочего — эти формулы несложно найти в сети. Я опишу суть и смысл вещей, с которыми придётся столкнуться.

Поводом для этого поста можете считать то, что мы добавили в приложения Яндекс.Музыки возможность слушать треки в высоком качестве (320kbps). А можете не считать. Итак.
Читать дальше →
Total votes 83: ↑78 and ↓5 +73
Views 176K
Comments 52

Как сделать процессорный звук в Жигулях

Industrial Programming *Programming microcontrollers *

Обычно люди идут в магазин автозвука и покупают компоненты. Я же сначала спаял цифровой аудиопроцессор, а компоненты поставил какие есть.


Самая большая проблема автозвука-установка динамиков в самых неподходящих местах: динамик который играет прямо в ногу, сабвуфер массирует спину, влияние формы салона. Пока звук дойдет до ушей он будет уже не тот. Именно поэтому я начал с DSP-процессора.


Под катом будет много схем и графиков.
Total votes 64: ↑63 and ↓1 +62
Views 37K
Comments 37

Создание синтезатора звуковых эффектов из ретро-игр

Adobe Flash Game development *
Translation
image

Из этой статьи вы узнаете, как создать аудиодвижок на основе синтезатора, способный генерировать звуки для игр в ретро-стиле. Звуковой движок будет генерировать все звуки во время выполнения и ему не требуются никакие внешние зависимости, например, файлы MP3 или WAV. В конечном результате у нас получится рабочая библиотека, которую можно удобно встраивать в игры.

Прежде чем приступать к созданию аудиодвижка, нам нужно разобраться с парой понятий. Во-первых, с волнами, которые будет использовать движок для генерирования звуков. Во-вторых, надо понимать, как хранятся и обозначаются звуковые волны в цифровом виде.

В этом туториале используется язык программирования ActionScript 3.0, но применяемые техники и концепции можно легко преобразовать в любой другой язык, предоставляющий доступ к низкоуровневому API работы со звуком.
Читать дальше →
Total votes 27: ↑27 and ↓0 +27
Views 9.9K
Comments 3

YouTube положил конец войне громкости

Sound
Примерно с декабря 2014 года YouTube вступил в старую как мир войну громкости, которую музыкальные лейблы ведут друг с другом. Каждый хочет сделать свою музыку громче, чем у конкурентов. За десятилетия громкость музыки на компакт-дисках постоянно возрастала и в какой-то момент достигла предела, который поддерживается стандартом. В результате, студии начали осуществлять компрессию и усиление звука, что приводит к ограничению амплитуды сигнала с потерей качества.

Радиостанции стараются выравнивать громкость всех музыкальных треков в плейлисте, чтобы она не превышала громкости рекламы. Сейчас то же самое начал делать и YouTube. Он уменьшает громкость звука в слишком громких треках до –13 LUFS, так что у студий уже нет смысла воевать.

Да и пользователям приятно, когда треки в плейлисте YouTube не «скачут» по громкости, так что приходится постоянно подскакивать к колонкам.
Читать дальше →
Total votes 44: ↑39 and ↓5 +34
Views 40K
Comments 44

Генерация окружения на основе звука и музыки в Unity3D. Часть 2. Создание 2D трассы из музыки

Productivity Inside corporate blog Game development *Unity3D *Sound
Tutorial

Аннотация


Всем привет. Относительно недавно я написал статью Генерация окружения на основе звука и музыки в Unity3D, в которой привел несколько примеров игр, задействующих механику генерации контента на основе музыки, а так же рассказал про базовые аспекты подобных игр. В статье практически не было кода и я пообещал, что будет продолжение. И вот оно, перед вами. На этот раз мы попытаемся создать трассу для 2D гонки, в стиле Hill Climb, из вашей музыки. Посмотрим, что у нас получится..


Читать дальше →
Total votes 11: ↑11 and ↓0 +11
Views 4.3K
Comments 1

Ищем поломку в авто по звуку: призываем немного машинного обучения для поиска аномалий в работе двигателя

Python *Machine learning *Sound

В школьные годы у меня был одноклассник, который мог послушать, как работает машина во дворе, и с серьезным лицом вынести вердикт: все в порядке, или что-то сломалось, и нужно срочно бежать за новыми деталями/маслом/инструментами! Я, как абсолютный чайник в автомобильном деле, всегда слышал обычное дребезжание очередной двенашки, никаких отличий не замечая и просто молча поражаясь его слуху и скилам.



Сейчас разбираться во внутренностях автомобиля я лучше не стал, зато начал работать с обработкой звуковых сигналов и машинным обучением, и здесь мы с вами постараемся понять, а возможно ли научить компьютер улавливать в звуке работы двигателя отклонения от нормы?


Как минимум, это просто интересно проверить, а в перспективе такая технология могла бы сэкономить кучу денег автовладельцам. По крайней мере в моем представлении, под капотом критичные поломки происходят постепенно, и на ранних стадиях, многие из них можно услышать, быстро и дешево исправить, сэкономив время, деньги и без того шаткие нервы.


Ну что, пожалуй, пора перейти от слов к делу. Поехали!

Читать дальше →
Total votes 39: ↑38 and ↓1 +37
Views 37K
Comments 45

Как нейронная сеть SincNet выделяет значимые частоты в звуке через Back Propagation

Python *Machine learning *Sound

Недавно вышла одна очень интересная статья "Speaker Recognition from raw waveform with SincNet", в которой была описана end-to-end архитектура нейронной сети для распознавания говорящего по голосу. Ключевая особенность этой архитектуры — специальные одномерные сверточные слои, которые имеют всего два параметра с четкой интерпретацией. Интерпретируемость параметров нейронной сети — дело довольно затруднительное, поэтому эта статья привлекла мой интерес.



Если заинтересовало описание идеи этой статьи, а также почему эта идея близка по смыслу к построению мел-спектрограмм, то милости прошу под кат.

Читать дальше →
Total votes 9: ↑9 and ↓0 +9
Views 9.7K
Comments 8

Что ты такое? Как мы spoof от human отличали — да еще и победили

Python *Machine learning *Artificial Intelligence Sound
Недавно прошел ID R&D Voice Antispoofing Challenge, главной задачей которого было создать алгоритм, способный отличить человеческий голос (human) от синтезированной записи (spoof). Я — ML Researcher в Dasha AI и много работаю над распознаванием речи, поэтому и решил поучаствовать. Вместе с командой мы заняли первое место. Под катом я расскажу о новых крутых подходах к обработке звука, а также о сложностях и странностях, с которыми нам пришлось столкнуться.
Читать дальше →
Total votes 19: ↑19 and ↓0 +19
Views 2.7K
Comments 0

Подкасты для гика: парочка проверенных передач про управление проектами, анализ технологий и GTD

vscextv corporate blog Project management *GTD *Sound Interview
Я слушаю подкасты с 2010 года. Расскажу, какие тогда нашёл передачи, и объясню, почему люблю возвращаться к ним спустя много лет. Если вы хотели бы разнообразить информационную диету и немного отвлечься от вездесущих новостей о кризисе, подкасты — то, что нужно.

Читать дальше →
Total votes 10: ↑9 and ↓1 +8
Views 5.4K
Comments 7

Изучаем VoIP-движок Mediastreamer2. Часть 11

Open source *System Analysis and Design **nix *C *Sound
Tutorial

Материал статьи взят с моего дзен-канала.



Механизм перемещения данных


  • Блок данных dblk_t
  • Сообщение mblk_t
  • Функции работы с сообщениями mblk_t
  • Очередь queue_t
  • Функции работы с очередями queue_t
  • Соединение фильтров
  • Сигнальная точка графа обработки данных
  • Закулисная деятельность тикера
  • Буферизатор MSBufferizer
  • Функции работы с MSBufferizer

В прошлой статье мы разработали свой собственный фильтр. Эту статью мы посветим устройству внутреннего механизма перемещения данных между фильтрами медиастримера. Это позволит в дальнейшем писать изощренные фильтры с меньшими усилиями.

Читать дальше →
Total votes 5: ↑5 and ↓0 +5
Views 697
Comments 0
1