Обновить
102.93

Звук

Это «ж-ж-ж» неспроста

Сначала показывать
Порог рейтинга
Уровень сложности

Второй отец MP3

Уровень сложностиПростой
Время на прочтение12 мин
Охват и читатели28

Работая в Bell Labs, Джеймс Д. Джонстон 26 лет посвятил созданию технологии, которую мы сегодня знаем как MP3. Затем его имя растворилось в истории...

Вступление от «Rogues’ Gallery»

Всякий раз, когда вы прослушиваете чей-нибудь альбом, подкаст или скачиваете трек, то используете технологию, которой не существовало бы без метода перцептуального кодирования аудиосигнала. В основе этого метода лежит научное понимание диапазона воспринимаемых человеческим ухом частот и на основе этого сжатие аудио таким образом, чтобы оставить в нём только самое важное.

И наше шоу (имеется в виду подкаст «The Rogues’ Gallery», — прим. пер.), как и многие другие, существует, благодаря той самой технологии. Ничто из этого не оказалось бы возможным, если бы не инженеры, которые научились втискивать час музыки в файл, достаточно небольшой для скачивания через коммутируемое соединение.

В прогрессив-роке мы чествуем виртуозов, музыкантов, которые раздвигают известные границы и создают что-то новое. Но в сфере технологий тоже есть виртуозы. Люди, которые десятилетиями оттачивают своё мастерство, чья работа изменила мир, и кто так и не получил заслуженного признания.

Одним из таких людей является Джеймс Д. Джонстон. В IEEE его зовут «отцом перцептуального аудиокодирования». Этот человек зарегистрировал более, чем 100 патентов. Кен Томпсон, который разработал Unix, лично переписывал код для созданного им кодека, сказав, что тот значительно превосходит MP3. Федеральный апелляционный суд США подтвердил, что он изобрёл формат MP3 параллельно с Карлхайнцем Бранденбургом. Но всё же в рассказах об истории развития цифрового аудио его имя всплывает крайне редко.

Джеймс является такой же рок-звездой, каких мы приглашаем на наше шоу. Просто он играет на другом инструменте.

И это история о нём.

Читать далее

Новости

Клонирование голоса по 3-секундному образцу локально: обзор Qwen3-TTS, примеры на русском и портативная версия

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели1.8K

Всем привет! Команда Qwen от Alibaba выложила в открытый доступ Qwen3-TTS — нейросетевую модель для синтеза речи с клонированием голоса. Сегодня хочу рассказать об этой технологии подробнее и поделиться портативной версией.

Читать далее

«Поколение в наушниках» рискует заработать тугоухость,  хронический стресс и потерю концентрации

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели5K

Представьте, что каждый раз, нажимая клавишу на клавиатуре, вы слышите не только клик, но и легкое эхо этого звука, которое длится еще несколько секунд. Примерно так ощущается тиннитус (звон или шум в ушах), с которым живет около 10% населения  США (по данным Национального институт глухоты и других коммуникативных расстройств США). 

Знакомая проблема? На самом деле ваш «личный» звон в ушах после рабочего дня это не индивидуальная особенность, а часть жизни многих офисных работников и IT-специалистов.

По словам Генерального директора ВОЗ доктора Тедроса Адхана Гебрейесуса (см. большое исследования «World Report About Hearing» 2021 года) более полутора миллиарда людей в мире в той или иной степени страдают заболеваниями, приводящими к потере слуха. Прогнозы роста до 2,5 миллиарда к 2050 году. 1,1 миллиард молодых людей подвержены риску потери слуха навсегда из-за прослушивания музыки на большой громкости в течение долгого времени.

Речь не о потенциальной глухоте к старости, а о системном повреждении нашей когнитивной экосистемы, где слух - важный элемент для ориентации в пространстве, поддержания внимания и регуляции нервной системы. 

В посте порассуждаю, как «open space» и наушники влияют на ухудшение слуха, хронический стресс и потерю концентрации. В комментариях приглашаю обсудить, что с этим делать.

Как слышно, приём?

Проект по созданию системы передачи текста музыкой

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели5K

Всем добрый день. Решил поделиться одним из почти заброшенных проектов десятилетней давности – передача текста музыкой. Программирование здесь тоже будет, поэтому можно считать это ИТ-проектом.

Читать далее:

Разбираем аудиоматрицу Ивента АМД1616 по винтикам

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели6.5K

Аудиоматрица, она же аудиопроцессор – это один из ключевых компонентов современных профессиональных АВ-систем. По сути аудиоматрица – это автоматизированный микшер, задача которого оперативно перенаправлять аудиосигналы из множества источников (по числу входов) на множество потребителей (по числу выходов) независимо друг от друга, и при необходимости (а такая возникает постоянно) обрабатывать их разными алгоритмами. Пользователь при этом наблюдает за работой оборудования и подсчитывает выгоды. Это важный момент, ибо некоторые считают, что выгода = как можно меньшая цена покупки – и ошибаются, любуясь только одной стороной медали. А есть еще дли-и-инный список затрат на содержание и эксплуатацию прибора (установка, обслуживание, ремонт, обучение персонала, модернизация и даже утилизация в конце жизненного цикла), который называется «стоимость владения», и тут лучше без неожиданностей. Это значит – покупать не на маркетплейсах, а у официального российского поставщика, в штате которого работают профессиональные системные инженеры, техники и программисты.

Читать далее

Делаем лучшую радиосистему для Neko

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели4.6K

Рассказ, как мы собрали "AirPods для гитары" — радио-модуль для передачи звука из гитары. Как так он звучит лучше аналогов, и зачем он Неке.

На фоне современных "как я навайбкодил high-load биллинг за 57 минут", это статья-динозавр про разработку из прошлого, но так уж вышло.

Читать далее

Как я отказался от FFmpeg и написал FLAC энкодер за 500 строк на Go

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели12K

Избавляемся от FFmpeg: конвертер аудио на чистом Go с FLAC-энкодером

Как убрать зависимость от FFmpeg в аудиоинструментах. Разбираю архитектуру, pure Go библиотеки и написание FLAC-энкодера с нуля. Результат: один бинарник для Linux, Windows, macOS.

Читать далее

Новогодний подарок себе — полный электрогитарный аудиотракт в уютной деревянной коробочке

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели17K

Привет, Хабр! Бывает, что я куда-нибудь уезжаю, и тогда хочется иметь с собой свой гитарный звук. Мой домашний сетап довольно громоздкий, не очень транспортабельный и нередко даёт сбои, иногда трудноустранимые в силу множества незадокументированных изменений, производившихся на протяжении нескольких лет.

На этих новогодних каникулах, наконец-то, нашлось время воплотить давнюю мечту — разработать и собрать простое, относительно компактное и многофункциональное решение для портативного гитарного звука. Разумеется, без электровакуумных ламп. Только микросхемы и транзисторы.

Оно включает в себя одноканальный предусилитель с переключением между чистым звуком и перегрузом, аналоговые симуляторы усилителя мощности и акустической системы (кабинета), пороговый шумоподавитель, а также цифровой модуль, обеспечивающий целых сто вариантов стереофонических эффектов постобработки.

Читать далее

Как я перестал слушать «Unknown Artist — Track 01» и написал свой распознаватель музыки

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели22K

12 000 MP3 без тегов, 15 лет прокрастинации, один выходной на код. Асинхронный распознаватель на Python + Shazam: как обойти rate limiting, починить кривые кодировки и не съесть всю память. Код открыт.

Читать далее

Пиано. Ноты жестко заданы а время — нет. На Rust

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели8.9K

Что это такое?
Это играть музыку.
Одним пальцем ноту!
Левая кнопка мышка играет.
НО...
Я не могу играть музыку!!! Не знаю ноты!
И я сделал что ноты уже есть. Они жестко заданы!
А вот время - НЕТ!!!!!
Если не время не указывать то ничего не происходит!
Надо указывать! Левая кнопка мышка! Нажать одну ноту. Потом отпустить! Затем вторую. Нажать. Потом отпустить. И так далее. ТЫ это делаешь - время нот!
А какую именно ноту - это не ты делаешь а программа.
Вот.
Плохо рассказываю.
Ну так инсульт.
Я сделал это 18 песен!

Вот такой файл. Я сделал еще ДО инсульта. Давно, двадцать лет! И конечно это asm! "Программы для Windows я пишу на языке Flat Assembler. Выбор именно этой среды разработки совсем необычен, но так уж сложилось." А ПОСЛЕ инсульта я сделал его на Rust! Как? Узнаете )

Читать далее

Работа с аудио в Android: опыт реализации DAF — техники терапии заикания

Время на прочтение7 мин
Охват и читатели9.6K

Небольшие заметки о работе с аудио в Android: получение минимальной задержки, работа с аудио сэмплами напрямую, запись аудиоданных с сжатом виде.

Возможно для кого-то это окажется полезным.

Читать далее

Сладость пения: сирены

Время на прочтение7 мин
Охват и читатели9.8K

С точки зрения Древней Греции, это «привлекательные существа, в верхней своей части, выглядящие как женщины, а снизу, как птицы. Они обладали невероятно сладкоголосым голосом, благодаря которому, пение сирен завораживало и увлекало несчастных мореплавателей на погибель» — где-то примерно так надо было бы начать наш рассказ, если бы мы захотели вспомнить ещё раз мифы. Но... Мы то расскажем не про это! :-)

Читать далее

Ламповый гитарный комбоусилитель из советских деталей

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели17K

Привет, Хабр! Мне подарили новогоднюю птичку в шапочке, а ещё посчастливилось приобрести очень интересное изделие неизвестного мастера, собранное по схеме легендарного VOX AC-4.

В этот уютный январский день мы сможем рассмотреть и послушать его во всех подробностях, а заодно открыть для себя страницы истории великого бренда гитарной аппаратуры.

Читать далее

Ближайшие события

Шашечки или ехать: насколько плох Epiphone Les Paul Special, и как сделать его лучше?

Уровень сложностиПростой
Время на прочтение10 мин
Охват и читатели16K

Привет, Хабр! Многие гитаристы мечтают получить в подарок на зимние праздники настоящий Лес Пол. На фото как раз такой, полноправно носящий на пере грифа золотое факсимиле автографа изобретателя этой культовой модели электрогитары — виртуозного Лестера Уильяма Полсфусса.

Но это не американский Гибсон, а китайский Эпифон, причём из самой дешёвой линейки Special. В этот праздничный январский день мы сможем подробно рассмотреть и услышать все достоинства и недостатки данного ширпотребовского изделия, а также изучим возможности его усовершенствования.

Читать далее

Статистика MIDI.ru

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели14K

Когда-то сайт MIDI.ru собрал целое сообщество авторов.

Под конец своего существования сайт содержал около 60 тыс. композиций в разных жанрах и их обсуждения с оценками.

Читать далее

Голос и микроконтроллер ESP32

Уровень сложностиСредний
Время на прочтение7 мин
Охват и читатели26K

Картинка: freepik.com - vecstock

При построении разнообразных автоматизированных систем часто возникает потребность, чтобы эта система предоставляла какую-то обратную связь. 

В этой связи большинство идут самым простым путём: мигающие лампочки, светодиоды, мониторы разных мастей с выведением на них текстовой/графической информации…

Однако есть одна очень интересная тема, которую почему-то незаслуженно самодельщики обходят стороной — речь о микроконтроллерах!

Потому что, согласитесь, «мигание лампочек» — это, конечно, прекрасно и даже в некотором роде волшебно (особенно когда это происходит в первый раз в жизни и твоя программа наконец начинает работать :-) ). Но куда веселее, когда машина отвечает тебе голосом! :-) 

Поэтому посмотрим, какие здесь возможности имеются... 

Читать далее

ML-аналитика, какие проблемы решает, инструменты, зачем выделять ресурсы

Уровень сложностиСредний
Время на прочтение6 мин
Охват и читатели6.3K

Привет, Хабр! Меня зовут Игорь Миленький, я руководитель отдела ML-аналитики в музыкальном сервисе Звук. Расскажу об еще одной профессии в Data Science, ML-аналитике, и покажу на практике, как устроена работа команды в Звуке. В статье хотел бы дать общее представление о профессии ML-аналитика и примерах задач.

Читать далее

Глушение нежелательных шумов в помещении, с помощью метаматериалов, на базе резонатора Гельмгольца

Время на прочтение8 мин
Охват и читатели16K

John Heisz - Speakers and Audio Projects

Борьба с шумом окружающей среды является весьма важным фактором личного комфорта проживания в условиях современного мира. Особенно это важно для профессий с потребностью в высокой мыслительной активности, так как шум может не позволить достичь высоких результатов. 

В прошлой статье мы рассмотрели 2 основных варианта такой борьбы: экстенсивный и интенсивный. Но, на самом деле, способы глушения нежелательных звуков не ограничиваются только рассмотренными и существует еще, как минимум, один вариант — использование «звукопоглощающих метаматериалов»… 

Читать далее

От голосовых к тексту: делаем Telegram-бота для расшифровки аудио на open source модели от СБЕР — GigaAM-v3

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели8.2K

Привет, Хабр! Недавно Сбер выкатил новые модели распознавания речи, и мне захотелось проверить их не в абстрактном демо, а в реальном сценарии. В этой статье я расскажу о практическом кейсе – разработке Telegram-бота, который преобразует голосовые сообщения в текст. Посмотрим, на что способна новая отечественная модель GigaAM-v3, и соберём на её основе расширяемого Telegram-бота.

▁ ▂ ▃ ▅ ▃ ▂ ▁ ▂ ▃ ▅ ▆ ▅ ▃ ▂ ▁

Электрогитара с семью «вкусными» звучаниями, доступными моментально

Уровень сложностиПростой
Время на прочтение9 мин
Охват и читатели17K

Привет, Хабр! Я продолжаю совершенствовать любимые электрогитары, и сегодня подробно расскажу о текущих доработках одной из них — дизайнерского суперстрата Tinar GT500.

Речь пойдёт о выборе доступных недорогих звукоснимателей, их правильной фазировке и маленьких секретах темброблока, способных весьма расширить исполнительские возможности инструмента.

Читать далее
1
23 ...

Вклад авторов