Все потоки

Звук

Это «ж-ж-ж» неспроста

133,15

Рейтинг

СтатьиПостыНовостиАвторыКомпании

Oksana_Nedvigina 6 часов назад

Apple Computer vs. Apple Records: 30-летняя война за «яблоко»

Простой

6 мин

5.7K

Блог компании Online patentПатентование * БрендингЗаконодательство в ITЗвук

Ретроспектива

Apple против Apple — это почти тридцатилетняя история о том, как один и тот же знак (точнее, очень похожий) в разных классах и на разных рынках превращается в минное поле, если технология начинает «сшивать» эти рынки воедино. По ходу спора юристы пытались удержать в договорных формулировках то, чего в момент подписания договоров еще просто не существовало технологически.

Читать далее

+8

SLY_G 21 час назад

Беззвучная частота, из-за которой старые здания кажутся населёнными призраками

Простой

8 мин

12K

Научно-популярноеЗвукЗдоровьеФизика

Перевод

Исследование, опубликованное в журнале Frontiers in Behavioral Neuroscience, является одним из первых контролируемых экспериментов на людях, в котором подтверждённое воздействие инфразвука сопоставляется как с психологическими самоотчётами, так и с конкретным физиологическим маркером — уровнем кортизола в слюне, гормона, который мы ассоциируем со стрессом. Результаты получились, можно сказать, тревожными.

Инфразвук — это звуковые волны с частотой ниже примерно 20 Гц, что соответствует нижней границе диапазона, улавливаемого человеческим ухом в обычных условиях. Он возникает в результате штормов, вулканической активности, тектонических толчков в недрах земной коры и, что самое важное, в результате обыденного механического «сердцебиения» городов: стареющих труб, систем отопления, вентиляции и кондиционирования, дорожного движения, промышленного оборудования. «Инфразвук повсеместно присутствует в повседневной среде, возникая вблизи вентиляционных систем, дорожного движения и промышленного оборудования», — говорит Родни Шмальц, старший автор и профессор Университета Макьюэна. В большинстве случаев мы проходим сквозь него, не замечая. Вопрос, на который команда хотела ответить, заключался в том, действительно ли попадание в зону его действия оказывает на нас какое-то воздействие, регистрируется ли эта частота где-то ниже уровня сознания, в той области, которую мы не можем легко определить.

Читать далее

+10

DmitrySushkov 22 часа назад

Linux диванного гитариста

Простой

12 мин

13K

Linux * Звук

Обзор

Из песочницы

С 12 лет я связал свою жизнь с гитарой. Примерно тогда же и познакомился с компьютером — самодельным клоном ZX Spectrum, которые собирал мой дядя в 80-х. Это во многом предопределило дальнейшие события и процессы, сформировавшие меня. Как и все, в юности я мечтал стать звездой, играть на гитаре, ездить на гастроли... 90-е годы, однако, внесли свои коррективы и мечта вылилась в ремесло — я стал гитарным мастером, чем занимаюсь и по сей день.

Читать далее

+38

shiru8bit 3 мая в 13:01

Трекеры и чиптюн на AdLib

Простой

22 мин

16K

Блог компании RUVDS.comСтарое железоЗвукИстория ITДемосцена *

Ретроспектива

Обычно, когда говорят про чиптюн, вспоминают звуковой чип SID на Commodore 64, или же Амигу и её MOD-файлы. Если речь про ПК, это будет тот же MOD и его наследники в лице форматов XM и IT. Но в истории программ для MS-DOS был один краткий музыкальный период совершенно другого рода. Он одновременно родственен и самому ПК, и чиптюну на 8-битках, и компьютерам практически с другой планеты, многочисленным японским ПК — небольшая, малоизвестная, замкнутая на саму себя и параллельная всему и вся вселенная.

Речь пойдёт про AdLib-совместимые звуковые карты, их историю и наследие, устройство местного звукового синтезатора, разные подходы к созданию музыки с его помощью, и про программы-трекеры для создания таковой музыки.

Читать далее

+47

Razumdom 2 мая в 08:54

Голос для станка: как добавить интеллектуальное звуковое оповещение

Средний

11 мин

9.6K

ЗвукИнженерные системы * Интернет вещейПроизводство и разработка электроники * Умный дом

Обзор

Для комфортной и безопасной жизни в современном обществе требуется автоматизация. Это самая автоматизация нужна, чтобы выполнять рутинную монотонную работу, исключить человеческий фактор, обезопасить другое оборудование и сделать комфортные условия для людей, животных, растений или техники.

Когда собирают систему автоматизации думают о том, как измерить, как управлять и как регулировать какой-то параметр. Для индикации значения параметров часто используют индикаторные лампочки, дисплеи и сообщения на телефон. На все эти индикаторы нужно обратить внимание, посмотреть на индикатор или дисплей. Но если это аварийный параметр или нужно сообщить сразу нескольким людям, тогда нужен другой более оперативный способ индикации. Один из способов, это как в фильмах ужасов, выключить основной свет и включить красные фонари, ещё и мигающие. На этот световой эффект точно все обратят внимание. Но есть способ лучше и менее тревожный – это звуковое оповещение. Чем бы не занимался персонал и как часто не смотрел на дисплеи, звуковое оповещение точно донесет оперативную информацию. Если аудио оповещение сделано правильно, то не услышать его может только глухой. Когда собирают систему автоматизации не всегда задумываются об функции аудио оповещения. Сообщать можно не только об аварийных ситуациях, но и об текущих процессах, например, переключение режима работы технологического процесса.

Какие устройства оповещения можно применить для этих задач? Один из элементов автоматизации, позволяющий озвучить необходимые процессы — это модуль аудио оповещения DAO2ERA.

Читать далее

+5

sokolovps 2 мая в 06:47

Краткая история биометрии: как появилось распознавание по голосу

Простой

4 мин

10K

Блог компании Online patentЗвукПатентование * Информационная безопасность * Машинное обучение *

Ретроспектива

Мы продолжаем рассказывать про краткую историю биометрии. И нам осталось рассказать о распознавании голоса человека.

Историю биометрии голоса обычно начинают с мейнфрейма AUDREY (Automatic Digit Recognizer), созданного в 1952 году в Bell Labs). Голоса разных людей он еще не распознавал, но уже их слышал, что по тем временам казалось чудом. Это устройство для «слышания» номеров, как писали в СМИ и рассказывали о ТВ, может избавить от необходимости набирать номер, но оно работает только при четком произношении цифр номера одну за другой.

Читать далее

+10

matt_motik 28 апр в 11:15

Linux как гитарная рабочая станция

Простой

7 мин

7.9K

*nix * СофтЗвук

Кейс

Из песочницы

В далёком 2001 году я впервые увидел Linux и понял, что это моё. Шли годы, менялись дистрибутивы и мои требования к ним, но вот недавно я решил закрыть гештальт и научиться играть на электрогитаре.

Покопавшись в интернете, наткнулся на кучу обзоров гитарных процессоров, комбиков и программ-эмуляций. Как это часто бывает, крутые коммерческие продукты есть под Windows и Mac, а вот про Linux как-то снова забыли.

В принципе, это нормально — иметь две системы под разные нужды. Но иногда очень не хочется перезагружаться, и я решил попробовать настроить свой Manjaro под работу со звуком. Мои первые эксперименты с JACK во времена 4 рубля за мегабайт закончились неудачей, а вот сейчас и знаний, и терпения хватило.

Моя система: Manjaro Linux, KDE, Wayland. Аудиоинтерфейс Motu M2.

Читать далее

+6

PhonkX 28 апр в 07:29

Ору по ночам, а соседи стучат (не) в такт, или немного про экстрим-вокал

Простой

13 мин

5.8K

Блог компании КонтурЧитальный залЗвукПрограммирование *

Мнение

Привет, Хабр! Я Стас, инженер-программист в Контуре. И это большая статья про экстрим-вокал. 😎🎸 Разбираю, что это такое, какие бывают техники, каким был мой путь туда, что за горе-преподаватели существуют и как увлечение экстрим-вокалом влияет на мою работу в IT (и наоборот: как айти помогает мне в моём увлечении).

Читать далее

+2

Ferraro 25 апр в 17:25

Как я добавил llama.cpp бэкенд в CosyVoice3 и ускорил инференс в 2.6x

Средний

3 мин

11K

Машинное обучение * ЗвукOpen source *

Туториал

Из песочницы

CosyVoice3 — одна из лучших open source TTS моделей, но LLM-часть на PyTorch работает медленно. Я добавил llama-cpp-python бэкенд с GGUF квантизацией — RTF упал с 1.17 до 0.45, ускорение 2.6x на T4. Установка одной командой, никакого Docker.

Читать далее

+9

Lunathecat 23 апр в 09:01

Редкий китайский суперстрат Vorson TS-K-6

Простой

7 мин

15K

Блог компании RUVDS.comЗвукСтарое железоЧитальный залНаучно-популярное

Обзор

Привет, Хабр! Мне принесли на доработку очередной инструмент из Поднебесной, оформленный в узнаваемом стиле Ibanez JEM — подписной электрогитары Стива Вая. Не одобряю воровство дизайнов, просто констатирую очевидный факт.

Изделие оказалось весьма красивым и достаточно качественным, но для достижения приемлемой играбельности потребовался некоторый объём работ, что неудивительно для недорогих инструментов.

На самом деле, в стоимость продукции более престижных конкурентов, кроме всего прочего, включена предпродажная подготовка у дилера, которую может потребоваться повторить, и не раз, учитывая реакцию древесины на климатические условия и их изменения.

Читать далее

+52

shiru8bit 21 апр в 13:01

Голоса в компьютере: поющие сидя

Простой

17 мин

13K

Блог компании RUVDS.comИстория ITЗвукИгры и игровые консолиСтарое железо

Ретроспектива

Первая часть цикла описывала историю появления в компьютерных играх человеческой речи, различные технологии её реализации: синтез, запись и воспроизведение. Во второй части я рассказал о том, как простые голосовые вставки эволюционировали в примитивные вокальные партии в игровой музыке, совмещающие фрагменты человеческого голоса и синтетическое музыкальное сопровождение.

С приходом эпохи мультимедиа всё стало значительно проще: появилась возможность воспроизводить любой звук высочайшего качества с компакт-диска с большой продолжительностью, в том числе и песни. Это время тоже представляет интерес, если не технологический, то художественный и ностальгический. Об этом и пойдёт речь в третьей, завершающей части цикла: вспомним лучшие оригинальные песни в играх 1990-х годов и немного заглянем в 2000-е.

Читать далее

+52

timonin 21 апр в 10:04

— Мам, купи Suno. — У нас есть Suno дома! ACE‑Step XL 4B — русскоязычная музыкальная студия с открытым исходным кодом

Простой

12 мин

15K

Open source * ЗвукИскусственный интеллектМашинное обучение *

Обзор

Всем привет! Музыку я люблю всю жизнь. Сам всегда хотел научиться играть на каком‑нибудь инструменте — пробовал гитару, клавиши, даже барабаны — освоил в итоге только варган. Зато с генерацией музыки нейросетями дело у меня пошло сразу. Написал в своё время один из первых на русском гайдов по Udio, недавно собрал платформу для лайвкодинга музыки с ИИ‑агентом. За опенсорсом в этой теме тоже слежу — щупаю каждый раз как что‑то новое появляется. Но после Suno слушать их обычно невозможно. Уровень «ну ок, оно звуки издаёт, и это тоже достижение».

В конце марта, когда на одном из моих стримов мы смотрели обзоры на свежую тогда ACE‑Step 1.5 — опенсорсную модель от команды StepFun. Посмотрели примеры, послушали что люди нагенерировали — и я решил что это хрень не достойная внимания. Вокал мычит, куплет примерно похож на куплет, по качеству — где‑то уровень Suno v3.5, то есть позапрошлогодний Suno. Даже скачивать не стал. Подумал: ну опенсорс и опенсорс, подождём когда научится.

И оно научилось! Уже через пару недель ACE‑Step выкатили версию XL.

Читать далее

+53

mgaev 20 апр в 13:42

Разбор рынка HATS: почему «бинауральные головы» стоят как подержанная машина

Сложный

9 мин

7.3K

AR и VRЗвукDIY или Сделай сам

Аналитика

Если вы хоть раз гуглили бинауральную запись, то натыкались на странную вещь:
искусственная голова с микрофонами стоит — от нескольких тысяч до миллионов рублей.

И это довольно быстро вызывает диссонанс.

С одной стороны — идея выглядит почти тривиально:
два микрофона, размещённые в «ушах».

С другой — ценник, как у сложного лабораторного оборудования.

Интуитивно ожидаешь уровень «два хороших микрофона».
На практике — подержанная машина.

Рынок HATS — один из немногих в аудиоиндустрии, где цены растут быстрее, чем меняются технологии.

Отсюда возникает простой вопрос:

что это вообще за рынок и за что там платят?

Я как раз разбирался в этом, пока делал свою «Голову Бинго»,
и заодно разложил по полочкам:

— из чего складывается цена
— почему разброс такой большой
— и почему между «игрушкой» и «лабораторией» почти ничего нет

Читать далее

0

intdif 18 апр в 23:32

Гармония чисел: как математика настроила музыку

Простой

5 мин

13K

Математика * Научно-популярноеЗвукЧитальный зал

Аналитика

Введение: Звучащие кувалды

Представьте, что вы часто ходите мимо кузницы. Кузнецы бьют молотами по наковальне, и вдруг вы замечаете странную вещь: одни молоты звучат вместе красиво, слитно, а другие — противно, вразнобой. Так, согласно легенде, Пифагор пришёл к открытию, которое положило начало теории музыки . Он принёс молоты в лабораторию и взвесил их. Оказалось, что веса молотов, дающих красивое сочетание (консонанс), соотносятся как простые числа 2:1, 3:2 и 4:3 . Так родилась главная идея западной музыки: «Красивое звучание — это простое математическое отношение».

Связь музыки и математики оказалась на удивление прочной. На протяжении всей истории она вдохновляла не только теоретиков, но и практиков. Чешский математик Эразм Горицкий применял геометрию для деления музыкальных интервалов. Иоганн Себастьян Бах своей музыкой и самим названием сборника «Хорошо темперированный клавир» закрепил победу нового строя. А в XX веке композитор и архитектор Янис Ксенакис переносил в музыку теорию множеств и случайных процессов. Даже великий оперный певец Джером Хайнс публиковал математические работы.

Исследования в этой области продолжаются и сегодня, в том числе в России. Например, современные российские исследователи разрабатывают комплексные математические модели музыки, используя теорию множеств, теорию вероятностей и теорию групп для анализа и моделирования музыкального творчества.

Проследим эту историю шаг за шагом и посмотрим, как математика постепенно формировала то, что мы сегодня называем музыкальной гармонией.

Читать далее

+16

Lunathecat 15 апр в 09:01

Собираем стратокастер из деталей с Aliexpress

Простой

8 мин

21K

Блог компании RUVDS.comDIY или Сделай самЗвукЧитальный залНаучно-популярное

Туториал

Привет, Хабр! Знакомый энтузиаст приобрёл гору китайских комплектующих для электрогитары и попросил у меня помощи с её сборкой, так как детали имели некоторые особенности и не совсем подходили друг к другу.

Увлекательный процесс работы и получившийся музыкальный инструмент теперь можно рассмотреть, послушать и оценить.

Фото с уютным котиком и многое другое

+71

maybe_elf 14 апр в 09:57

Почему реагирующие на звук светодиодные ленты невероятно сложны в использовании

Средний

10 мин

13K

ЗвукЭлектроника для начинающихDIY или Сделай сам

Перевод

Инженер-программист и робототехник Скотт Лоусон рассказал о своём проекте светодиодных лент, которые реагируют на музыку, учитывая паттерны человеческого зрительного восприятия.

Читать далее

+12

SlavikF 13 апр в 02:06

llama.cpp теперь умеет работать с речью

Средний

3 мин

12K

Искусственный интеллектЗвук

Обзор

Сегодня (12 апреля) в проект llama.cpp залили PR, который добавляет новый функционал - работа с audio.

Речь идёт о поддержке моделей Gemma4, которые умеют распознавать речь:

https://huggingface.co/google/gemma-4-E4B-it

Читать далее

+19

AlexHanguery 12 апр в 19:23

Suno 5.5: почти ваш голос и мелодия

Средний

8 мин

9.8K

Искусственный интеллектЗвукБудущее здесь

Мнение

Вопрос генерации со своим голосом занимал меня с v3.5. Другая интересная тема — аранжировка. Если не в обычном виде (на входе стиль и аккорды, на выходе “минус”), то способом обновления, “раскраски” черновика (mp3 из GM MIDI, Audio Upload, режим Cover). За пару лет я сделал много тестов, результаты представлял на Хабре, своём сайте, в Телеграм-канале. Последнее обновление Suno — повод снова вернуться к этим вопросам.

Свой голос

Как только версия 5.5 стала доступна, приступил к тестам опции “Your Voice” ¹⁾, опираясь на опыт с Suno v3.5 и RVC. Собрал 11 DS (голосовых наборов) на своём материале. Задача — проверить, как реагирует система на разный исходный материал, стили и параметры генерации.

¹⁾Ссылка на процедуру “Your Voice” (PDF на русском) из раздела Help на сайте Suno.

Уже не раз касался понятий тембр и манера с психоакустической точки зрения. Нынче повод вернуться к теме: можно говорить похоже или нет, но чтобы контролировать, надо понимать механику.

Для синтеза вокала Suno (или другому ИИ) нужно обеспечить 3 компонента:

Тембр, или «окраска» звука, зависит от “геометрии” голосового аппарата: трахея, гортань, связки, резонаторы.(Певцы, артисты могут в определённой степени его менять. У родственников голоса часто похожи — физиология).

Интонация — изменения высоты (мелодия) + нюансы: вибрато, опевания, “подъезды” (Pitch curve).

Артикуляция — работа языка, нёба, челюсти, губ, обеспечивающая произнесение/ пропевание слов.

Именно разделение на 3 компонента придаёт гибкость системе: берём модель тембра, добавляем интонирование в нужной манере и соответствующую языку артикуляцию. Хотите на хинди? Пожалуйста!

Читать далее

0

Mamayzo 12 апр в 07:16

AGC или как перестать подстраивать громкость вручную

Простой

7 мин

7.9K

Алгоритмы * Linux * ЗвукC++ *

Туториал

Из песочницы

Многие наверняка сталкивались с проблемой: смотришь по ТВ спокойный фильм, который прерывается резкой и громкой рекламой; или, например, при общении по ВКС всех собеседников слышно нормально, но у кого-нибудь одного микрофон будет шуметь так, будто он в данный момент находится рядом с двигателем самолета, готовящегося взлетать. Конечно, всегда можно подрегулировать громкость динамиков, но всегда ли это удобно и возможно?

Читать далее

+2

nlaik 11 апр в 22:18

Промпты для Suno AI: как писать запросы, чтобы нейросеть генерировала нормальную музыку, а не кашу

Простой

4 мин

16K

Искусственный интеллектЗвук

Туториал

Suno генерирует музыку по текстовому описанию, но без правильной разметки результат — каша. Разобрал систему промптов: метатеги [Verse], [Chorus], [Drop], музыкальные термины для поля Style, рабочие комбинации жанров и то, чего Suno не умеет и не стоит ждать. Готовые шаблоны для копипасты внутри.

Читать далее

+11

1

2 3 ...