Обновить
135.69

Звук

Это «ж-ж-ж» неспроста

Сначала показывать
Порог рейтинга
Уровень сложности

Голоса в компьютере: игры начинают петь

Уровень сложностиПростой
Время на прочтение19 мин
Охват и читатели9.7K

Продолжаем вспоминать технологические чудеса в области звука в компьютерных играх — обыденные ныне вещи, первая встреча с которыми в нашей жизни некогда поразила воображение тем, что такое в принципе возможно.

В прошлый раз я рассказал историю появления речи в играх, когда молчаливый прежде компьютер вдруг заговорил человеческим голосом. Чем же ещё он мог бы удивить после такого финта? Есть чем! Ведь круче разговаривающего компьютера может быть только компьютер поющий.

Читать далее

Новости

Модернизация винилового проигрывателя Вега 323 Стерео

Уровень сложностиПростой
Время на прочтение11 мин
Охват и читатели22K

Наверно большинство людей любят слушать хорошую музыку. А радиолюбители электронщики умеют ещё делать эту музыку качественной, и я в том числе. Поэтому, кроме основной работы по разработке устройств по автоматизации я иногда берусь за восстановление и модернизацию старых устройств.

Один мой знакомый нашел виниловые пластинки и очень захотел их послушать. Конечно лучший вариант, это пойти в магазин и купить проигрыватель виниловых пластинок. Выбор сейчас есть, хоть и не большой, но стоят они тоже не мало. Но он где-то в кладовке откопал старый советский проигрыватель виниловых пластинок Вега 323 Стерео. Принёс его мне и попросил его починить.

При первом включении проигрыватель даже подал признаки жизни. Засветились лампочки, зашипел радиоприемник и появились звуки, правда только в одном канале. Вариант разобрать его и сдать в металлолом сразу отпал, стало жалко. Осталось два варианта, отремонтировать его или переделать. Для советского времени вид был футуристический, да и сейчас он выглядит не плохо. Осталось его только помыть.

Читать далее

Laurent Voice – система звукового оповещения событий для многофункциональных сетевых контроллеров Laurent

Уровень сложностиСредний
Время на прочтение15 мин
Охват и читатели7.1K

Laurent Voice Box - сетевой контроллер для управления и мониторинга с музыкально-речевым озвучиванием событий.

Читать далее

Антикварная бас-гитара Jolana Iris из ЧССР, часть 1: первое знакомство

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели13K

Привет, Хабр! В советские времена Fender, Gibson и другие престижные электрогитары из капиталистических стран, за редкими исключениями, были доступны только самым звёздным музыкантам, выступавшим по телерадиовещанию, выпускавшим пластинки на «Мелодии» и ездившим на всесоюзные гастроли.

Тоники, Уралы, Форманты и прочие советские инструменты часто встречались в магазинах культтоваров, но значительно уступали конкурентам из дальнего зарубежья, несмотря на солидные цены. Попадались и болгарские Орфеи с теми же самыми недостатками.

Зато в ГДР производились электрогитары Musima, а в Чехословакии — Jolana, и это были приличные инструменты, которые рядовой любитель музыки вполне мог приобрести, если действительно поставил перед собой такую цель.

Котик присутствует на многих фото.

«Медовый» овердрайв для романтичного блюза и не только

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели11K

Привет, Хабр! Сегодня мы сможем рассмотреть и послушать созданную неизвестным умельцем кастомную педаль гитарного эффекта перегруза.

Она собрана по весьма оригинальной схеме Honey Bee Overdrive и обладает значительно более широким спектром возможностей, чем большинство привычных нам классических вариантов.

Читать далее

Как я написал ASR-движок на Rust: от разочарования в одной модели до мульти-модельной архитектуры

Уровень сложностиСложный
Время на прочтение11 мин
Охват и читатели7.7K

Привет, Хабр! В предыдущей статье я рассказывал, как портировал модель синтеза речи Qwen3-TTS на Rust. Тот проект (RustTTS) получился достаточно успешным — один бинарник, мгновенный старт, никаких Python-зависимостей.

Естественным продолжением стала обратная задача — распознавание речи (ASR, Automatic Speech Recognition). Логика казалась простой: у Qwen есть и TTS и ASR, архитектуры похожи, опыт с Candle уже есть, значит справимся за пару недель. Ну... не совсем.

Читать далее

Обзор лучших API для распознавания речи 2026

Уровень сложностиПростой
Время на прочтение6 мин
Охват и читатели9.3K

Всем снова привет! В прошлом году мы сравнивали решения для транскрибации речи, и с тех пор многое изменилось. Большинство провайдеров выпустили новые модели, много у кого появились новые фичи, и я решил обновить статью. Если вы - бизнес и вам нужен надежный API, или если вы просто энтузиаст, и вам интересно подобрать решение для себя, добро пожаловать!

Читать далее

Голоса в компьютере: человеческая речь в играх

Уровень сложностиПростой
Время на прочтение17 мин
Охват и читатели12K

Думаю, одним из самых ярких впечатлений у тех, кто застал действительно старые компьютеры и игровые приставки, стала впервые услышанная реалистичная речь в компьютерной игре. На фоне весьма условных звуковых эффектов и довольно примитивно звучащей синтетической музыки это казалось невероятным чудом: компьютер разговаривает человеческим голосом.

Похожие впечатления в те времена вызывали и говорящие электронные игрушки, телефоны, часы, и прочая подобная техника — несмотря на столетие существования звукозаписи, речь, доносящаяся из электронного устройства, была способна удивить.

Сегодня покопаемся в истории появления голоса в электронных игрушках и компьютерных играх: когда он впервые появился, какие исторические примеры отразились в поп-культуре, и какие технологии для этого использовались.

Читать далее

Пишем свой voice-to-text на Python: 4 бэкенда и батч-обработка голосовых

Время на прочтение6 мин
Охват и читатели11K

От голосовых на 5 минут к тексту за 30 секунд: инструмент для батч-расшифровки голосовых: от локального Whisper до бесплатного Groq API, с автоопределением форматов и CLI

Читать далее

История Marantz: как Сол Маранц создал фирму, ставшую легендой аудиотехники

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели13K

Примерно в 1948 году Маранц начал собирать свой первый аудиоагрегат. Работа над ним продлилась несколько лет. В результате был создан предусилитель Audio Consolette. Разработанное Маранц показал своему приятелю, который был селлером в профильном магазине на Манхэттене. Тот договорился, что сможет продать придуманное, но только в том случае, если изобретатель создаст минимум 100 таких же гаджетов. Увидев, что изобретение пользуется спросом, в начале 50-х Маранц создает свою фирму.

Читать далее

Whisper больше не нужен? Обзор VibeVoice ASR от Microsoft — часовая транскрипция, диаризация, hotwords и портативка

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели13K

Всем привет! Команда Microsoft Research выложила в открытый доступ VibeVoice-ASR — нейросетевую модель для распознавания речи с диаризацией (разделением) спикеров. Сегодня хочу рассказать об этой технологии подробнее и поделиться портативной версией.

Читать далее

«Мой первый Король и Шут» — (не)детская звуковая книжка

Уровень сложностиПростой
Время на прочтение19 мин
Охват и читатели14K

Вот уже почти год как мы живём втроём. Маленькая дочка круто изменила мою жизнь, почти полностью вытеснив собой всё моё свободное время. Но я не сдаюсь и продолжаю заниматься ерундой. И вот в этот раз поводом стал день рождения дочери.

Вдохновение пришло случайно. Наши друзья подарили Алисе книжку с аудио — «Мой первый Вивальди». «Ах, как это мило», — сказал мой внутренний голос интонацией Эрика Картмана. А почему бы мне не сделать свою книжку с преферансом и куртизанками? Например, «Мой первый Король и Шут». Получилось не совсем для детей, но я надеюсь, что придёт день и дочь её оценит.

Будь как дома, путник...

Ригонда 2.0: как я Алису на радиоле женил, или Две причины вскрыть советский музыкальный центр

Уровень сложностиПростой
Время на прочтение5 мин
Охват и читатели16K

Купил отреставрированную советскую радиолу — чтобы… наконец-то обзавестись умным домом. Реставраторы встроили туда Алису и «гитарный вход».

Но Алиса молчала, пока радиола выключена, а «гитарный» вход оказался 3,5 мм — под наушники.

Пришлось брать паяльник, вскрывать корпус, искать донора для динамика… И в итоге получил то, что хотел: Алиса говорит, гитара звучит — как положено. Подробности читайте в статье.

Читать далее

Ближайшие события

Почему музыка ИИ человеческая и новая без нового?

Уровень сложностиСредний
Время на прочтение10 мин
Охват и читатели8.4K

Революция свершилась: для большинства музыка, созданная ИИ, уже неотличима от "живой". ИИ-артисты подписывают контракты, NARAS (организаторы "Грэмми") не против использования ИИ, а лидеры рынка — Suno/Udio — играют по правилам больших дядей. Наверное, можно закончить споры, но нет: одни настаивают на "отсутствии души", другие — на ложном векторе развития музыкального ИИ. Мне кажется, есть способ прояснить ситуацию, обратившись к самой природе музыки.

Читать далее

Самый доступный из настоящих Телекастеров

Уровень сложностиПростой
Время на прочтение8 мин
Охват и читатели14K

Привет, Хабр! Мне принесли на отстройку электрогитару Squier FSR Bullet Telecaster цвета Olympic White, и теперь мы сможем рассмотреть и послушать эту популярную модель во всех подробностях.

Конкуренция на рынке музыкальных инструментов сегодня весьма значительна, и для принятия решения о приобретении того или иного варианта хочется знать о нём и о возможных альтернативах как можно больше.

Видео с котиком тоже будет.

0 дБ – это не вакуум: как современный разум пытается отменить логарифмы

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели13K

Никогда и не думал, что мне предстоит написать статью не на техническую тему. Началось всё с того, что у нас в коллективе обсуждалась какая-то неинтересная для меня тема про самолёты. Один из новоиспечённых членов коллектива делился знаниями, какой самолёт громче какого, и сколько децибел звука они издают.

Читать далее

Чистим аудиокниги от шума нейросетями

Время на прочтение6 мин
Охват и читатели8.3K

Фоновая музыка, гул, шипение — классические фильтры с этим не справляются. Нейросети справляются, но падают на длинных файлах. Решение: чанкование + сохранение прогресса. Делюсь инструментом.

Читать далее

Levinson LS-300 — одна из самых дешёвых электрогитар

Уровень сложностиПростой
Время на прочтение7 мин
Охват и читатели15K

Привет, Хабр! Сегодня мы продолжим всестороннее рассмотрение и прослушивание наиболее популярных малобюджетных инструментов, представленных на рынке России и стран ближнего зарубежья.

Эта незатейливая гитара с фанерным корпусом может похвастаться стильным оформлением, и после устранения заводских недоработок вполне пригодна для исполнения и создания музыки, а также обучения этому чудесному искусству.

Что немаловажно для стратокастера начального уровня, здесь сразу предусмотрен хамбакер, чтобы можно было «пожужжать», а не только два сингла для «стеклянных» звучаний.

Фото с уютными котиками тоже будут.

Unicast, FEC и радио. Как мы научили умные колонки Sber включать радио в режиме Стереопары (и не только)

Время на прочтение10 мин
Охват и читатели7.9K

Салют, Хабр!

Я Дарья, занимаюсь разработкой на C++ в SberDevices. В прошлом году мы рассказывали на Хабре, как реализовали функции умных колонок Sber Мультирум и Стереопара. В Мультируме один и тот же трек играет на нескольких устройствах синхронно, а в Стереопаре два устройства, воспроизводя звук одновременно, делят его на левый и правый — каждое устройство проигрывает свой канал. 

Перед нами встала задача развивать колонки далее: добавить опцию радио в режимах Мультирума и Стереопары, дать пользователям возможность выводить на стереопару звук с умного телевизора Sber и подключаться к ней по bluetooth, чтобы воспроизводить звук со смартфона. Сегодня я расскажу о передаче аудиопотока по протоколу UDP и алгоритмах избыточного кодирования.

Читать далее

Как я написал TTS-движок на Rust за месяц: путь от Python к production-ready решению

Уровень сложностиСложный
Время на прочтение7 мин
Охват и читатели14K

Что будет, если выкинуть Python-обвязку и сделать TTS по-взрослому?

Я взял Qwen3-TTS и за месяц собрал RustTTS: компактный бинарник, быстрый старт, стриминг и контролируемый инференс без “venv на 2 ГБ”.

Покажу, как устроен пайплайн (text → tokens → audio), где реально узкие места, какие оптимизации дают эффект, и почему RTF на CPU может быть конкурентным, если не стрелять себе в ногу архитектурой.

Читать далее
1
23 ...