Как стать автором
Поиск
Написать публикацию
Обновить

А что, если записать звук на бумагу?

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров14K
Всего голосов 49: ↑46 и ↓3+67
Комментарии53

Комментарии 53

Вот, тоже хотел написать, что фонопэйпер забыли. Он ещё и в режиме озвучивания произвольных картинок работает, и забавные звуки при этом издаёт :)

Видимо, наиболее экономичным способом будет спектрограмма. Наверное, с логарифмической шкалой частоты. Если попытаться уместить это на лист, то можно заполнить его параллельными полосами, а в разделителях между полосами будет синхросигнал для привязки ко времени.

А есть еще это: https://habr.com/ru/articles/66004/

Заявлено, что на лист А4 можно 0.5Мб загнать.
Если использовать кодек Speex, 8кГц/16-бит, то битрейт закодированных данных будет 1000байт/с. Получается, что на страницу влезет 500с записи, т.е. больше 8 минут звука.

Заявлено, что на лист А4 можно 0.5Мб загнать.

Так на пачке бумаги целый фильм может уместится

почти дискета

Или же можно поступить ещё проще: загрузить звуковой трек в любой звуковой редактор, например, тот же самый Sound Forge и распечатать получившуюся синусоиду на бумаге (сделав принтскрин с экрана).

Во-первых, не синусоида, во-вторых только очень короткий фрагмент

https://www.youtube.com/watch?v=lfZ6XSRaRR8

Видео про спектрограмму, мы же про волну говорим:

НЛО прилетело и опубликовало эту надпись здесь

Или я отстал от науки или это моя интуиция говорит об обратном, что-то мне подсказывает, что наравне с софтом распознавания сканированного текста с преобразованием его в голосовую озвучку, существует софт для сканирования с распознаванием нот и преобразованием их в живое звучание. Таким образом вроде как само собой напрашивающееся решение.

можно в 2 этапа: сосканировать в midi, а потом midi превротить в mp3/wav. Сам таким занимался

Да-да, именно этот лист мне первым делом и вспомнился при прочтении статьи. Самое забавное, что я даже один раз с него загружался - не по нужде, а из любопытства - сканер был, если не ошибаюсь, ScanJet IIcx - и оно работало!

Это уже слишком, на картинке лишь рунетовский мем из 2002 года. Там справа-снизу © Vladimirovich, Штурман.

Несмотря на условно малый битрейт — звучание хорошее, за это стоит благодарить формат кодирования Opus

Ну, на этих битрейтах (~12 kbps)... я бы его сначала поблагодарил за свободность, а потом за качество среди свободных форматов. Чудеса творит его конкурент - xHE-AAC, но энкодер exhale ниже 64kbps не опускается и остаётся только проприетарный фраунгоферовский из EZ CD Audio Converter.

Довольно давно играюсь с Opus и все тесты, которые проводились, выставляют вперёд именно Opus, а не xHE-AAC. Если поделитесь ссылкой на тест, где xHE-AAC обгоняет Opus в качестве на низких битрейтах, буду благодарен.

Здесь есть сравнение и семплы: https://hydrogenaud.io/index.php/topic,120997.0.html

Если всё именно так: xHE-AAC, 12kbps, музыка, то странно. Я вообще не вижу случаев, где Opus звучал бы лучше. Ни там, ни у себя (Fraunhofer IIS xHE-AAC 4.4.0, libopus 1.5.2 и libopus 1.3 (потому что закрадываются мысли о регрессии нет, какая-то непонятная разница у меня не между разными версиями libopus, а между ffmpeg@libopus и opusenc).

Сконвертил с FLAC и прислушался. Да, теперь вижу, что xHE-AAC лучше Опуса на таких низких битрейтах, но очень жаль, так как xHE-AAC не свободный кодек.

Нашёл источник разницы (по крайней мере, один):
Note that libopus forces a wideband [8000 Hz] cutoff for bitrates < 15 kbps - ffmpeg docs

  • В opusenc (консольном приложении из набора Opus-tools) это ограничение почему-то не действует, спектр до 20 кГц.

  • Также:

    - в opusenc нет ФНЧ как опции

    - в ffmpeg при таком битрейте поведение меняют только -cutoff 4000 и -cutoff 6000, а -cutoff 12000, -cutoff 20000 и отсутствие опции работают как -cutoff 8000

    - настраивать для улучшения качества почти нечего (дальше названия настроек из ffmpeg): можно поднять -frame_duration до максимума (60), вручную задать -application (audio), на очень низких битрейтах избавиться от высоких частот (-cutoff N) и стерео (-ac 1).

Добавлю к вариантам забивания гвоздей микроскопом.

Как только увидел оптический датчик для ардуино, сразу пришла идея сделать тележку на ардуино с тремя датчиками, которая будет ездить по трассе и проигрывать мелодию. Два датчика будут удерживать тележку на дорожке а третий посредине считывать "музыкальную дорожку" и воспроизводить звук. То есть, не бумага будет двигаться, а воспроизводящее устройство по бумаге ! ))

На современном уровне электроники и полиграфии, это вообще не проблема.

Дальше-больше. Если поставить на тележку более мощный девайс с фотокамерой, то вместо "звуковой дорожки" для фотоэлемента, можно использовать штрихкоды или QR коды.

... а если, вместо тележки использовать квадрокоптер... ну вы поняли... )))

/s а если, вместо тележки использовать квадрокоптер, то можно писать кругами на полях )

О! Идея! На кромках поля можно высаживать растения со светлыми и тёмными листьями, и таким образом маркировать поля для сельхоздронов при обработке, скажем, пестицидами разного типа :)

Хммм...любопытственно! ;-)

Не звукозапись, но вспомнилось:

https://youtu.be/MejbOFk7H6c

НЛО прилетело и опубликовало эту надпись здесь

CD / DVD ? ))

Вот эту штуку надо апнуть оптическим датчиком: пластинка с тонармом (на чём лежит пластинка) - уже летают. Осталось летающую головку приспособить:-)

Тонарм – «рука», что держит головку звукоснимателя с иглой, а левитирует в данном случае опорный диск.

А вот бесконтактное считывание сигнала с пластинки можно попробовать «изобрести» с помощью какого-нибудь лидара или другого датчика глубины/формы поверхности дорожки, только разрешение нужно просто безумное 🤩

А вот бесконтактное считывание сигнала с пластинки можно попробовать «изобрести»

Уже есть: https://www.elpj.com/

Существует. Выпущен еще в прошлом веке, цена была адовая тогда и адовая сейчас.

https://www.hifiaudio-spb.ru/articles/lazernyy-vinil-vozvrashchaetsya/

И звучит так себе в сравнении с более обычными конструкциями.

"Его не смотрят слушают, его показывают!"

Есть которые считывают лазером, есть которые сканируют камерой высокого разрешения (даже пластинку крутить не надо)

Проигрыватель ELP corporation.

Конечно, лазерные, вот пример https://www.elpj.com/

Если для распознавания QR кода использовать камеру, то логичнее было бы использовать не черно-белое, а цветное изображение. Например, три кода можно совместить в один цветной CMYK.

Microsoft пушила лет 10-12 назад такую штуку, именно на CMYK - называлась High Capacity Color Barcode (HCCB).

Точнее, они пушили некое подмножество этой технологии (под брендом Microsoft Tag) - в их имплементации коды вели на собственный MS-ный сокращатель ссылок, и уже с него редиректились на целевой URL. По тем временам строго онлайновое решение не прокатило.

Саму технологию знаю давно, но только сейчас подумал: записывать на бумагу стерео способом, похожим на анаглиф, никто не пробовал?

Ничего не имею против симпатичных AI-изображений но, всё-таки, было бы лучше, если бы КДПВ была по теме статьи; тем более что в теле статьи таковые вполне имеются.

Кажется баркоды - самое очевидное решение и кажется самое эффективное, если делать бумажные кассеты с графическим распознованием

Можно взять какую-нибудь трекерную музыку и использовать их формат кодирования для рисования на бумаге. Будет очень похоже на барабанные jukebox.

Эта технология давно существует на кинопленках для кинотеатров, где рядом с изображением присутствует дорожка Dolby Digital.

Статю назвали неправильно. Назвать нужно было "Киберспасатель для бумажного завода"

Я-то думал в статье будет пример готового устройства, а тут ничего...

Можно по другому делать ( по следам бумажного) - например сделать 3-Д бумажную ленту, либо полностью, либо наклееный рельеф, можно также воспользоваться перфолентой необходимой ширины, вот вопрос лентопротяжного механизма намного сложнее и адекватного считывателя

вот вопрос лентопротяжного механизма намного сложнее и адекватного считывателя

Можно оставить камеру и коды, но двигать ленту или камеру рывками, чтобы камера почти всё время была неподвижна относительно ленты (нет смаза => можно поднять скорость протяга или плотность записи).

Механизмы поискать в древней литературе. Киноплёнку протягивали мальтийским крестом, кривошипно-коромысловым механизмом... модельки даже готовые есть:

https://www.thingiverse.com/thing:2944616

https://www.thingiverse.com/thing:5957938

https://ru.wikipedia.org/wiki/Скачковый_механизм

Или ещё проще - протягивать как раньше, но подсветку заменить на вспышку-стробоскоп. Подсветка работает только мгновение -> смаза нет (такую функцию давно запихивают в телевизоры и мониторы). Яркость, конечно, придётся увеличить. Но это не тру, с механизмами будет интереснее играться.

К чему эта блевотная AI картинка в начале статьи?

Интересно, насколько быстро интернет засорится этим вырвиглазом....

Интересно, с QR получилось прикольно. Но получается, что каждый лист несет один пакет звук условно. Интересно, на сколько возможно сделать «потоковый» QR код. Непрерывный. И допустим записывать его термопринтером на обычную чековую бумагу. Ну и затем считывать его, тем же кассовым оборудованием (чет мне кажется, что камера телефона/вебка для такой задачи и правда как микроскопом гвозди забивать)

А с термопринтером недостаток скорее в скорости записи. А вот скорость воспроизведения там может быть вполне себе хорошая и в тот же Opus можно будет записать несколько треков в вполне хорошем качестве на один рулон чековой бумаги.

Жаль только, что бумага эта деградирует быстро.

Если битовые поледовательности закодировать построчно получается подобие перфоленты.

Ну не знаю, первое что пришло в голову на середине статьи это штрих-код или QR, как видим QR уже кто-то придумал, но вообще штрих-код вроде как лучше подходит — только с плотностью записи проблема (хотя там можно в несколько рядов запись делать).

согдасно статье https://ru.wikipedia.org/wiki/Оптическая_звукозапись запись звука велась сминимальной скоростью 183 мм/сек. На виниловой пластинке минимальная линейная скорость у центра (деаметр 80мм) была 207 мм/сек при 33 оборота в минуту. Максимальный диаметр который можно получить из листа формата А4 210мм.

Если на лазерном принтере печатать спиральную звуковую дорожку с шириной 5 мм то примерная максимальная длительность трека будет 28 сек.

Есть такая детская игрушка - tiptoi называется. Штифт с камерой. Тыкаешь им в специальной книжке на какой-нибудь элемент картинки, например, на изображение коровы, и штифт начинает мычать, тыкаешь на утку - начинает крякать. Это, конечно, не про запись звука на бумагу, но про ссчитывние кодов с бумаги с помощью камеры, ибо корова состоит из одних кодов, утка - из других; и уже сам штифт решает для какого кода какой звуковой файл из тех, что на нём сохранены, воспроизводить. Но человесескому глазу эти кода не видны, он видет только корову и только утку. А ещё они производят глобусы: тыкаешь штифтом в Бразилию и он тебе говорит: "Бразилия". Хорошая обучалка для детей.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий