Pull to refresh

Comments 124

А если еще поместить бумагу в рулон и придать общий корпус, то получится неплохая кассета)
Вполне. Это, кстати, тоже один из вариантов использования PhonoPaper — когда движется не телефон с камерой, а бумага. Это может быть бумажная лента или круглая пластинка, на которой звуковой код расположен радиально
Не поймите меня не правильно, но это один из вариантов баловства. Я хочу сказать, что это представляет отличный академический интерес, но практическкий смысл в чтении при помощи телефона звука записанного на бумаге в виде волн, можно сказать отсутствует. Автор приводит примеры практического использования, но в том то и дело, что эти примеры либо баловство, либо притянуты за уши. Во всяком случае я пока не вижу истинно важных отраслей, где бы это имело смысл
PS Ничуть не умаляя заслуг автора, и креативности исполнения оригинальной идеи ;)
А теперь представьте, что вы работаете в разведке, вскрыли тайник агента вражеской разведки, а там — конверт с одним единственным листом бумаги.

Если в алгоритм кодирования добавить пару ключей, да еще настроить систему так, чтобы считывающее устройство могло считать послание только в определенное время, да в определенный день (эту инфу должен знать только тот, кому письмо предназначается)…
Не знаю как вам ответить, ибо пока не понял вы серьезно или шутите :)
Девушке так в люви можно признаться на рулоне бумаги — любая оценит, 100%! :)
ну скорее некий его гибрид с АНСом :)
И разматывать рулоны станет куда увлекательнее :)
Хм, туалетная бумага с музыкальным сопровождением. Разматываешь рулон, а тебе голосом воспроизводятся анекдоты. Или на каждом куске какая-нибудь полезная/бесполезная информация.
Можно в дамских магазинах так продавать записи Стаса Михайлова. В рулонах по 52 метра!
Кстати, меня долго интересовал вопрос, почему в рулоне туалетной бумаги 52 метра? Не 50 и не 55, а именно 52. Возможно кто-нибудь знает ответ?
Здорово! Не думали добавить что-то вроде насечек в маркеры, чтобы потом восстанавливать скорость воспроизведения? Или qr код рядом, чтобы считывать не только скорость, но и, к примеру, название звука?
Думал, но пока от этой идеи отказался, дабы не усложнять формат. Длина кода по умолчанию — 10 секунд. Если сфоткать его и воспроизвести через авто-режим, то он будет играть ровно 10 секунд. Хотя при желании скорость можно увеличить или уменьшить, перемещая соответствующий слайдер.
Что касается названия звука — то его ведь можно просто написать обычным текстом рядом :)
Отлично! Только я бы добавил отметки для ориентации по времени, чтобы стабилизировать скорость воспроизведения.
UFO just landed and posted this here
Вы имели в виду, разумеется, фонограф, а не виниловый проигрыватель.
Очень круто. Чем-то похоже на QR-коды, но лично мне они неинтересны, а такой штучкой я бы пользовался. Реквестирую, автор с такой технологией станет миллионером.

Кстати, голос распознается крайне хорошо, в отличия от музыки, удивительно. Запишите что-нибудь в 8bit музыке, если есть возможность ;)
Такой код конечно теряет много полезной звуковой информации, поэтому лучше всего кодируются звуки с ярко выраженными гармониками и без резких переходов. Например: голос, хор, скрипка. 8bit еще не пробовал — займусь на досуге :)
Ммм, буду (или будем) ждать!;)
Спасибо за минусы ;D
Это связано с моим мнением, почему такой формат приживется чуть лучше, чем QR-коды? =)
1. Сравнение QR-кода (у которого тысяча применений) с сабжем и утверждение что QR-код не интересен, а сабж ок.
2. Апелляция к своему личному мнению без аргументов.
3. Неуместное использование слова «реквестую».
4. Утверждение, что технология принесет автору миллионы.
5. Орфография.
6. Смайлы.
1. «лично мне они неинтересны, а такой штучкой я бы пользовался».
Первое слово «лично». Мне QR-коды в принципе не нравятся, но сабжевый формат записи шифрованных данных *на бумаге* импонирует.
2. 0_о Чтобы выражать свое мнение, нужно иметь какие-то аргументы? Вам апельсины или бананы нравятся? ОТВЕТ АРГУМЕНТИРУЙТЕ. (где-то тут сарказм есть)
3. Перед написанием комментария тщетно пытался найти точное значение этого слова, чтобы убедиться в правоте ваших слов, но у меня не получилось. Подскажите, пожалуйста, почему я его использовал неверно?
4. Позволю себе порассуждать: если у человека есть крутая технология, не факт, что он станет миллионером. Но с плохой технологией он точно оным не станет. Я считаю, что подобная технология достаточно амбициозна, чтобы сделать автора миллионером. Но не факт, что он к этому стремится или у него вообще это получится.
5. Я обнаружил только одну орфографическую ошибку, в окончании слова «отличие». Знал бы что за такую ошибку меня поимеют на минусах, я бы не торопился с написанием комментария, а прогнал бы его через все известные мне системы проверки правописания.
6. Позволю вас поправить — не «смайлы», а «смайл», так как он у меня был один. Это уже перебор?
3) «Реквестирую» от слова «реквест», которое является английским «request». Не нужно использовать слова, значение которых Вы не знаете.
Точно. Я почему-то был твердо уверен, что оно еще используется в смысле «предсказываю».
Например, «реквестирую появление Ктулху». Каюсь, не углубился в этимологию слова, бейте меня ;D
Появление Ктулху вангуют ,)
1, 2. Раз вы выражаете необоснованное личное мнение, будьте готовы к таким-же необоснованным минусам, показывающим что с вашим мнением не согласны. Были бы аргументы — было бы что обсуждать. А вы просто пишете: «лично мне кажется что бананы круглее апельсинов». Если с вами согласны — получите плюсы, нет — минусы. Тут нет пространства для диалога, вы сами так позиционируете свой комментарий.
3. Реквестую = прошу, требую. Реквестовать можно доказательства, исходники. А вы предполагаете.
4. Вот так и надо было написать. И вам бы, вероятно без минусов, ответили, что да, здорово, но не совершенно непонятно как это монетизировать. Ведь это главная и принципиальная проблема, раз уж вы утверждаете о миллионах.
5. Это хабр, тут бывает.
6. Это хабр, тут бывает. ;)
1, 2.
Я вас предельно понял, но прежде чем однополярно минусовать, можно бы и спросить, почему у человека именно такое мнение сложилось, а не просто жать красную стрелочку.

Лично я минусы ставлю если человек грубо ошибается или нагло лжет в комментарии, несет политическую пургу или делает еще какие-то вопиющие вещи. Но если я с ним не согласен, садануть ему минус? И все же, на все воля хабра.

3.4
И вообще, я запрашивал автору миллионы за подобное :D (шутка)
В пункте 3 нужно было написать «вангую», правда минусы всё равно отхватил бы, но за другое.
Ввалили вам по совокупности причин, любой пары из которых достаточно, причем всего пару минусиков. Для чего кому-то что-то аргументировать, если минусик — это обычное «мне не нравится комментарий, но объяснять лень».
А обсуждения этих двух минусиков на десяток килобайт.
Восхитительно. Идея выглядит очень свежей и необычной. Удачи в монетизации)
Ага. Но в цифровом виде. А последующее воспроизведение — желательно при помощи сканера с высоким DPI
Свежей? Сто лет в обед. Подобным способом звук на киноплёнку записывается.
Я видел, видел. Это не «принципиально новая» идея, а вариация давно известной. Мне очень странно и обидно, что в тексте статьи про это у вас ни слова, только про АНС.

Кстати, сам этот синтезатор в свою очередь основан на кинематографическом методе.
Только верх и низ надо по-разному обозначать (я про полоски)Ю а сейчас, когда они симметричные, можно перепутать и начать играть наоборот.
Дык это же прекрасно! :) Формат стимулирует творчество. Всегда интересно, что будет, если проиграть задом наперед или вверх тормашками
А можно пример какой-нибудь известной мелодии «вверх ногами»?
И ждём версию для iOS!
Это просто «задом наперёд». В ситуации с этим приложением будут перевёрнуты и частоты, и направление.
А ещё можно просканировать перевёрнутую запись в обратном направлении…
При запуске телефон повис наглухо… iPhone 4 8Gb, iOS 7.1
Непруха :) На 4s работает отлично, а на 4 никак… Будем разбираться
мне кажется проблема в скорости. Греется 4s хорошо, как и садит батарею. А вот ипод 3й по типу зависает н если подождать то он просто очень тупит, по кадрам показывает и тп
Очень похоже на то. 4s спасает два ядра. Я поправил бару багов и включил принудительный переход в режим 640x480 для камеры на iPhone4. Залил на проверку. Надеюсь, это поможет.
И, кстати, немножко помогает уменьшение параметра Quality в меню программы.
Хоть убейте, но не вспомню откуда, вроде в книжках про Муми-троллей, были ребусы: как бы закрашенная картинка, а если посмотреть на плоскость листа под достаточно острым углом, то можно было увидеть текст. Причём, текст разный если картинку повернуть на 90 градусов. Было бы забавно увидеть код, в котором будет реализовано нечто подобное (в смысле ориентации).
Это довольно легко делается. Вы пишете текст, удлинив шрифты и все. Потом накладываете их под углом 90 градусов.
Например:
Как это делается, я понимаю, сам ручкой на бумаге рисовал. Я про автоматически считываемый код в двух плоскостях.
А смысл? Уплотнение записи? Проще на цифровое кодирование перейти тогда.
Возможно это будет баловством, но когда я первый комментарий писал, в голове был QR код (уже цифровой), который в разных ориентациях считывается по разному. Just for fun.
Все уже изобретено до нас. Гуглите тему «аппарат Скворцова „Говорящая бумага“ и „тонфильм“, если смотреть на кинопленку.
«Говорящая бумага» не работала со спектром звука. Там использовалась ширина линии (как на кинопленке). В итоге — нужна очень длинная лента. 10 секунд на визитку в таком формате не упихать
Вдруг вспомнил Uplink. «My voice is my passport. Verify me»
Забавно, только сегодня вышел на ваш youtube через блог musicofsound.co.nz :)
Отличная штука.
Все ждал когда при воспроизведении вы перевернете листок вверх ногами (отразите зеркально по вертикали). Еще не хватает для музыкальных записей каких-то маркеров повторений: чтоб сканер запоминал повторяющиеся блоки и воспроизводил их в указанных местах.
Не пробовали рисовать почеркушки в рабочем поле и проигрывать то что получается?
Пробовал :) Получается интересно. Ролик не успел еще такой снять, но надо будет обязательно
Отличная техника для маньяков. На жертве вырезать звук ее крика, можно прям фильм снимать про маньяка с музыкальным слухом.
ну у вас и фантазия! в жизни бы до такого не додумался.
А кино — да, получилось бы довольно жесткое =)
На 4.42 не просто проблемы — приложение крашится, не выдав вообще никакого выхлопа, кроме черного экрана.
На всякий случай отправил крашрепорт.
Да, спасибо. Под проблемами я как раз это подразумевал — либо черный экран, либо падение.
Уверен, в ближайшее время появится решение.
Aw. Ну тогда написали бы, что под 4.42 не работает atm, чего уж тут углы скруглять.
У некоторых пользователей работает
Токката хороша. Предложения от Гугла с Мелкософтом уже приходили?
Не думал что звучание голоса сохраняется так качественно. Эдисон бы позавидовал )
UFO just landed and posted this here
С таким качеством это антиреклама :)
UFO just landed and posted this here
Есть подходящие жанры вроде Death или Black метала.
Для стандартного попсового «умц-умц»? Вы драматизируете :)
ИМХО, стоит добавить защиту от перекоса, из-за которой ВЧ играют вперед НЧ (либо наоборот, в зависимости от наклона). Например в виде дополнительных полосок с кодом Грея.
А вот от шептающе-жужжащего оттенка избавиться будет не просто — для этого нужно как-то фазы кодировать, а места они потребуют столько же сколько амплитуды.

P.S. Все же с практической точки зрения эффективнее юзать QR-код, скажем версии 40 + какойнить low-bitrate кодек (типа iLBC, если для голоса). :)
Спасибо, пожелания учту!
На счет QR-кода — соглашусь, но лишь отчасти :) Мне конечно в первую очередь нравится процесс живого взаимодействия с таким кодом — для всяких творческих экспериментов самое то
Идеальная вещица для шифрующих свой голос шантажистов.
Очень сомнительно, что голос действительно скрывается. Искажается — да.
Вкупе с шифрованием — отличный физический способ передачи секретной информации.
Ничего в нём отличного, когда уже давным давно придумали paperback с избыточностью, шифрованием и т.п.
IMHO, подобные орнаменты гармонично смотрелись бы в приключенческом фильме про исчезнувшую цивилизацию а-ля приключения Индианы Джонса.
Стянул одну из картинок c маркерами и открыл Paint.NET;
Открыл ocenaudio в режиме Spectral View (палитра Inverted Linear Greyscale) и начал скриншотить фрагменты в Paint.NET.
Тут же возникли претензии к «спецификации»:
— 8 октав от 65.4 Гц — это получается до 15804 Гц?
— частотная шкала линейная или логарифмическая? А амплитудная? (Про первое легко догадаться, но раз назвали спецификацией...)
— «небольшая пустая область» — это сколько?
Пример спецификации

Про перекос уже заметили. В целом получается, что кроме голоса и классической музыки ничего толком и не озвучить.

Хотел что-нибудь в духе «Угадай мелодию» сюда запостить, но пока даже сам угадать не могу то, что получается.
Остаётся только «реверс-инжинирингом» подбирать параметры — записать с микрофона фрагмент и смотреть как обработать спектр того же фрагмента для получения такой-же картинки. Но на сегодня я уже наигрался.

P.S. ocenaudio в качестве логарифмической использует Mel scale. [60 Гц — 16 кГц] — это примерно [100 mel — 3500 mel].
P.P.S. Somehow related. Оттуда можно будет попробовать картинки вставлять.
8 октав: от 65.4 до 16742.4 Гц.
Частотная шкала — логарифмическая.
Амплитудная шкала — линейная. То есть, в идеале пиксель с цветом #808080 даст синусоиду в половину от максимальной амплитуды.
Небольшая пустая область — настолько небольшая, насколько может заметить ее камера. Точный размер не определяю. Тут важно отметить, что сонограмма в этой области как бы уже начинается. То есть, на практике мы теряем немного верхов и низов из спектра.
За замечания спасибо. Буду править.
Простите, Хабр слетел с катушек.
Я хотел написать: А не подскажите под какой лицензией распространяется ocenaudio?
Да, и за одно SPEAR, если в курсе…
А не думали, что если рисовать, например, двойную линию посередине, то это поможет решить проблему уплывающего фокуса?
Не очень понял, что вы имеете в виду под уплывающим фокусом.
В любом случае не хотелось бы конечно чем-то дополнительно спектр разбивать
Я имею в виду то, что камера часто теряла фокусировку.
А, понял, спасибо. Да, вы правы, это проблема. Но я надеюсь, что ее удастся решить как-то иначе. Например, смещением точки автофокуса на маркер.
Кстати да, с фокусом беда.

Можно сделать верх от «двойной сплошной» амплитуду, и вниз — фазу (см. коммент),
или, что то же самое, положительную и отрицательную часть спектра FFT.
Отняли половину разрешения по частоте для амплитудного сигнала, но выигрыш, возможно, превысит потери. С перекосом, правда ещё проблема остаётся, из-за которой может не взлететь.
Или стерео — левый и правый каналы.

А можно ли камеру андроида программно перевести в режим фиксированного фокуса? Возможно, это будет более интуитивно, чем подстраиваться под автоматику.
На счет фазы надо конечно проверить. Но мне почему-то кажется, что ничего не получится, потому что в этом случае обретает большую важность совпадение фазы и амплитуды для конкретной синусоиды, что мы обеспечить не можем в силу чрезмерного искажения картинки.
С камерой такая ситуация. На некоторых устройствах, вроде моего LG Optimus Hub, вообще нет возможности включения постоянного автофокуса. Он срабатывает только тогда, когда, я нажимаю на экран. На других устройствах постоянный автофокус имеется, но теоретически его можно отключать. Наверное, это хорошая мысль, я поработаю над этим.
Обычно даже в автоматах есть режимы фокусировки на бесконечность. Сейчас проверил на своем телефоне с Android 4.0.3. Если выбрать режим Landscape (Пейзаж, или как он там в русских прошивках), то рамка фокусировки пропадает и субъективно аппарат не пытается фокусироваться.

Возможно, этот режим можно как-то вызывать программно.
Возможно, еще будет интересно для детей. Понятно, что у всех уже давно планшеты (родитель вместо погремушки дал — и спокоен на весь вечер), но так можно еще и книжки к процессу привлечь. Посмотрел ребенок на картинку в книжке, навел планшетик на спектрограмму — послушал очередной фрагмент сказки.

Тоже, по сути, спорно, но это что-то из разряда «чтобы не забывали теплые ламповые книжки».

ps. главное, чтобы злые дяди в книжке не вписали во все спектрограмы дружок, хочешь расскажу тебе сказку?
Автор вы гений! Вы не представляете, что вы можете сделать для слепых людей! Метка начала в шрифте Брайля и вот человек слышит такую нужную ему информацию.
Кстати, если переключить PhonoPaper в Free Mode (в меню программы), то он начнет озвучивать все, что попадает в кадр, не обращая внимания на маркеры. Теоретически, это могло бы помочь слепым ориентироваться в пространстве.
Попросил жену поделиться новостью в министерстве образования. Посмотрим что ответят на инициативу. Но программа адаптации инвалидов большой нацпроект который недавно поднимался.
Автор — очередной горе-изобретатель, комментаторы — «нубасы» )))

ru.wikipedia.org/wiki/%D0%9A%D0%B8%D0%BD%D0%BE%D0%BF%D0%BB%D1%91%D0%BD%D0%BA%D0%B0#35-.D0.BC.D0.B8.D0.BB.D0.BB.D0.B8.D0.BC.D0.B5.D1.82.D1.80.D0.BE.D0.B2.D0.B0.D1.8F_.D0.BA.D0.B8.D0.BD.D0.BE.D0.BF.D0.BB.D1.91.D0.BD.D0.BA.D0.B0

Аналогичная технология использовалась в production'е enterprise-ного уровня (ээ… в кинотеатрах) — почти что в начале века.
Вы состоянии различить spacial domain и frequency domain?
Читал-читал ссылку, и не нашёл там про софт любому желающему, который мог бы на карманном устройстве кодировать и декодировать звук в оптическую дорожку. Так что автор всё-равно молодец.
По внешнему виду: обычный спектр. Я такие картинки впервые увидел, когда для Дальприбора немного работал: сигнал от гидроакустического буя после FFT и вывода на экран (я тогда понятия не имел что это всё такое, просто по «спекам» ваял код и структуру).

Т.е. прочитал файл при помощи любой библиотеки, применил FFT, сохранил в битмап. Мне кажется, что автор для этих целей сделал всё же утилиту, но причёсывать для массового использования не захотел. Оно и понятно — обратное преобразование куда более интересный процесс.
Не совсем так. PhonoPaper использует FFT для очень быстрого преобразования, чтобы не напрягать пользователей. Но если хочется лучшего качества, то программа Virtual ANS может вместо FFT использовать метод банка фильтров, что в некоторых случаях дает гораздо более качественную картинку. Если речь, например, о рекламной кампании с использованием PhonoPaper-кодов, то конечно разумнее всего коды генерировать при помощи Virtual ANS, играя с обработкой и перебирая разные варианты.
Нужно заборы вдоль дорог расписать: едешь и читаешь послание или экскурсионный текст. Причем со строго разрешенной скоростью)
я представляю новый вид хулиганства
А если татуировка на внутренней части предплечья?
Привет,

написал на форуме, продублирую тут. Конечно, желающих что-то предложить море, желающих что-то сделать нет, но мне кажется, что предложение логичные.

я бы сделал стандарт 2.0 phonopaper, в который внёс:

— Логарифмическую шкалу для громкости
— Пре АЧХ фильтр и пост АЧХ фильтр. У большинства сигналов есть явное преоблажание в области низких частот, поэтому имеет смысл увеличивать яркость высоких частот при печати.
— Маркеры времени, например, прерывистыми граничными линиями.
— Кодирование цветом громкости
Какая крутейшая опечатка: преоблажание.
Возьму на вооружение, спасибо!
Как-то пропустил топик и релиз.
Это гениально! Крутотень! :)
Сам люблю такие штуки и все что связано со звуком и музыкой…
Я все программки автора в маркете скупил, благо очень демократичные цены и софт того стоит) Радует, что имеется и бесплатный софт, насчет открытого не в курсе. Нравится стиль, теплота и любовь автора к своим проектам.
Рад, что не забрасываете развитие и периодически выходят вкусные обновления. Продолжайте в том же духе и успехов! ;)

Здравствуйте.
Скажите пожалуйста: а как создавать такие коды?
Есть ли приложение?
Спасибо.

Пишут нет применения. Что аж как вызов звучит. Утро надо размять мозг перед работой. Попробую обозреть системно векторно:
Аналогично QR смысл сохранять информацию оффлайн. Причем оффлайн строго. Не url'ами а саму информацию, отличающийся тем, что тут 10с звука против ~10К текста.

— До решения задачи о популяризации декодера данный код может быть прочитан только ожидающем его появление пользователем. Остальных исключаем.
+ Однако малая популярность данного вида кодов может быть и плюсом на узком таргете.
— Смысловой информации в 10К текста бесспорно можно уложить гораздо больше, следовательно нужно исключить области где колличество информации важнее ее формы.
+ Плюсом однако является то, что в данный код против QR звук вобще можно сохранить.
— Звуковые образцы низкого качества, потому кейсы где качество образца важно надо исключить.
+ Аналоговый сигнал более стоек к ошибкам, он читается даже когда качество сниженно.

Из не приколюшных вариантов остаются следующие, которые я не смог строго исключить:
1. В общем случае системы оповещения о персонифицированном приближении кода внутри доверенной группы
«Майкл подходит к вам сзади»

2. Городские звуковые метки для слепых:
Да их можно реализовать на QR + TextToSpeech потому плюс за аудио не строгий.
Но доминантный признак за стойкость к ошибкам и аппаратной легкости парсинга остается.
Кастомный префикс в QR мог бы обеспечить узкий таргет, но с этим более вероятны ошибки или абьюз.

3. Персонификация метки как основная характеристика:
Сравните ситуайию когда TTS зачитывает в ухо машинным голосом «Привет, это Майкл», против аналогового «Привет» считанного с персонифицированного образца лично записанного приветствия. Вы знаете что слепые очень одиноки в социуме еще и потому, что они не видят друг-друга в толпе…
Как думаете сколько это может стоить?

Вариант реализации:
Кепки с камерой на кикстартер (+raspberryPi +наушники) которые могут воспроизводить звуковой идентификатор друг-друга только увидев, как вместо лица.

Говоря о конкретном продукте уже не нужно полагать его выполняющим только главную функцию, можно уже поразмыслить над улучшением сопутствующего функционала:
Так подобные устройства смогут воспроизводить те самые метки в городе из п.2. А сканер кодов можно сместить в невидимый глазу диапазон, если выяситься что слепым есть дело до того как они выглядят со «штрихкодами на голове»

было бы круто сделать что-то вроде секвенсора, например картинка с камеры разбивается на 8х8 квадратов или 16х8 квадратов, и от яркости/затенённости областей образуется ударная секвенция, ну и запоминать удачные

Sign up to leave a comment.

Articles