Экстремальное кодирование аудио

    Sound RecorderВы никогда не задумывались, как поведут себя существующие форматы сжатия с потерями в совершенно ненормальных условиях? Обычно они удачно маскируют удаляемую информацию, и ухо неискушенного пользователя не слышит разницы. А может быть это недостаток акустики сегодня, и после её обновления завтра всё всплывёт наружу?

    В интернете можно найти массу информации о слепых тестированиях различных форматов и сравнении спектрограмм. Уже давно сделана масса выводов о том, какое качество предпочтительней. Но основная рекомендация остается одна — опираться на свои уши. И тут может оказаться, что кому-то и MP3 128kbps сойдет за CD-качество — скорее всего, купить неплохую акустику еще предстоит, а может и медведь на ухо наступил. Как быть?

    Предлагаю провести совершенно ненормальный, но тем не менее наглядный эксперимент. Чтобы услышать разницу, мы будем кодировать звук не один, а 5, 10 или 50 раз!

    При каждом повторном кодировании кодировщик будет удалять всё новую и новую информацию, которую на его взгляд человеческое ухо не услышит. Наша задача — выявить минимальный битрейт популярных форматов сжатия с потерями (MP3 и Ogg Vorbis), который и при 100 итерациях перекодирования сохранит звук практически неотличимым от оригинала.

    Подготовка


    Для кодирования MP3 будем использовать последнюю стабильную версию LAME (3.98.4). Чтобы автоматизировать процесс повторного кодирования сделаем небольшой bat файл. Схема работы проста: кодируем wav файл в mp3, затем декодируем обратно в wav, затем кодируем уже полученный wav и т.д.
    @copy /Y %1 ~temp.wav
    @for /L %%i in (1,1,%3) do @(
        @echo -------------------------------------------------------------------------------
        @echo -- Iteration %%i
        @echo -------------------------------------------------------------------------------
        lame %4 ~temp.wav ~temp.mp3
        lame --decode ~temp.mp3 ~temp.wav
    )
    @copy /Y ~temp.mp3 %2
    @del ~temp.wav
    @del ~temp.mp3
    Назовем его mp3_xcode.bat. Формат запуска выглядит так:
    mp3_xcode <input.wav> <output.mp3> <iterations> "<lame params>"

    Для Ogg Vorbis воспользуемся OggEnc aoTuV b5.7. Сделаем bat файл для этого формата.
    @copy /Y %1 ~temp.wav
    @for /L %%i in (1,1,%3) do @(
        @echo -------------------------------------------------------------------------------
        @echo -- Iteration %%i
        @echo -------------------------------------------------------------------------------
        oggenc %4 -o ~temp.ogg ~temp.wav
        oggdec -w ~temp.wav ~temp.ogg
    )
    @copy /Y ~temp.ogg %2
    @del ~temp.wav
    @del ~temp.ogg
    Назовем его ogg_xcode.bat. Формат запуска выглядит так:
    ogg_xcode <input.wav> <output.ogg> <iterations> "<oggenc params>"

    Если вы захотите самостоятельно поэкспериментировать, вам пригодится архив sndexp.7z (1,3Мб), в который включены все необходимые файлы.

    На старт, внимание, марш!


    Ниже вы увидите множество ссылок на аудио-файлы. Рекомендую воспользоваться плеером, который может воспроизводить файлы напрямую по http ссылке (например, foobar2000).
    В качестве исходной композиции во всех случаях использовался насыщенный отрывок из композиции «O Fortuna» в исполнении Therion. Скачать его можно здесь: fortuna.flac (2,8Мб) или fortuna.ogg (466Кб).
    Итак, приступим.

    Первый рубеж: ~128kbps

    Будем кодировать в VBR, поэтому подберем параметры, выдающие в среднем 128kbps.
    mp3_xcode fortuna.wav fortuna_128x10.mp3 10 "-V 6"
    ogg_xcode fortuna.wav fortuna_128x10.ogg 10 "-q4"
    Получаем файлы:
    x10 fortuna_128x10.mp3 (340Кб) fortuna_128x10.ogg (360Кб)
    x50 fortuna_128x50.mp3 (326Кб) fortuna_128x50.ogg (367Кб)
    На этих примерах отчетливо видно, что у MP3 и Ogg Vorbis совершенно разный подход к кодированию. После каждого повторного кодирования звук в MP3 становится все больше похож на белый шум. У Ogg Vorbis эффект совсем другой — звук становится более глухим.
    Во всех случаях мы получили отвратительный результат.

    Поднимаем планку: ~192kbps

    Подберем параметры, которые дают приблизительно 192kbps.
    mp3_xcode fortuna.wav fortuna_192x10.mp3 10 "-V 2"
    ogg_xcode fortuna.wav fortuna_192x10.ogg 10 "-q6"
    Получаем файлы:
    x10 fortuna_192x10.mp3 (533Кб) fortuna_192x10.ogg (528Кб)
    x50 fortuna_192x50.mp3 (531Кб) fortuna_192x50.ogg (552Кб)
    В этом тесте при 10 перекодированиях Ogg Vorbis показал себя значительно лучше, чем MP3. Его уже можно заставить себя слушать, но отчетливо чувствуется огромное количество артефактов. При 50 слушать уже невозможно. Вердикт — тест провален.

    Еще выше: ~256kbps

    Подберем параметры, которые дают приблизительно 256kbps.
    mp3_xcode fortuna.wav fortuna_256x10.mp3 10 "-V 0"
    ogg_xcode fortuna.wav fortuna_256x10.ogg 10 "-q7,3"
    Получаем файлы:
    x10 fortuna_256x10.mp3 (624Кб) fortuna_256x10.ogg (624Кб)
    x50 fortuna_256x50.mp3 (624Кб) fortuna_256x50.ogg (747Кб)
    x99 fortuna_256x99.mp3 (624Кб) fortuna_256x99.ogg (849Кб)
    Здесь при 10 итерациях кодирования оба формата дали примерно одинаковый результат. Однако, уже при 50 старичок MP3 уже начинает ощутимо выигрывать у Ogg Vorbis. Причем у последнего в результате получился более высокий битрейт! Для того, чтобы проверить тенденцию, количество итераций было увеличено до 99. Тенденция сохранилась: MP3 остался все еще относительно слушабельным, и Ogg Vorbis значительно уступает ему в этом.

    И напоследок: ~320kbps

    Поскольку в LAME параметр -V нельзя задать ниже 0, мы воспользуемся параметром -b 320. Для OggEnc сделаем то же самое. При этом Ogg Vorbis будет работать в режиме VBR, а MP3 в режиме CBR.
    mp3_xcode fortuna.wav fortuna_320x10.mp3 10 "-b 320"
    ogg_xcode fortuna.wav fortuna_320x10.ogg 10 "-b 320"
    Получаем файлы:
    x10 fortuna_320x10.mp3 (862Кб) fortuna_320x10.ogg (888Кб)
    x50 fortuna_320x50.mp3 (862Кб) fortuna_320x50.ogg (1099Кб)
    После 10 итераций кодирования у обоих форматов получился неплохой результат. Это можно слушать, причем MP3 сложно отличить от оригинала. При 50 итерациях — в обоих форматах отчетливо слышны неприятные артефакты, и Ogg Vorbis несколько проигрывает MP3, не глядя на то, что с каждым повторным кодированием он автоматически повышал битрейт.

    Вердикт

    • Ogg Vorbis лучше MP3 на битрейтах до 256kbps
    • MP3 лучше Ogg Vorbis на битрейтах от 256kbps до 320kbps
    • Кодер Ogg Vorbis с трудом переваривает ранее собой же закодированные данные, поэтому увеличивает битрейт
    • Тестируемые кодеры обоих форматов при многократном перекодировании не смогли обеспечить прозрачное звучание на всех проверенных битрейтах

    Выводы


    В свете некоторой абсурдности всего эксперимента прошу не относиться к написанному слишком серьезно. Все это может стать лишь одним из поводов задуматься о хранении домашней колекции музыки lossless форматах наподобие FLAC. Пожалуй, это единственный разумный вывод, который можно было бы вынести из написанного.

    P.S. Кандидат на звание псевдо-lossless


    В 2002 году для кодирования Ogg Vorbis был популярен кодер OggEnc GT3 (176Кб). При кодировании на максимальном качестве он выдает битрейт в среднем более 500kbps. Чуть позже я попробовал воспользоваться им для нашего эксперимента, в результате чего был удивлен: даже после тысячи перекодирований кажется я не могу отличить полученный файл fortuna_q10x1000.ogg (1421Кб) от оригинала. Да и средний битрейт получаемого файла практически не изменялся после каждой итерации. Последняя официальная версия кодера Ogg Vorbis и популярная версия aoTuV даже при 100 перекодированиях давали плохой результат. Так что старый GT3 при максимальном качестве кодирует лучше всего. Однако, на других битрейтах GT3 не показал себя так же хорошо.
    Support the author
    Share post
    AdBlock has stolen the banner, but banners are not teeth — they will be back

    More
    Ads

    Comments 92

      –35
      Охренеть. О чём пост?
        +20
        Не читали?
          –4
          Если ирония в моих словах не заметна, предлагаю прочесть этот комментарий.
          • UFO just landed and posted this here
            0
            Предлагаю провести совершенно ненормальный, но тем не менее наглядный
            Наглядный, но тем не менее абсолютно некорректный.
              +1
              Простите, но я и сам писал про его абсурдность.
              –22
              Статья опоздала где-то лет на десять :)

              Самый лучший формат хранения — mp3 320кбпс, так как и качество ок и открывается везде вообще где можно представить и размер уже не имеет значения.
                –1
                имхо, mp3 V0 получше будет в отношении размер-качество
                +7
                а мне понравилось! спасибо =)
                  +7
                  забавное сравнение. для себя я выбрал огг-320для плеера и лосслесс-форматы для дома.
                  и, кстати, пишется «lossless»
                    –2
                    <grammar_nazi>Всё верно. Маленькое примечание: по правилам русского языка «сс» должно редуцироваться до одиночного «с» (лослес-форматы, лослес-кодирование; аналогично: твитер, не «твиттер»).</grammar_nazi> :)
                      +10
                      Обоссаться.
                        +1
                        Ну что Вы, это ж русское слово, наше, родное :)
                        А я про конкретный контекст: в русскоязычной традиции заимствований, как правило двойные согласные из языка-оригинала редко переходят (редкие исключения: масса, тонна, касса, гамма).
                        На этом хочется остановиться и не превращать Хабр в Special Olympics ;)
                          –1
                          После того как я переводил технический текст, стал писать «рекомендации» с двумя «м» и еще парочку слов неправильно.
                            –1
                            и еще парочку слов неправильно.

                            «аддресс» и «пасспорт»?
                              –1
                              Не совсем) В адресе иногда порываюсь написать два «с», а еще «программу» пытаюсь с одной «м» написать порой.
                      0
                      Спасибо за замечание, исправил.
                      –2
                      Fraunhofer IIS лучший энкодер мп3. лично сравнивал с lame.
                      Качество звучания между двумя этими кодировщиками сильно различается.
                      У Fraunhofer'a все кристально чисто на тех битрейдах где у лэйма плавают и звенят верхи. разница перестаёт ощущаться от 320 и выше.
                        –2
                        мп3 выше 320 кбпс?!?
                          +2
                          --freeformat до 640
                          • UFO just landed and posted this here
                              –1
                              согласен. Нужно искать декодер, который понимает этот ключ.
                        –4
                        «Старый кодер OggEnc GT3 при максимальном качестве q10 обеспечивает прозрачное звучание даже после тысячи перекодирований»
                        Вы вначале поста говорите, что кому-то предстоит обзавестись хорошей акустикой, вы бы сами это сделали. На хороших наушниках (колонках — не знаю) уже пару раз мп3 320кбпс прогоните из лосси в лосслесс туда-сюда и уже существенная разница на лицо, или, точнее, на ухо.
                          –3
                          Вообще-то MP3 320kbps и Ogg Vorbis q10 — это немножко разные вещи.
                            –2
                            Я бы сказал, достаточно сильно разные.
                          +6
                          Эксперименты конечно это всегда здорово, но тут уже начинает попахивать «британскими учеными», то есть «экспериментом ради эксперимента»: «Британские ученые скрестили слона и слона. Не для того, чтобы получить гибрид, а чиста позырить.»

                          Применимость полученных «знаний» стремится к нулю, несмотря на потраченное время. «Нет, такая наука нам не нужна!» (с)
                            +1
                            Вы совершенно правы, изначально это и был эксперимент ради эксперимента. Но результаты мне показались интересными, поэтому я и опубликовал их.
                              +3
                              я бы не сказал, что они интересны. очевидны — вот точная формулировка
                                +3
                                Без подобного эксперимента нельзя было бы однозначно сделать выводы о характере искажений в разных форматах, например.
                              +1
                              И из этого еще сделали выводы.
                                +1
                                Совершенно согласен! Британские изыски. Суровые и беспощадные!
                                –3
                                Этот тест чем-то сродни справедливо закиданному какашкми «Сравнение некоторых коллекций С++/C#/Java». Был тут такой недавно, да сплыл.
                                  +1
                                  В таблице 256кбпс половина ссылок ведет на один и тот же файл.
                                  А вообще любопытно, конечно, хотя не совсем понял, почему артефакты при 50-разовом кодировании и декодировании должны побуждать меня хранить музыку во flac. Каждый раз конвертить, когда заливаешь в телефон или плеер, мне как-то не в кайф.
                                    +3
                                    Наглядно — да, только что изменится после прочтения — неясно, ведь те, кто понимает и слышит разницу — и так хранят в lossless, а кто не слышит — и будет продолжать складировать mp3…

                                    Разницу действительно не на чем угодно и не кто угодно услышит, хотя по моей статистике при наличии техники и правильного помещения 192 vs lossless отличают почти все
                                      –1
                                      Ну как минимум все смогут увидеть разницу того же 320kbps, хоть и после n-ого кодирования. А решать конечно каждый будет сам.
                                        +3
                                        Сложнее продемонстрировать другой эффект lossy-кодеков — они ведь почти все основаны на аппроксимации спектра, в рассчете на то, что мозг восстановит недостающие гармоники.
                                        А эффект состоит в том, что это лишняя работа для мозга и повышается утомляемость.

                                        В чистом виде это проверить очень тяжело, т.к. слишком много влияющих факторов — техника, погода, решаемые задачи… Пробовал на себе — слушал несколько дней только mp3 и только lossless — разница ощутима, но эксперимент не чистый
                                          +1
                                          Вот это интересно. Впервые об этом слышу. Можете подробнее написать?) Можно в личку, или в идеале — напишите топик об этом)
                                            +4
                                            Это относительно известный факт среди людей, много работающих со звуком (сюда же включается чрезмерно низкое качество аппаратуры, например — большое количество наводок/шумов), но исследований вроде никто не проводил.

                                            Ближайшая аналогия — читать книгу через грязное стекло — все видно, читается, но устанете заметно быстрее. Суть кодирования с потерями — выкидывается наименее значимая информация. Например можно в тексте постирать часть палочек у букв, а ваш мозг все равно их восстановит и текст прочитает:
                                              +1
                                              это понятно, но интересно было бы почитать еще где нибудь об этом))
                                              И вредно ли, получается, слушать постоянно музыку в мп3?)
                                                +1
                                                Навскидку не смог найти достоверного источника с подтверждением или опровержением —
                                                подобное исследование крайне не выгодно производителям mp3-плееров и прочих продавцов музыки в mp3
                                                  0
                                                  само ппрослушивание мп3 не вредно, при сжатии просто обрезается исходный трек. вот если слушать с помехами, тогда уши «устанут гораздо быстрее».

                                                  прослушивание музыки на плохой акустике — другой, гораздо более важный, вопрос.
                                                  0
                                                  Весьма интересная идея :) Никогда её не слышал.

                                                  Мне сложно представить как может проводиться такой эксперимент, но опрашивать человеков вряд ли имеет смысл — скорее, стоит считывать какие-то объективные «мозговые» показатели.
                                                    0
                                                    Кстати да — можно на томографе, смотреть активность мозга, только как-то нужно отличать просто мысли от искомой паразитной нагрузки (по идее другой участок будет сильнее грузиться), думаю что есть методика, вопрос только в том, достаточна ли точность измерений чтобы сделать вывод
                                                    –1
                                                    Дело в том, что mp3 кодирование рассчитано на удаление не слышных среднестатистическому человеческому уху составляющих звукового спектра. В вашем примере я вижу покоцанный текст, а вот в mp3 я не слышу удаленных при кодировании частот, ибо не обладаю острым слухом и не должен их слышать.
                                                    И чего этой мой мозг будет восстанавливать интересно? В случае с буквами все понятно, я знаю как они выглядят и строю ассоциативные предположения. В случае с музыкой, что я буду восстанавливать? Какие гармоники? Я понятия не имею как оно звучит в lossless. Я просто слышу то, что слышу.

                                                    И почитайте теорему Котельникова
                                                      0
                                                      Причем тут теорема Найквиста-Котельникова? Она справедлива только для идеального ЦАП-АЦП в ваакуме с бесконечной точностью самих отсчетов, и то есть некоторые ньюансы:
                                                      ради интереса на досуге постройте график синуса с частотой Найквиста (половина частоты дискретизации) и на бумажке постройте для него дискретные отсчеты в точках n/F (F-частота дискретизации), после чего восстановите по ним исходный сигнал — будете удивлены, но получится 0, если же сдвинуть фазу синуса — то после восстановления амплитуда сигнала будет меньше и только при фазах -/+ pi/4 (с учетом периода) восстановится то, что кодировалось ;)

                                                      Но это все про PCM, а mp3 это дальнейшее сжатие PCM. И дело не только в удалении частот — существует психоакустическая кривая чувствительности слуха, в общих чертах — в районе 1 кГц максимальная чувтвительность, а вниз и вверх по спектру падает. Идея lossy кодеков в том, что там где чувствительность меньше, там можно кодировать менее точно, плюс используются эффекты маскирования частот — после преобразования Фурье выбираются гармоники с наибольшей амплитудой, а соседние — выкидываются, количество отсчетов на диапазон — как раз по кривой чувствительности.

                                                      Вот только часто выкидываются частоты, которые в состоянии легко различить подавляющее большинство здоровых людей:
                                                      (картинка отсюда)
                                                  +1
                                                  От куда информация про мозг? Требуем пояснений, ибо все это очень смахивает на бред, рожденный британскими учеными.
                                                    +2
                                                    это эмпирическое наблюдение, отрицать то, что в среде с помехами человек не будет больше уставать чем в среде без помех, вот это было бы бредом.
                                                    +1
                                                    С другой стороны, lossless — это по сути содержимое компакт-диска, где тоже применяется кодирование и дискретизация и они не идеальны (дальше идёт DVD-Audio). Поэтому мозг всё равно занимается восстановлением, но уже на в такой мере как в mp3.
                                                      +1
                                                      Да, любая оцифровка аналогового сигнала — уже большие потери, но в случае PCM их все же ощутимо меньше, главным образом теряется фазировка высоких частот (например частота 22050 Гц в CD-Audio вообще может всего только с двумя противоположными фазами быть закодирована), которая и так не сильно воспринимается ухом — мы все-таки слышим наличие и интенсивность частоты, а не ее фазу.
                                                      Гармоники же не пропадают и кроме шума квантования (который замечательно маскируют с помощью dither noise shaping) явных артефактов нет.
                                                  +1
                                                  лишь только избранный услышит разницу, избранный
                                                  +3
                                                  Странно как-то. Я всё кодирую через vorbis-tools посредством oggenc -q 7 (Linux). От flac не могу отличить даже на крутой акустике (медведь?). С 320 mp3 всё несколько иначе. Собственно по размеру он в 1,5 раза больше огга. Отличить тоже проблематично, но достаточно чуть понизить битрейт (хотя бы чтобы результирующий размер файла был как у oggenc -q 7) и уже слышна разница. И учитывая, что -q 7 — это не порог качества для OGG, то я однозначно за ogg.
                                                    +3
                                                    Понимаете ли, если бесконечно долго гонять бит по кругу, он рано или поздно исчезнет.
                                                    Никто не кричит, что если соединить вместе сто патчкордов, то данные начнут пропадать, они просто для этого не предназначены, и по дну моря никто их прокладывать не собирается.
                                                      –2
                                                      Именно поэтому единственный вывод, который я предложил — это мысль о lossless форматах. Там ведь можно хоть до посинения гонять туда-сюда любую музыку, и при этом она останется неизменной.
                                                        +2
                                                        Кстати, а вы проверили это?
                                                          0
                                                          FLAC-и при кодировании/декодировании дают WAV-ы с идентичным MD5-хешем. Я проверял.
                                                      0
                                                      спасибо, было интересно
                                                        +3
                                                        А как же AAC?
                                                          +3
                                                          Простите, но зачем сравнивать уровень регрессивной ошибки, если все пользуются однопроходным кодированием? Сравнили бы лучше частотное распределение на разных исходниках с разным битрейтом.
                                                            –1
                                                            Да зачем? Это уже сравнивали, и неоднократно.
                                                            А вот такое тестирование еще не проводили :)
                                                            Ну и что, что бесполезно? Зато интересно было почитать.
                                                            +3
                                                            «Речь многих обезьян, видите ли, напоминает человеческую, записанную, значить, на магнитофонную плёнку и пущенную задом наперёд с большой скоростью».

                                                            :)
                                                              0
                                                              Жалко про Nero Audio Забыли.
                                                                –1
                                                                Я бы уже давно перешел на FLAC, даже специально дополнительный винт бы купил, но к сожалению, мой Tattoo и братовский SE-W610i не поддерживают этот формат. Так что ждем дальше…

                                                                П.с. AAC на Тату есть, но мне он не нравится (даже не могу объяснить чем).
                                                                  +1
                                                                  Зачем вам этот формат, если ваша техника не обеспечит соответствующее качество звука?
                                                                    0
                                                                    Техника же меняется со временем — как телефоны, так и плееры. Не скачивать же заново, когда уже появится возможность услышать в лучшем качестве. Я, так же, стараюсь сливать лослесс, хоть и нет смысла в этом на колонках BBK. Знаю, что обязательно их сменю на лучшие.
                                                                  +1
                                                                  Я как-то пробовал попеременно сжимать-разжимать разнами енкодерами… чтобы проявились артефакты всех сразу… забавно получилось.

                                                                  Сейчас для себя разрабатываю такую систему: музыка хранится в формате FLAC на большом-большом диске. Оттуда она и слушается. Резервная копия хранится на другом физическом диске меньшего объёма в формате OGG, конвертирование происходит автоматически в фоне.
                                                                    0
                                                                    конвертирование происходит автоматически в фоне.
                                                                    А как? В линуксе небось?
                                                                      0
                                                                      Да, сейчас стоит ubuntu 8.04, но решение, в принципе, переносимое.

                                                                      Вдобавок к автоматичемкому конвертированию прикручена MySQL база файлов, директорий, тэгов с именами исполнителей и прочими параметрами, а также контрольными суммами файлов md5 и tth. Вы не представляете, как это упрощает и ускоряет поиск…
                                                                        0
                                                                        Отдельная база в SQL не удобнее встроенной библиотеки плеера, например, Foobar или Winamp. В Rythmbox тоже есть, но я ей не успел долго попользоваться.
                                                                          0
                                                                          Может и так, но используя MySQL я получаю переносимость, стандартные средства резервного копирования, возможность организации весьма гибких запросов. Скажем, может ли библиотека Winamp хранить, скажем, TTH-хэши мультимедиа-файлов? А ведь именно хэши зачастую являются идентификаторами файлов в файлообменных сетях.
                                                                      0
                                                                      а зачем такая резервная копия? чтобы потом ещё раз чем-нибудь пережать для прослушивания на другом устройстве? Я бы наоборот — ещё понял: под рукой хранить то, что умеет привычный плеер.
                                                                        +2
                                                                        Привычный плеер умеет FLAC — его и храню под рукой.

                                                                        ТАКАЯ резервная копия — разумный для меня компромисс между полным дублированием информации и полным отказом от резервной копии.
                                                                      0
                                                                      Кстати, мне все не дает покоя лослес на плеере. Хабра-меломаны, считаете ли вы это оправданным, и если да, то почему?
                                                                      Для себя я решил, что раз уж почти не могу в double blind test отличить ogg v9 от флака на плеере (cowon d2 + rockbox + sennheeiser ie4), то флак там не нужен. А вот на компе все-таки слышно разницу. Поэтому на плеер заливаю перекодированный лослес, а дома слушаю на нормальной акустике флак и прочее.
                                                                        0
                                                                        Если слушать плеер в метро или другом шумном месте — то всё равно, в каком формате.
                                                                          0
                                                                          Я тоже не отличу, скорее всего, FLAC от MP3 V0, но заливаю, все равно, FLAC — мне лень гонять туда-сюда форматы.
                                                                          (cowon d2 + rockbox + sennheeiser MX400 + бортовая магнитола Sony в машине)
                                                                            0
                                                                            lossless на плеере оправдан хотя бы тем что его перекодировать не нужно (при аппаратной поддержке, конечно)
                                                                              –1
                                                                              Зато жрет в 5 раз больше места. У меня рокбокс хоть даже и куе-списки понимает, но я все равно перекодирую все в огг — так даже есть надежда, что когда-нибудь мне будет не лень проиндексировать всю базу музыки (40гб) на плеере. 400 гигов на компе я ни в жизнь не рассортирую.
                                                                            +2
                                                                            Ну и к чему всё это?
                                                                            Кто в здравом уме будет кодировать файлы по 10-50 раз?
                                                                              +1
                                                                              И ещё вывод «может стать лишь одним из поводов задуматься о хранении домашней колекции музыки lossless форматах». Да никто не кодирует свою коллекцию по 50 раз, поэтому вывод не в тему. Вывод тут мог бы быть другой — «мне нечем заняться, поэтому я это всё и придумал».
                                                                              0
                                                                              А почему не @echo off?
                                                                                +1
                                                                                Видимо, чтобы некоторые команды (lame, oggenc, oggdec) всё же выводились в stdout.
                                                                                –1
                                                                                Количество скачиваний музыкальных файлов из статьи уже перевалило за 10000, так что судя по всему кому-то кроме меня это все-таки тоже интересно :)
                                                                                  +1
                                                                                  В каком-то из топиков была ссылка на файл с синусоидой 18 КГц — взрослый не услышит. Скачали её тоже не одну тысячу раз, наверное.
                                                                                  0
                                                                                  тому, кто додумается так оригинально проверять качество кодеков, нужно либо не знать, что такое четность багов, либо очень нестандартно мыслить :) респект
                                                                                    0
                                                                                    Посоветуйте, с какими параметрами кодера можно конвертировать mono, 16bit, 44100 в mp3 с максимально возможным битрейтом? В Sound Forge максимум получается 128. Можно больше?
                                                                                      –1
                                                                                      Попробуйте:
                                                                                      lame -V 0
                                                                                      Это должно дать наилучшее качество.
                                                                                      0
                                                                                      Вместо множества @ лучше сделайте echo off.
                                                                                        0
                                                                                        Как эксперт в области аудио, заявляю — данный тест, а соответственно и пост, что-то между абсурдом и глупостью…

                                                                                        Во-первых, VBR-кодирование само по себе вещь достаточно странная и имеет место быть только при ОООЧЕНЬ большом желании сэкономить немного на выходе.
                                                                                        Во-вторых, множественное VBR-перекодирование это уже нонсенс на грани помешательства — естественно звук будет ухудшаться с каждым проходом — логичнее было делать CBR-перекодирование и сравнивать выход.
                                                                                        В-третьих, накой такой тест вообще нужен с точки зрения практики? Пост напоминает скорее какие-то больные мысли и совсем не связан с заголовком. Что-то из области жёлтой прессы и псевдонаучных изысканий.
                                                                                        — зы: OGG уделывает старичка MP3 по всем параметрам кроме одного, технической поддержки. А то, что Вы здесь понаписали — бред!
                                                                                          –1
                                                                                          Глупость или нет, но эксперимент уже проделан :) Зачем этот эксперимент нужен, я описал в предисловии: чтобы каждый мог услышать самостоятельно ту самую разницу на любой акустике. А почему вы — эксперт — считаете, что все это вообще не имеет права на жизнь?
                                                                                          Что касается CBR, попробуйте:
                                                                                          mp3_xcode fortuna.wav fortuna_c256x99 99 "-b 256"
                                                                                          У меня результат получился ИМХО даже немного хуже варианта с VBR, хотя размер файла больше.
                                                                                            0
                                                                                            >> считаете, что все это вообще не имеет права на жизнь?
                                                                                            Думаю, потому, что это бессмысленно в условиях реальной практики применения lossless-кодирования.
                                                                                            Вот Вы упомянули, в качестве оправдания Ваших изысканий, что в настоящий момент не существует «идеальной акустики» позволяющей услышать все изъяны ужатого контента. Так вот, близкая к понятию «идеальная» существует — электро-, пьезо- и аэростатика! Изъяны кодирования конечно слышны, но только на низких битрейтах
                                                                                          0
                                                                                          Насчёт aoTuV версии. Он сильно оптимизирован под низкие битрейты (q3 и ниже), на больших же оптимизации практически никак не проявляются. ИМХО, для вашего теста стоило брать Oggenc2.86 использующий libVorbis v1.3.1.
                                                                                            –1
                                                                                            Я пробовал libvorbis 1.3.1 для этого теста, но на высоких битрейтах он показал себя примерно так же, как и aoTuV. Даже при q10 в результате звук сильно искажается. Думаю, причина в том, что в первых версиях aoTuV был реализован какой-то «улучшайзер» (нечто вроде лёгкого эквалайзера), который затрагивает все битрейты. А поскольку код aoTuV b2 был перемещен в libvorbis с версии 1.1.1. Именно поэтому при q10 они дают плохой результат. А GT3 основан на libvorbis 1.0.0 (ясное дело, без кода aoTuV), поэтому при максимальном качестве (похоже, из-за отсутствия «улучшайзеров») даже после 1000 перекодирований дает отличный результат.

                                                                                            Only users with full accounts can post comments. Log in, please.