Как стать автором
Обновить

Комментарии 181

Забавно, что тот же mp3 для сравнения не воткнули.

А ведь институт Фраунгофера так старался, психоакустическую модель исследовал, кодек оптимизировал. К тому же отчислений теперь платить не надо. Да и коэффициент сжатия под канал подстраивать не возбраняется. Ну и лосслесс ради чего? Чтобы слушать на полуваттном среднечастотном монодинамике?

Это же все для сервисов, а не для личного пользования. Если есть услуга лослесс, то желательно и хранить только его.

А ведь институт Фраунгофера так старался, психоакустическую модель исследовал, кодек оптимизировал.

Ещё бы gapless playback запилил прямо в стандарт, а не в виде отдельных несовместимых друг с другом опциональных атрибутов отдельных кодеков — было бы вообще шикарно.

А до той поры для портативного прослушивания ogg vorbis получше.

Ну и лосслесс ради чего? Чтобы слушать на полуваттном среднечастотном монодинамике?

Прямо сейчас сижу дома в ath-ad700x с лосслессом. Наполовину (по сравнению c mp3) — ради гаплесса, наполовину (по сравнению с любым lossy) — ради чувства обладания.

На самом деле ffmpeg делает mp3 от LAME GAPless, как раз то специальное расширение. А вот от Apple iTunes — да, тут нужен патч.

Ну вот, предположим, хочу я скачать альбом с рутрекера или с redacted. Я могу выбрать flac, и всё будет просто работать (и звук будет тёплым, приятным и шелковистым), а могу… как мне узнать, в данном конкретном выложенном mp3 есть эти gapless-расширения, совместимые со всеми моими плеерами (gstreamer на компьютере, изредка mpv на другом компьютере, rockbox на портативной железке), или нет?

Mpv это фактически ffmpeg :) так что да, они все gapless, как и mpc-hc. Про rockbox — тоже скорее всего, там даже aac патчи были для aac, что уж говорить про mp3.

А вот aac не gapless как и eac3. То есть если метаданные есть — вначале лишнее аудио отрежет, а в конце нет, он не умеет. Chrome пришлось добавить свой код для этого поверх ffmpeg, но даже там HE AAC имеет баги. Из-за SBR.

Вот патч для mp3 от iTunes, но такой mp3 это огромная редкость:

https://patchwork.ffmpeg.org/project/ffmpeg/patch/20220128052107.1678032-1-kode54@gmail.com/

Их кто-то платил?

Производители коммерческого софта - да. В конце 90-х - начале нулевых были в моде мультимедийные комбайны, распространявшиеся по схеме shareware. При этом просто воспроизведение mp3 было бесплатным, а вот конвертация в него, скажем, с CD - уже за деньги.

На графиках видно, что степень сжатия lossless-кодеками составляет 40%-70% от исходного wav-файла. Формат mp3 сжимает сильно лучше (15%-25%), на его фоне остальные смотрелись бы бледно. Все ухищрения, описанные в статье, влияют на скорость запаковки-распаковки и на вычислительную нагрузку, а не на степерь сжатия.

Или Opus, который выдаёт аналогичное mp3 качество при примерно вдвое меньшем битрейте

он выдает аналогичное качество при вдвое меньшем битрейте на голосовых данных с низким битрейтом! То есть, далеко не всегда и далеко не везде. Голос он жмет специальным способом. А на обычной музыке нормального качества- он такой же, как мп3- если нет голоса- то в опусе то же косинусное преобразование и та же отсечка и квантизация с архивированием, просто чуть более эффективный алгоритм архивации.

ну и ещё для кучи в сравнение архиватор какой-нибудь надо воткнуть, может лучше окажется

И зачем всё это, если mp320 95% людей от оригинала не отличает? При этом объём всё равно меньше и воспроизводится на любой табуретке.

А если этот mp3 320 воспроизводится через устройство с блютусными наушниками/динамиками, где до сих пор, ЕМНИМС, все кодеки с потерями? Т.е. звук в качестве "еще чуть-чуть, и будет ухудшение" пережимают с потерями ещё раз.

aptX Lossless?

Ну, допустим, он действительно lossless, а не как описано в https://habr.com/ru/articles/433724/
Но что с того исправным (и в основном устраивающим хозяев) устройствам N-летней давности, где его нет?

Так 320 - это не "ещё чуть-чуть", это "с неплохим запасом". И уж чем его точно не испортить, так это наушниками.

PS. Не совсем точно выразился. Имел ввиду, что блютус-наушники настолько изменят звук, что разницы не будет, был там у вас mp3 или lossless.

100%

mp320 95% людей от оригинала не отличает?

Остальные 5% его тоже не отличают (двойное слепое тестирование свидетель) — но надо ж как-то перед деффками повыйоживаться быть не как все!

Допустим существование нескольких людей с "абсолютным слухом".

"Абсолютный слух" это не "слышит абсолютно всё", а "умеет слышать абсолютное значение частоты, а не только относительное".

То есть некто, кто отличит отдельно звучащую (без контекста) ноту "до" от такой же отдельно звучащей "до диез" обладает абсолютным слухом, хотя точность полтона грубовата, конечно, обычно подразумевается большая точность. А если он может на слух отличить интервал три тона и три тона плюс 2 цента (сотых долей тона), но не может сказать какая там нота - это относительный, а не абсолютный слух.
Для музыкантов, у которых инструмент позволяет издавать непрерывный набор частот (в том числе певцов, скрипачей и пр.) обладание абсолютным слухом даёт заметное преимущество. Для гитаристов-пианистов это преимущество не так значительно.
При этом слух - что относительный, что абсолютный, в целом заметно тренируется (хотя, наверное, зависит от врождённых особенностей).

Потому и в кавычках ;)

То есть некто, кто отличит отдельно звучащую (без контекста) ноту "до" от такой же отдельно звучащей "до диез" обладает абсолютным слухом, хотя точность полтона грубовата, конечно, обычно подразумевается большая точность. А если он может на слух отличить интервал три тона и три тона плюс 2 цента (сотых долей тона), но не может сказать какая там нота - это относительный, а не абсолютный слух.

А я думал, что он как частотометр: он не просто различает стандартные частоты нот, но и может не раздумывая назвать эту ноту вслепую. Вследствие этого, у него повышенная разборчивость в спектре, что позволяет ему прилагая небольшие ментальные усилия вычленять из сложного набора звуков нужное и концентрироваться на этом. Например, на конкретном инструменте в оркестре при одновременном звучании всего оркестра.

Именно частотометр в обычном понимании термина "абсолютный слух". Услышал и назвал ноту. Всё.

прилагая небольшие ментальные усилия

Верно. Если партитура незнакома. Ноль усилий, если знакома.

обладание абсолютным слухом даёт заметное преимущество

Это какое? Для исполнителя ровно одно преимущество — не нужен камертон/тюнер для настройки инструмента (любой струны, от которой строятся остальные при помощи интервального слуха, без которого, вот, обойтись вообще невозможно). Ещё можно вычислить скорость транспорта, из которого играет музыка. (Правда, это музыкантам, обычно, не очевидно).

Главное преимущество абсолютного слуха проявляется в молодости для парней в общении с очень любящими музыку девушками. Вот тут да, стоит того. Особенно учитывая то, что абсолютный слух развивается сам по себе и не требует дополнительных усилий. Аж приятно вспомнить ;-)

а им слышно не все эти вот тонкости кодирования, им слышно расстройку исходных инструментов, которые играли ту запись, которую кодировали в лослесс, потом им слышны искажения при записи, вносимые микрофонами и усилительными трактами записывающего устройства, потом- искажения усилительных трактов устройства воспроизведения, потом- искажения, вносимые физикой работы самих динамиков и их входных фильтрующих цепей, потом- искажения, вносимые кабелями из бескислородной меди. И вот после всех этих искажений где-то там в хвосте плетутся искажения от mp3-320kbps. 320килобит/с- это 2 канала по 40 килогерц верхней частоты с 4хбитной дискретизацией, забитых полностью хаотическим звуком, но для реального звука в эту полосу влезает 16бит-дискретизация, которая дает помехи на два порядка слабее, чем искажения любых аналоговых фильтров, стоящих в каскадах усиления и даже меньше, чем нелинейные искажения самих усилителей.

фактически мпз320 на сложном женском вокале с инструментами начинает резать частоты где-то с 16кгц. то есть- это значит, что на спектрограммах сигналов становится заметна разница именно в этом диапазоне частот- выше 16кГц (это важно- разница не слышна кому-то там с идеальным слухом, а разница видна на спектрограммах, снятых измерительным оборудованием!). но прикол в том, что люди, которые могут себе позволить купить акустическую систему, на которой эти искажения будут различимы и при этом будут слушать музыку, в которой этот диапазон различим в том диапазоне громкости, в котором он различим- уже не слышат этот диапазон звуков! (это надо слушать классику до 35лет, если после 35- то уже все, ухо не чувствительно к этом частотам, а если это рок- то их там убивает снижение чувствительности уха при высокой громкости- не слышит человек шепот на рок-концерте). Чтоб это слышать- надо сидеть слушать музыку в специально оборудованном помещении на высококачественной акустике и средней громкости (найдите такого меломана :-)), и уж точно никак не в наушниках- потому что никакие вообще в принципе наушники не могут обеспечить достаточную равномерность АЧХ, а про ФЧХ я вообще не заикаюсь- там все еще хуже даже на идеальной теоретически предельной акустике- Вы ее дома просто технически никогда не настроите с нужной точностью.

А потом спрашиваешь такого "слышащего" - а это там гибсон или фендер играет? И всё, поплыл слышащий.

Ортогонально к абсолютному слуху. Это тембровый слух.

Я не про то. Вы же наверняка отличите на слух скрипку от виолончели? Значит можете оценивать качество записи "по нюансам". Это объективно и проверяемо. А если аудиофил слышит "воздушные высокие" - это не объективно, не проверяемо и неизмеряемо. И скорее всего существует только в его воображении.

А абсолютный слух - это про ноты и музыкантов, а не про качество звука. Когда музыкант слышит не частоты, а ноты, и тональность заодно может определить, и всё это записать на бумажке.

Да, изините, предыдущий комментарий писал про абсолютный и смешалось в башке.

наверняка отличите на слух скрипку от виолончели

А вот гобой от кларнета в верхнем регистре в оркестровом тутти будет сильно веселее :)

а им слышно не все эти вот тонкости кодирования, им слышно расстройку исходных инструментов, которые играли ту запись, которую кодировали в лослесс, потом им слышны искажения при записи, вносимые микрофонами и усилительными трактами записывающего устройства, потом- искажения усилительных трактов устройства воспроизведения, потом- искажения, вносимые физикой работы самих динамиков и их входных фильтрующих цепей, потом- искажения, вносимые кабелями из бескислородной меди. И вот после всех этих искажений где-то там в хвосте плетутся искажения от mp3-320kbps.

Забавно то, что электрический тракт уже полвека по сути за пределами биологически регистрируемыми искажениями, микрофоны тоже уже давно за этим же порогом. И только обратное преобразование фурье сигнала в давление всё ещё вносит львинную и биологически различимую долю искажений. Всё верно, именно АС сейчас являются криптонитом качественного звука. И это, как уже сказали выше, без относительно специально подготовленного к звуку помещения. Ковры на стенах и полу из СССР тут играют гораздо больше положительной роли, чем крашенные стены и фасады бумажной мебели из Икеа.

за пределами биологически регистрируемыми искажениями

Вот тут вот я с Вами не согласен- как раз таки в массовой пользовательской электронике эти самые искажения, вносимые трактами- заметны, хоть и узкой прослойке людей. Но вот эта вот "ламповость" и "теплота звука"- она имеет вполне себе измеримые и слышимые характеристики, связанные как раз-таки с нелинейными искажениями, вносимыми электрическим трактом. Я как-то статейку по этому поводу читал- вкратце- все тракты вносят кратные гармоники, но внезапная особенность- в том, что аналоговые тракты вносят преимущественно квадратичные искажения, которые дают на выход четные гармоники сигнала, а цифровые тракты- дают отсечки, которые к четным гармоникам добавляют и нечетные гармоники. И вот наличие именно нечетных гармоник- третьей и пятой- воспринимается ухом как "металлический", "жесткий" звук. А наличие слабых вторых и четвертых- как "теплый ламповый". ламповые усилки нечетные гармоники почти не дают :-). Высококачественные усилители (высококачественные!) имеют низкий суммарный коэффициент нелинейных искажений (доли процента), а потом у них звук воспринимается как "холодный". и это тоже объяснимо- меломаны привыкли к тому, что звук обогащен вторыми и четвертыми гармониками, и в реально классном звуке им кажется чего-то нехватает. как человеку, привыкшему к пересоленной еде нормальная кажется несоленой.

Кроме нелинейных искажений есть еще неоднородность усиления, для усилителей высшей категории сложности по ГОСТу неравномерность усиления по частоте должна быть в пределах 0,3дБ, это примерно 7% по мощности, и это вполне себе слышно тренированному слуху. но это лечится эквалайзером :-) он вообще для этого и придуман.

Вот тут вот я с Вами не согласен- как раз таки в массовой пользовательской электронике эти самые искажения, вносимые трактами- заметны, хоть и узкой прослойке людей. Но вот эта вот "ламповость" и "теплота звука"- она имеет вполне себе измеримые и слышимые характеристики, связанные как раз-таки с нелинейными искажениями, вносимыми электрическим трактом.

Так о том и речь! Аппаратура давно за гранью - это утверждение не противоречит сказанному вами. Но эта самая "за грань" оказалось мало кому нужна. В профессиональной среде (студии звукозаписи и прочее) оно там прописано прочно и давно, а в бытовой, оказалось, что эта самая "за грань" не греет душу, ибо "сухая", "без жизни как цифра" и прочие эпитеты слушающих. Когда оно поджуживает и ты слышишь там что-то артефачное в паузах вместо сухого вакуума по факту - оно так приятнее на слух, ведь в реальности мало кто из индивидуумов реально бывал в безэховых и полностью заглушенных помещениях, чтобы понимать что это такое. Но даже там человек слышит артефакты, которые идут от его собственного тела.

ну там часок-другой посидеть- еще и такие артефакты услышишь...

И это без употребления всяких там запрещённых веществ! Камера депривации чувств, кстати, отличная штука в правильных руках.

в бытовой, оказалось, что эта самая "за грань" не греет душу

Даже проще. В бытовой технике есть ещё куча факторов, влияющих на выбор покупателя, помимо максимально точного воспроизведения. От отсутствия привязки к конкретному помещению до возможности использовать разные источники, включая стриминговые. Ну и итоговая стоимость системы в целом, разумеется.

Именно поэтому небольшие колоночки, но по штуке на комнату и с wifi, решительно вытеснили в массах многоканальную акустику в отдельной комнате.

Именно поэтому небольшие колоночки, но по штуке на комнату и с wifi, решительно вытеснили в массах многоканальную акустику в отдельной комнате.

При этом, некоторые из них пытаются научиться в многоканальность.

в какой-то момент Вы решили смешать частотный диапазон ("выше 16 кГц) с динамическим ("шепот на рок-концерте"). И проблема mp3 далеко не в фильтре ВЧ выше 16 кГц.

не, я их не путаю. Я же специально написал, что на спектрограммах разница становится заметной в этом диапазоне частот- то есть, в этом диапазоне есть в достаточном количестве гармоники малых амплитуд, которые мп3 обрезает, а лослессы оставляют и эту разницу заметно в данных измерительных приборов (ну, точнее- ее заметно в данных спектрального анализа вав-файлов, полученных из мп3 и лослессов). в диапазоне до 16кГц таких гармоник на спектрах незаметно. А это значит, что даже если они там квантизируются- то порядок вносимых искажений (изменение энергии соответствующих гармоник) слишком малый, и для того, чтобы оценивать их реальный вклад- недостаточно просто сказать, что мп3 че-то там обрезает, нужно подробно эти искажения измерять и оценивать (чего ясен пень никто не делает), а вот это вот "мп3 обрезал звук"- можно точно услышать на слух именно в этом диапазоне- выше 16кГц, который большинству слушателей реального лослесса просто недоступен.

И проблема mp3 далеко не в фильтре ВЧ выше 16 кГц.

а в чем проблема mp3?

а в чем проблема mp3?

Может, в принудительном применении психоакустики даже на больших битрейтах?

это какие-то непонятные для меня слова. ну применяют они там черную магию, паранормальные технологии и инопланетные знания, и чо? для высоких частот порог тишины выше, поэтому логично, что на спектрах музыки (которая не тишина никак) именно в высокочастотной области заметно обрезание- там довольно большая амплитуда сигнала оказывается под порогом и обрезается. вот и вся, по большому счету, психоакустика. Есть еще маскирование тонов, но его на спектрах не заметно, поэтому просто так записать его в недостатки мп3 нельзя, в теории оно есть, а на практикие- четаката незаметно. Шум квантования итоговый все равно ниже некоторого предела, и чем выше битрейт- тем ниже этот предел и ниже вносимый шум квантования, который и есть собственно те самые вносимые искажения формата. И есть довольно обоснованное предположение, что на битрейтах выше 128кбпс- шум квантования ниже физических шумов от окружающей действительности, а потому и нет никакого вообще практического смысла повышать точность воспроизведения сигнала выше чем у мп3-320.

Многие под артефактами МР3 128к имеют в виду режим Joint Stereo. Там действительно по ВЧ фазы плывут и на слух артефакты ужасные. Я помню лишь одну программу энкодер, которая позволяла рулить всеми флагами одновременно и не применяла ФНЧ перед сжатием. Но и сжимала она крайне медленно. 20 лет назад на Celeron она 5 минут песню сжимала полчаса, в те времена Lame уже научился быть чуть быстрее реалтайма. Однако МР3 128к Stereo она выдавала на голову выше по субьективному качеству, чем у оригинального франхоферского (который ещё и блюпал если битрейта не хватало чтобы впихнуть ВЧ) или Lame, который для малых битрейтов принудительно врубал Joint Stereo и резал ступенчато на 16к и на 10к (для ещё меньших битрейтов).

Пощупать можно тут: https://cloud.mail.ru/public/PPhT/YcGpUPB7y

Нагуглил вот ещё: https://www.rarewares.org/rrw/soloh.php https://web.archive.org/web/20170103170919/http://www.euronet.nl/~soloh/mpegEnc/

абсолютно с Вами согласен. на низких битрейтах на слабых машинах двадцать лет назад это было аудиально наблюдаемый недостаток восстанавливаемого по mp3 звука. но сабж-то про то, что нужно от нашего, современного mp3-320kbps отказаться, якобы у него и сейчас звук плоховат, якобы это сейчас у mp3-320 восстановленный звук имеет какие-то недостатки. И получается, что есть очевидные недостатки у mp3-128- их слышно даже мне, есть эмоциональные утверждения, что есть какие-то недостатки у mp3-320, но их никто не слышит при слепых тестированиях, и есть очень скудная база измерений, в которых видны искажения mp3-320, но эти искажения видны только на высокоточных измерениях. В этих условиях я не вижу повода считать, что мп3- это звуковой Карфаген и должен быть уничтожен. Что касается режимя Joint Stereo- это, кмк, не недостаток стандарта- это наборот, его достоинство- этот режим позволяет формату на низких битрейтах чего-то хреновенько, но выдавать, а без этого джоинта- на низких битрейтах этого хреновенького даже хреновенько выдадвать не получалось бы. но притягивать фичу от жидких битрейтов как недостаток формата на жирных битрейтах или формата вообще в целом- имхо антинаучная ересь.

Абсолютный факт, у меня есть несколько знакомых музыкантов, они сами свои же треки на своём оборудовании в 320 и лосслесс не различают. А из слушателей <irony> кому ранее не продали оверхайтек лосслесс плеер все равно с удовольствием купит винил или кассету.

да и mp3 128 тоже много кто не отличит

128 всё же отличают. Лично для меня где-то на 160 различия пропадают. Но всё равно жму в 320 - потому что нет смысла настолько уж экономить.

мне медведь на ухо наступил, разницу между 32 и 64 я слышу и на телефоне, между 64 и 128- слышу в наушниках или больших колонках, а вот между 128 и 256 и 320- уже не слышу, ну 128 иногда бывает "как-то странно" воспринимается, но все что выше- я уже от флака не отличаю вообще ни при каких условиях.

Согласен с коммеетатором выше. 128 уже слышно хорошо, что тембры искажаются.

mp3 до сих пор популярен по одной неочевидной причине: в результате сжатия спектр становится более разреженным, фронты более мягкими, а шумы подавляются. Мозгу это проще воспринимать и легче анализировать. Ну и - в потоком вещании lossy живее всех живых.

Причина указана неверно. Правильно: до сих пор используются (авто)магнитолы невоспринимающие другие кодеки.

Одно другого не исключает. Я к такому выводу пришёл как раз таки после прослушивания флаков.

Люто плюсую. Закидывал для интереса одни и те же треки в MP3 и FLAC. Что в машине с обычной магнитолой 1 DIN, что в машине с не самой простой акустикой разница была скорее психологически-самоубедительной. Да и всё же музыка в машине - это фон. Вряд ли кто-то паркуется и с закрытыми глазами слушает Бетховена.

музыка в машине - это фон

Фон на фоне шума, вибраций, и невозможности разместить слушателя примерно по центру звукового поля. Борьба за автозвук - достойное хобби, однако борьба гарантирвано проигрышная. Виброшумоизоляция имеет пределы применимости, ограничивая динамический диаппзон снизу, а сверху динамический диапазон ограничивает утомляемость - это непреодолимо в принципе. Несимметричность слушателя, наверное, можно как-то компенсировать какими-то обработками, но до какого-то предела проще оставить все как есть. Лучше просто тишина.

"В соревновании по автозвуку во дворе многоэтажки в три часа ночи победила бутылка из-под шампанского, брошенная с верхнего этажа"

"Борьба за автозвук ... Лучше просто тишина."
А вы, батенька, однако тонкий ценитель тишины. Бутылочку не теряли?
Тишину тоже люблю. Автозвук, впрочем, отторжения не вызывает (кроме клинических случаев), хотя сам ни разу не автомобилист.
За десятилетия отработаны и портативные источники звука, включая всяческие приёмники от ламповых до спутниковых, разнообразные магнитофоны, довольно качественные усилители и акустика, включая многоканальные, CD-чейнджеры на десятки дисков, цифровые медиасистемы, голосовые помощникицы и многая прочая.
Сонную хворь автозвук прогонять помогает в дальних одиночных поездках...
А ещё спасибо автозвуку за популяризацию усилителей класса D.
А ещё же Road Active Noise Cancellation отдельно для водителя и пассажира...
Всё в топку? Не жалко?

технически, Вы сейчас заявили, что мп3-сжатие улучшает звук. скажем так- это довольно оппортунистическая точка зрения.

Не звук, а восприятие информации, в него заложенной. Разница принципиальная.

а шумы подавляются.

Обожаю слушать кассеты на магнитофонах 2-3 класса ибо шум он как дизеринг работает для меня: психоакустика его сама нивелирует после привыкания (ой, простите, "разогрева").

mp3 320 - с головой!

Люди, прогревающие провода, не одобряют ваш комментарий.

Ну вот вы смеетесь, а выше вон спектрами меряются. Это какой-то новый виток аудиофилии.

вот вы смеетесь, а выше вон спектрами меряются.

Ну, хоть не пиписьками — уже хлеб...

статья про лосслесс - комментаторы про мп3. стыдно

давайте обсудим шумы квантования

не в этом дело. В статье обсуждаются технические аспекты лосслесс-кодирования. К чему эти мнения, что мп3 всем хватит с головой? Статья банально не об этом.

Да я не против лосслесс. Просто не вижу реальной возможности да и необходимости тотальной замены mp3 - ведь он не создаёт артефактов, присущих другому стандарту-долгожителю, хоть и для изображений - jpg ("мазни", повторов контрастных контуров), частично исправленных в jpg2000, так и не распространившемся сколько-нибудь заметно.
Году в 2008 видеокодеком на основе jpg2000 самостоятельно заменял покалеченный погромистами xvid в системе аналогового видеонаблюдения - результат был заметно лучше и компактнее, но с тех пор не встречал.

Внедрение кодеков КМК сейчас может педалировать либо в своих целях популярный сервис типа Youtube, как произошло с AV1 ради поддержки высоких разрешений (прощай аппаратное ускорение видео на многих всё еще бодрых ПК), либо создатель популярного браузера, да и то скорее при очередной крупной смене стандарта html. Даже альянсы производителей бытовой техники кажется неспособны к столь масштабному действу.

В обработке же звука таких заметных подвижек, как у видео не наблюдается, последнее масштабное обновление - наверно многоканальность. Тотальной поддержки которой нет до сих пор. Возможно Netflix предоставляет многоканальный аудиоконтент, Youtube пока этим явно не озабочен.
Т.е. каналов в мейнстриме не добавилось, 44 кГц дискретизации всё ещё должно хватать всем, разрешение как у видео драматически не менялось, к особенностям mp3 за прошедшие десятилетия большинство прислышалось.
Ну и техники hi fidelity не так чтобы и много, в процентном отношении. Для большинства же гаджетов КМК лосслесс более или менее бесполезен.
Возможно, прогресс в обработке звука наступит с применением нейросетей - разделение вокала, отдельных инструментов, эффектов и фонового шума с его подавлением, реконструкция многоканальной звуковой картины и воспроизведение оптимальным способом на имеющемся в наличии звуковом оборудовании. Будем посмотреть.

Так нейросети могут пожать звук до считанных байт, до собственно промта "четкая музыка с басами и не слишком умным текстом". И далее восстановить по аналогии с сервисами генерации музыки SUNO или UDIO до композиции которую слушатель не отличит от оригинала. И поток будет не мегабитный, не 320 кбит, не 9600 как в GSM, а сотня байт на композицию. А то что это сгерерировано на ходу ИИ, тоже не каждый отличит, тем более для музыки фоновой.
Аналогично и с видео. Исходник даже может быть не сценарий, а промт, "фильм про войну где наши победили". На основе ранее просмотренного контента и лайков в соцсетях ИИ может на ходу сгенерировать контент идеальный для пользователя (с уклоном с стимпанк, космооперы и т.п.) А террабайты ранее снятого видео, шедевры культурные становятся не особо нужны, разве что для обучения новых моделей.
Ну и качество техническое картинки может быть недосягаемым, 8К при 200Гц, звук 3D с условно не ограниченным числом каналов.

В статье обсуждаются технические аспекты лосслесс-кодирования. К чему эти мнения, что мп3 всем хватит с головой? Статья банально не об этом.

Статья содержит в начальной части утверждение, таки являющееся неотъемлемой частью информации, содержащейся в статье:

Нет смысла подвергать музыку калечащему сжатию с потерей информации.

На него народ и реагирует. Причем вполне законно и обоснованно.

Статья про кодеки, не про лосслесс.

Лосслес не существует, современные микрофоны, АЦП, тракты - всё приводит к потерям.

И когда обсуждают только потери после оцифровки, не учитывая потерь при записи, и, что ещё более важно, при воспроизведении - вот это стыдно.

Вы же знаете, что в случае воспроизведения через блютус или HDMI нет и не может быть лослесс?

через 'обычный' HDMI или когда он физический интерфейс для iis / i2s

HDMI поддерживает передачу звуковых данных без потерь, LPCM так с самой первой версии.

HDMI нет и не может быть лослесс?

В смысле ? Реализация поддержки всяких там Dolby/DTS * в HDMI опциональна, а вот PCM (который как раз и есть несжатый loseless в чистом виде) - базовое требование.

Всё, разобрался. Действительно, никакого воспроизведения звука в современном мире у конечного пользователя в системе 5.1 лучше, чем HDMI быть не может, только он позволит гнать 196кSps с разрядностью 32 бита. Остальные просто не смогут. Да и звуковухи редко смогут что-то быстрее чем 44.1 kSps.

Так что весь этот "loseless в чистом виде" ограничен тупо воспроизводящей аппаратурой, и смысла в кодеках просто нет.

Да и звуковухи редко смогут что-то быстрее чем 44.1 kSps

Я так понимаю, samples тут эквиваленты герцам в описаниях устройств. Если да, то даже не очень новые карточки за пару сотен долларов в direct mode могут без малого на порядок больше.

Частота дискретизации 44100 значит максимальная частота 22050 Гц. По факту меньше, потому там фильтр низких частот стоит. Другие стандартные значения это 48КГц, 96КГц, 192КГц. Более высокие частоты имеют смысл для оцифровки и нелинейной обработки звука. Слушать хай-резы не имеет смысла, потому что человек - это не летучая мышь и 20К для него предел чисто by design. По факту в 40 лет и выше 15К никто не слышит. А те кто говорят что слышат - мягко говоря фантазируют, потому что объективные тесты проваливают.

По факту в 40 лет и выше 15К никто не слышит.

Мне ещё интересно, что именно там такого слушают, где им 15кгц надо. Из обычной музыки мне известны флажолеты на скрипке, там до 5кгц или что-то около может доходить. И это уже довольно специфический звук.

Верхние обертона.

Вы же догадываетесь, что инструменты производят не чистую синусойду?

Ещё в этнической, народной, традиции пения есть вот эти вот резкие вскрики, особенно женские. Их современная звукозаписывающая аппаратура просто неспособна нормально записать - такое там количество обертонов выше 8 кГц. В записи это просто писк. Вживую - очень интересный, объёмный эффект. Существует гипотеза, что именно из-за сложности передачи женского фальцета долгое время в музыкальной индустрии почти не присутствовал женский вокал, когда в кабаре и кабаках он составлял 80%.

С большим трудом верится, что современное оборудование не справляется с диапазоном человеческого слуха, если честно. Беглый гуглёжь: https://www.thomannmusic.com/sanken_co_100k.htm Цена посильная даже для человека, для которого музыка — хобби (топовые/кастомные инструменты стоят заметно дороже), не говоря уже про студии или профи.

Существует гипотеза, что именно из-за сложности передачи женского фальцета долгое время в музыкальной индустрии почти не присутствовал женский вокал, когда в кабаре и кабаках он составлял 80%.

Гипотеза выглядит крайне слабой, потому что, во-первых, женский вокал не обязан быть фальцетом; во-вторых, аудитория кабаре и кабаков, полагаю, в значительной степени мужская, и смотреть на женщин им приятнее (а кто там что поёт уже дело десятое для рядового посетителя, особенно после пары кружек).

Микрофон отличный, да! Осталось к нему АЦП на 200 ksps, а лучше на 0.5Msps и с глубиной 32 бита и мы дяже сможем данные с него оцифровать. И вот тут то оборудование даёт маху!

Про гипотезу, тут "всё не так однозначно". Звукозаписи тоже покупали мужчины. Слабой она выглядит потому, что в начале прошлого века у независимых женщин были проблем в продвижении куда более существенные, чем АЧХ систем звукозаписи.

и с глубиной 32 бита

Шутить изволите?

а лучше на 0.5Msps

Ради бога: https://www.chipdip.ru/product0/8002949889

И я ещё раз позволю себе посомневаться, что вам нужно писать 100к частоты чтобы воспроизвести потом "объёмный эффект женского фальцета" (ещё вопрос, какая его часть приходится на плацебо)

Ради бога: https://www.chipdip.ru/product0/8002949889

А теперь звукозаписывающее оборудование на такой?

И я ещё раз позволю себе посомневаться, что вам нужно писать 100к частоты чтобы воспроизвести потом "объёмный эффект женского фальцета"

И я сомневаюсь. Но раз уж есть микрофон с такой частотой, то неплохо было бы данные с него оцифровать ... как это ... loseless.

Перкуссия.

Вот, кстати, да!

До 4кгц флажолеты на скрипке (которые вообще играются). Но можете провести экперимент и обрезать звук скрипки фильтром, чтобы выше 4кгц ничего не было. ))

20к+ в аппапатуре нужны не совсем для человека. Они нужны для улучшения импульсной характеристики. А в результате получается разборчивость воспроизведения, особенно при резком перепаде громкостей. Отмечу, что не всем гармоническим колебаниям нужна эта характеристика, она больше для комбинирования таких звуков.

считаем, что статья началась с комментария

Для реального плюрализма нужен кто-то с кабелями из бескислородной меди

«Проведите мне кабели под акустику на одну розетку прямо из щита» - «Но ваши текущие розетки питаются от того же щита!» - «нет, звук будет другой»

Реальный кейс.

Так звук же зависит от того, с какой электростанции электричество поступает. Если с атомной - то это только электронику слушать, если с гидро - то звук будет ближе к природе, тепловая даёт тёплый звук, солнечные батареи обеспечивают яркое звучание, а ветряк даёт воздушное.

Мне нравится слушать группу The Chemical Brothers отключивсшить от внешней сети, получая энергию со свинцово-кислотного аккумулятора ))

От кислотного аккумулятора надо всякий acid слушать.

А Infected Mushrooms выходит послужать только от генератора на природном метане.

Всё верно: при проектировании аппаратуры следует все узлы питать из одной точки по схеме звезда. И точка должна быть в аккурат на выходе блока питания. Это работает на всех уровнях: от внутрянки усилителя до разводки питания квартиры, района, страны.

Ага, конечно.

И землю, и питание - всё тащить звездой. Фильтры же придумали трусы!

Ещё желательно делать всю проводку неразъёмной, чтобы не вносить рассогласование в частотные схемы по питанию. К мобильному телефону припаять провод напрямую от электростанции.

А зачем бороться с порождёнными помехами, если можно не порождать эти самые помехи?

На всякий случай добавлю /s. Я вижу не только лишь все распознали его в предыдущем моём сообщении.

Когда целая группа звуколюбов выдаёт абсолютно аналогичные по разумности заявления на полном серьёзе, сложно отделить сарказм от маразма. Вам надо было очень сильно увеличить безумность своих заявлений. "Следует тащить электричество не от щита на лестничной клетке, а от входа на дом, без этого наводки от соседей слишком сильные"

Такая нарочитось была бы слишком гротескной.

Из изотопночистого бескислородного серебра.

Или, ультрачистый оптический кабель. Хотя бы.

Или ультрачистый оптический кабель.

Из песка, собранного на побережье Антарктиды!

статья про лосслесс - заголовок про выкидывание на свалку истории мп3. стыдно

В заголовке статьи содержится утверждение, что якобы MP3 устарел. Не заметили? "стыдно"

мне хватило ума статью прочесть, прежде чем в комменты лезть

статья про лосслесс - комментаторы про мп3. стыдно

А по-моему, стыдно, когда статья с названием «MP3 устарел» вместо аудио-сэмплов в разных кодеках проиллюстрирована графиками. А это, извините, первый признак ТЛЗ. Музыка нужна, чтобы её слушать, а не графики рассматривать. Вы же не будете, допустим, писать про превосходство PNG над JPG, и иллюстрировать графиками, не показав ни одной фотографии котика / скриншота диалога / whatever.

И да: пока разница в цене телефона со 128 и 256 гигабайтами составляет сто долларов, то, что место теперь ничего не стоит — изрядное преувеличение. И если бы я хранил музло не в .mp3/320, а во FLAC, папка с ним весила бы не 30 Гб, а 75 Гб.

И да: пока разница в цене телефона со 128 и 256 гигабайтами составляет сто долларов, то, что место теперь ничего не стоит — изрядное преувеличение

Во первых, есть телефоны с дыркой для microSD. А там хоть терабайт втыкайте.
Во вторых, есть плееры, тоже с дыркой для microSD. Есть и с блютусом. И гораздо дешевле ста баксов при вполне качественном звуке.

А там хоть терабайт втыкайте.

Воткнуть то можно, но очень быстро выяснится, что поддерживается максимально только 32ГБ SDHC.

В железке старше лет... ну, допустим, десяти - возможно. Сходу вспомнился FIIO X3 m2 выпуска 2015 года (как раз 10 лет) - до 128гиг понимал официально, а фактически жрал и 256.
У новых железок (кроме, наверное, какой-то откровенной копеечной дряни, и то не уверен) с поддерживаемым объёмом карточки проблем нет.

Судя по логу изменений и апгрейдов известной библиотеки FF.c от Чена для организации доступа к xFAT во встраиваемые системы могу поспорить с вами. Там изменения каждый год почти, самое значительное - переход на uint64_t в 2019м. И при этом она имеет ключи сборки для упрощения функционала, чем все пользуются.

Но тем не менее - недорогую железку с поддержкой больших карт найти не проблема.
Одна такая у меня в кармане живёт.

Про блутус же написали, что он сам с потерями. Я погуглил по словам is a2dp lossless or lossy и нашёл, например, вот такое обсуждение: https://www.reddit.com/r/AppleMusic/comments/12ro3z1/lossless_audio_with_bluetooth/ То есть, качаем покупаем lossless, чтобы потом слушать его с потерями по блутусу, хороший план.

И я всё равно считаю, что есть разница, когда альбомы одного исполнителя весят 1 Гб или 2.5 Гб. (Не поленился, посмотрел средние цифры у себя). Даже не смотря на возможность воспользоваться внешней карточкой, что я всячески одобряю (не покупайте телефоны без слота под карты!).

Помнится, была такая система 5.1: квадро + центральный динамик + сабвуфер.

Вот только всё это великолепие - для специально оборудованного помещения, которое не у каждого есть, и уж точно не воткнешь ни в телефон, ни в "колонку".

Итог: нишевый продукт, ради поддержки которого со стороны "источников" надо специально заморачиваться.
Ладно еще, пока DVD были в моде..

Почему была? Стоит под столом саб, использую как 1.1 сейчас. Покупал в основном для просмотра фильмов (3D конечно :). После покупки провёл ревизию - на всех носителях нашёл полтора фильма с пространственным звуком. Послушал демки, воодушевился, пошёл искать трушное пространственное звучание в фильмах (лет 10-12 назад). В принципе, нашёл несколько годных фильмов. Был период, можно было воспроизводить сорокагиговые BDRipы непосредственно, без предварительного закачивания. Чаще же нужно прослушать полфильма, чтобы услышать хоть какой-то пространственный эффект. Возможно, подгаживали некачественные озвучки, теряющие при пересведении объёмность.
При желании, кстати, можно подключить многоканальные колонки к любому гаджету посредством юсбишной внешней звуковой карты, уж не знаю как там у них с драйверами под андроид.

У пространственного звука, тем не менее, есть одно существенное достоинство - можно поднять громкость центрального канала (речь), снизив до минимума боковые и саб (спецэффекты), тогда можно не отматывать назад в тщетных попытках услышать героев фильма на фоне посторонних мешающих звуков и спокойно смотреть фильмы на сон грядущий, не мешая соседям спать.

Ещё искал потоковые радиостанции с пространственным аудио - не нашёл ни одной ;(
При этом многоканальные Dan Gibson Solitudes - действительно шедевральны. Сколь и неповторимы.

Почти все мультики полнометражные сейчас с пространственным звуком.

Ну и мидл для диалогов позволяет наконец смотреть action-боевики без пульта в руках, в прочих случаях необходимого, чтобы адаптировать громкость в тихих и громких сценах.

Спасибо, пропустил новые веяния. А ведь логично - раз пространственный звук присутствует в играх, генерировать его для анимации дело техники.

Кто же отрендерит ролики Animusic в стереовидео с пространственным звуком? Ушёл пересматривать Animusic.

Странно. У меня стоит система 5.1.2 и пространственные эффекты типа "дверь скрипнула сзади" я слышу в фильмах постоянно. Восприятие это меняет довольно сильно.

Несомненно, погружённость возрастает. Просто в последнее время не качаю специально фильмы с пространственным звуком, чаще смотрю в браузере. Несмотря на изобилие онлайн-кинотеатров пока поддержки в них многоканального звука не наблюдаю, может не там смотрю.

Почти все онлайн-кинотеатры сейчас публикуют современные релизы с Dolby Atmos. Множество популярных старых картин реставрируют с его применением.

Вот только подключалось это всё благообразие через S/PDIF или через HDMI. А там - кодеки, причём не лослесс.

S/PDIF или через HDMI. А там - кодеки

Что S/PDIF, что HDMI могут передавать в том числе сжатый звук, но базовый "кодек" у обоих - чистый PCM.
И кодеки они не "там", а в первую очередь - на носителях и просто сквозняком доставляются от плеера к устройству воспроизведения через S/PDIF/HDMI. В отличии от bluetooth с весьма ограниченной пропускной способностью ни S/PDIF ни HDMI сжимать звук для передачи необходимости нет.
Причем если через S/PDIF пролезет только HiRes Stereo (24bit@96kHz), то HDMI спокойно пропустит 8 24bit@192kHz каналов. Куда уж еще losslessней непонятно.

То, что была, это полбеды. Куда хуже, что фильмы сейчас выкладывают зачастую только с дорожкой 5.1 и под обычное стерео они звучат ужасно. Речь тихая, если увеличить громкость, то в сцене со спецэффектами и громкой музыкой оглохнешь, но при этом речь все равно не слышно

Есть же программные миксеры. Ну и компрессор ещё помогает сжать динамический диапазон.

5.1 и под обычное стерео они звучат ужасно. Речь тихая

Крутите настройки даунмиксера, добавляя децибел центральному каналу.

А не подскажете, где крутить в K-Lite / MPC HC, и желательно для всех фильмов 5.1? А то я кроме галки Normalize ничего на эту тему там не видел.

https://mip-portal.ru/настроить-звук-5-1-в-media-player-classic/

Вот эту галку нажать, получается?

Или как-то иначе нужно усиливать центральный канал с голосом? Второй ползунок с 0.71 уменьшить?

Смысл в том, что у меня пара колонок (не 5.1), а как выше раскрыл мне глаза @spirit1984, файлы с фильмами массово содержат звук под 5.1 (проверил на своей библиотечке, подтверждаю), и голос не слышно, а если прибавить громкость, то периодически звуки взрывов и т.п. глушат меня как рыбу динамитом.

Есть ещё старый добрый AC3filter.

по железу не прикалываюсь, а вот openal(https://ru.wikipedia.org/wiki/OpenAL) для 3d звукового окружения - конус+ парочка звуковых еффектов, прекрасно работает в таком ТТХ

фрибсд, java+openal через lwjgl3 и всё это работает с mp3 Ы)

теперь и без прослойки линукса заводится

Скрытый текст

3д всегда проверяю по сравнению со стандартной записью, 3д окружение всегда ощущается или не знаю может это не 3д, но разница ощутимая

Одно время, когда стерео было дорого и не везде, любители звука использовали лайфхак: две колонки (в смысле динамики, пассивные) подключались в противофазе - получался довольно интересный объемо-подобный эффект.

Позже в некоторых стереосистемах добавляли пару динамиков последовательно с конденсатором между каналами.

Еще были схемы, сдвигающие в некоторой части звукового диапазоне фазу сигнала на 90 градусов, на слух был интересный эффект. Не стерео конечно, но во времена моей юности, когда цифровая обработка сигнала в бытовой аппаратуре была еще из области фантастики, было интересно, сам в то время развлекался.

понял ну кстати опенАЛ не единственный выход, какое-то время назад видел у майкрософтов какие-то программные звуковые фичи дающие 3д, ну кстати на 1 динамике у моей реализации разница тоже ощутимая, не знаю как это работает, просто дёргаю апишки, самая имба что я слышал это в фрути лупс, но там надо врубать микшер, и врубать фрутик на поток который системный, тогда тоже можно сделать пока работает фрутик 3д

Статья начинается со справедливого замечания:

Но сейчас времена изменились. Файлы скачиваются за секунды, а место на диске измеряется терабайтами.

Зачем сейчас подвергать музыку сжатию БЕЗ потерь - ради уменьшения размера файла на 30...40%, делая при этом файлы трудновоспроизводимыми

Теоретически, HALAC можно использовать ещё и как оригинальный способ обфускации/шифрования аудиофайлов в неизвестный формат. Насчёт «неизвестного» не преувеличение: за год с момента официального анонса на форуме HydrogenAudio кодер и декодер скачали 490 и 463 раза, соответственно, а последнюю версию — 198 и 169 раз.

И, если потом захочется поставить любимый трек на рингтон старого Сонерика - перекодируй обратно в WAV? Сжатие в mp3 320 kbps ещё имеет смысл - там размер папки уменьшается в разы и этот файл прочитает любой утюг и даже самоделка на VS1053.

Зачем сейчас подвергать музыку сжатию БЕЗ потерь - ради уменьшения размера файла на 30...40%, делая при этом файлы трудновоспроизводимыми

Китайские плееры за 10000 р жрут flac. Шмартфоны с ведроидом жрут flac...

Смысл написания этой статьи в

Есть ряд lossless-кодеков, которые эффективнее .FLAC по степени сжатия.

OGG в свое время звучал лучше MP3 на тех же битрейтах, но популярнее не стал. APNG был качественнее GIF, но GIF до сих пор в ходу, а про APNG многие и не слышали. ИМХО, чтобы скинуть FLAC с трона нужно что-то посерьезнее чем, примерно такой же размер файла, но быстрее кодирование/декодирование. Если с видео-кодеком "тот же размер и качество, но время кодирования/декодирования в 3 раза быстрее" будет прорывом, то со звуком все не так однозначно. Никто не кодирует звукозаписи в таком объеме, чтобы время кодирования во FLAC было проблемой. По проигрыванию, FLAC и так могут проигрывать практически любые устройства. А если оно такое старое, что не тянет FLAC, навряд ли кто-то прикрутит к нему поддержку HALAC. Но, тем не менее, я буду только рад, если более эффективная технология со временем вытеснит менее эффективную.

А почему обязательно звукозаписи? Может быть, людям хочется потокового вещания с консерватории?

А что им мешает это делать? Тот же ALAC это позволяет. Неужели устройство для передачи потокового вещания не справится с кодировкой в ALAC в реальном времени? Если бы там был существенный выигрыш в размере передаваемых данных, было бы совсем другое дело.

И то верно, там зашифровать и передать весь этот поток выйдет сложнее, чем закодить.

Строго говоря шифрование - гораздо более дешевая операция, чем компрессия

А ещё, строго говоря, эти операции плохо друг с другом сочетаются </зануда>

Плохо сочетается “сначала зашифровать, потом сжимать ". А вот " сначала сжать, затем шифровать" это в общем-то best practice: теоретически чем меньше избыточность входных данных тем сложнее криптоанализ.

Теоретически да, а на практике случается и наоборот

https://en.m.wikipedia.org/wiki/CRIME

https://en.m.wikipedia.org/wiki/BREACH

Но сжимать конечно не перестанут, экономия трафика окупает просадки в криптостойкости

MP3 устарел

Пусть так. Только вся имеющаяся у меня аппаратура (муз.центр, телефон (кнопочный), плеер) "заточены" под MP3. Прикажете все устройства менять? Накладно. И по деньгам и по времени. Чтобы что? И кстати, для действительно качественного прослушивания аудио нужна соответствующая качественная аппаратура, желательно HiFi\HiEnd. Но чего нет, того нет, "наслаждаюсь" "качеством" MP3.

Все кодеки работали на исходном материале .wav, 16 бит, 2 канала, 44100 bps).

Вероятно, 44100 Hz, 1411 kbps?

Было бы хорошо показать сравнительные графики (спектральный анализ) "потерь" lossles vs mp3: уменьшение реальной частоты дискретизации, срез ВЧ, провалы частот и пр.. Т.е. всего того, что теряется в звуке при кодировании в MP3. Лично сравнивал только с .wav, там заметно\слышно даже на моей ширпотребной аппаратуре. Lossless форматы не пробовал ни разу (первый абзац). И кстати, что насчёт .ogg (Vorbis)? Да, он с "потерями", но лучше (?) MP3, однако далеко не так распространён (по причине своей свободности?).

... времена изменились. Файлы скачиваются за секунды, а место на диске измеряется терабайтами...

Предположим (чисто гипотетически), что моя аудиоколлекция занимает полтерабайта в формате MP3. В несжатом WAV при той же частоте дискретизации и глубине будет занимать в 10 раз больше, т.е. 5 ТБ. Что потребует диск значительно большего, чем сейчас, объёма. К чему это я? А к тому, что не увидел сравнения размеров файлов одних и тех же треков в разных форматах. Lossless ведь больше MP3? И насколько \ во сколько раз?

Для себя я делаю записи в .wav, потом редактирую, конвертирую в .mp3. Многие сайты также поддерживают upload аудиофайлов только в .mp3. Либо, в том числе и.

Итого. MP3 устарел. Но многие будут использовать этот формат ещё очень долго. По вышеозначенным причинам как минимум.

5 тб вавки при 44кГц/16 бит это 8662 часа. Это год непрерывного воспроизведения, если слушать 24/7. Вы это действительно слушаете?

сравнивал только с .wav

...

Lossless форматы не пробовал ни разу

Wav* это и есть loseless формат, только без сжатия. Сожмите его zip'ом - получите со сжатием. Flac и co это [утрированно] такой специальный zip, оптимизированный под сжатие данных, характерных для LPCM из реальной жизни. Но суть та же: после декодинга получается не "[почти] такой же звук", а бит-в-бит идентичный LPCM.

(*) под wav естественно понимается “LPCM в riff-контейнере", как и бывает в большинстве случаев. Технически, кончено в riff-контейнер wav'а можно засунуть зоть mp3, хоть flac. Но так почти не делают

Прочитал статью, сделал для себя вывод, что старый добрый flac всё ещё живее всех живых :)

Степень сжатия лучше или такая же, ну чуть побольше времени требует, но для современных процессоров это некритично - если что, для проигрывания flac было достаточно p166mmx - c мощностью около 10 попугаев по cpubenchmark. И поддерживается чуть ли не в каждом утюге, по крайней мере стандартная ваговская голова Bolero его играет прекрасно.

и снова мы возвращаемся к знаменитой битве VHS vs Betamax, Недостаточно превосходить технически, нужно еще иметь базу устройств воспроизведения. Что толку с того, что кодек прекрасен, если его не поддерживают плееры или телефоны?

Мне APE в свое время непонятен был - сжатие плюс-минус как у FLAC, при этом грузил процессор первых андроид-смартфонов на 70-80% при воспроизведении. А сейчас, когда FLAC уже стал стандартом для lossless, обозревать гору схожих кодеков при опять же плюс-минус такой степени сжатия, но очевидно худшей совместимости - какой смысл?

"MP3 устарел. Будущее за современными lossless-кодеками" - сравнение тёплого с мягким. MP3 уже давно как устарел и держится только за счет множества аппаратных декодеров и "инертности мЫшления". Его давно уже по всем параметрам уделал Opus. Вот если бы статья была "FLAC устарел. Будущее за более современными lossless-кодеками" - с примером кодека который хотя-бы на 10% его превосходит по сжатию при сопоставимой скорости декодирования... Но нет таких. Энтропия - она такая.

MP3 держится, потому что большая часть параметров, по которому его уделал Opus, на практике не является реальным конкурентным преимуществом. Звучание на низких битрейтах у современных кодеков лучше, но на практике сейчас в любом lossy стараются кодировать все равно в 320, в крайнем случае в 256, где разницу практически никто не замечает (если вообще замечает).

опус уделал мп3 на битрейтах до 128кбит/с. там он да, там он крут.... он там самый толстый карапуз в яслях. но тут-то вроде речь про лослес и его конкурентов, считай, битва якодзун на битрейтах от 256 и выше- совсем другая весовая категория! Кроме того, у опуса есть такая штука, как частотное квантование. то есть, он, считай, сдвигает исходные частоты, делает он это для голоса (ну, для той части сигнала, которую он считает голосом), но это не просто "отсечь лишнее", это сдвиг исходного спектра- оперные певцы могут и не оценить (а особенно не оценят якутские горловые певцы- у них там низкочастотное голосение, там квантование частоты ой как интересно может отыграть).... А для музыки у опуса точно те же косинусные (читай- фурье) преобразования, что и в МП3. так что внедрять его в музыкальную индустрию, как замену мп3? шило на мыло непоймизарадичего...

Опус разработан для потокового аудио. Я как-то сравнивал кодеки по искажению, вносимых в спектр тестовых сигналов - и опус действительно всех уделывал.

можно ссылку на сравнение? "всех уделывал"- это в числовых показателях как выражается? я почему спрашиваю- потому что я тоже смотрел данные, как там опус всех уделывает, и на тот момент разница была заметная именно что на битрейтах до 128кбпс, после- разница между опусом и мп3 была незаметна глазом. то есть, на графике сравнения какого-то качества кодеков толщина линий была больше, чем измеренная авторами разница квалити. но что там за квалити было принято и в каких попугаях померяно- уже тайна и загадка.

Статью про сравнение не писал, картинки со спектрами не сохранял. Но сам принцип анализа как и тут. Уделывал - значит вносил меньшие искажения по сравнению с другими. Выше 128 сравнивать смысла нет, потому что потоковое аудио - это про низкий битрейт, а не про высокое качество.

а какой смысл сравнивать тогда это все в обсуждении lossless-кодирования? оно-то точно не про низкие битрейты! тут же статья о том, что mp3 устарел относительно лослес-кодеков, и что надо переходить на них, ибо там "какчество звучания" выше. а контраргумент к этому- что качество звучания мп3-320- уже и так оверхедное, лослес не сделает вообще ничего лучше.

вот у меня есть кухонный нож, типа "шеф". он бреет волос, но не снимает с него стружку. вопрос- нужен ли мне нож, снимающий стружку с волоса? он ведь острее! лучше же будет? нет. не нужен. потому что я и этим ножом шинкую огурцы и петрушку со скоростью 4 слайса в секунду. и быстрее- шинковать не буду- я просто не умею быстрее трясти рукой. но нож, который снимает стружку с волоса- просто влетает в кожу пальцев, сразу и до кости, а такой, который просто бреет- оставляет порезы, которые заживают за три дня. это мой личный практический опыт. нужен ли мне нож и высокотвердой стали? ведь он лучше, чем мой кухонный из обычной 7Cr17MOV? нет. потому что у меня жена, которая иногда скоблит ножом по тарелке. но 7цр17мов после этого я выправляю за две минуты, и при этом тарелка не царапанная, а дамасский с углеродной кромкой я буду выправлять минут двадцать, и при этом тарелка будет зацарапанная и расколется через пару дней в микроволновке. а он еще и ухода требует, а мой- помыл и повесил как получится- ему все пофиг, он нержа. дамаск от сакуры конечно лучше, чем ширпотреб, но мне- рядовому массовому юзеру- он не просто не нужен, он мне даже вреден! потому что рядовой массовый юзер будет им тупым и ржавым царапать тарелки! то есть, и резать он не будет как надо, и тарелки царапать будет как не надо. но любой типа профи-повар-любитель тыщу раз объяснит мне, как я не прав и как круто на кухне использовать многослойный "шеф" с хамоном и отбалансированной ручкой (ну да, круто, при некоторых условиях, в которые никто и никогда не попадает, кроме 0,3% населения). кстати, с ножами- сначала такие вот умники как я просят замеры твердости РК, а потом приходят мужики в фуфайках, и спрашивают про количество резов пенькового каната. И внезапно оказывается, что по неизвестной для массы материаловедов причине ножик с посредственной твердость может внезапно выдавать в десяток раз больше резов каната, чем высокотвердая сталь. знаете, как у материаловедов от этого "рвет пуканы"? а ведь это - измеримый числовой показатель! который внезапно просто в крошку ломает устоявшиеся научные теории с измеримой твердостью по Роквеллу (я немного причастен и к материаловедению, и к ножеделию :-)).

Ну так бывает на хабре - статья про одно, а комментарии слегка про другое. Вы так и вообще про ножи и методы измерения их остроты вспомнили.

Не увидел в статье практических рекомендаций для домашнего пользователя.

В своё время, очень много лет назад, я познакомился с mp3 через пользование граббером, вытаскивающим треки с диска, взятого у приятеля на "послушать". Соответственно, нынче хотелось бы поиметь похожий "граббер без потерь", работающий уже не с mp3, а с кодеками, описанными в статье. Ну а дальше - послушать, что он выдаёт, и решить, стоит ли оно обсуждаемых хлопот. Без всяких теорий, чисто на практике.

"Граббинг" и сжатие музыки - это разные процессы. Вам никто не мешает пограбить тем же инструментом, а потом просто сжать не в mp3, а во flac тот же.

Тот граббер эти процессы не разделял. Он не имел на борту ничего, кроме mp3, да и не раздобыть сейчас его (разве что откопать в домашнем хламовнике древний диск-софтопомойку девяносто-лохматого года типа "всё в одном", содержимое которого гарантированно не запустится в нынешних ОС).

А я как раз и прошу - подскажите его современный аналог с современными встроенными кодеками. Домашнему пользователю разделение этих процессов - это лишнее усложнение. Ему только и нужно-то, лично оценить качество звука и степень сжатия, того самого, которое "без потерь".

ЕМНИП там lame использовался для кодирования в mp3, причём можно было указать путь к внешнему пакеру. Сначала с CD Audio диска грабился трек во временный несжатый файл, потом запускался процесс сжатия в mp3, после чего незжатый файл удалялся и программа переходила к следующему треку.

Граббер, который не разделял процесс, это разве что xing был, который жал "на лету" кривым кодеком. Зато быстрым.

А "один к одному" - это обычно был EAC. Но он не был "всё в одном". Да, он мог и кодировать, если к нему кодировщик подключать, но сперва он рипал в wav. А потом уже жал во что настроишь. В том числе и в лосслесс мог.

https://www.exactaudiocopy.de/

Да не, грабберов было много, и некоторые действительно были однокнопочные или с минимумом настроек. В приснопамятном журнале Upgrade, помню, чуть ли не в каждом номере такой MusicMatch Jukebox рекомендовали. Кстати, "шароварный", с платной опцией кодирования в mp3, но кого это в 2000-м останавливало?)

При этом я верю, что где-то под капотом он сначала формировал wav, а потом уже из него mp3 делал, но этот wav рождался и помирал в дебрях временных папок.

Если говорить о современных комбайнах с функцией рипа - я бы MusicBee попробовал, по умолчанию FLAC там точно есть, а другие кодеки можно доустановить.

Грабберов действительно было много. Но если речь идёт о "без потерь" - то это только EAC.

Ведь самое сложное - это сграбить, а не сжать.

я бы MusicBee попробовал

Первая рекомендация получена, спасибо.

А можно обычный wav пропустить через zip c учетом того, что часть данных дублируется в обоих каналах и получить лослесс?

Можно, в rar даже сжатие схожее будет. Главный минус, что для прослушивания придётся весь файл целиком распаковывать.

Так можно же делать не solid архив, нарезать на небольшие части и в контейнере архива обращаться напрямую к нужной части.

И все равно слышу звон велосипедных звонков

Что-то мне подсказывает, что нечто подобное уже сделали

по 20мс кусочками нарезать... и получится как раз таки плохонькое лослесс-сжатие :-) а хорошее лослессжатие- это когда нарезали не просто кусочками, а по умному, и алгоритм сжатия взяли не абы какой, а учитывающий особенности исходных данных- как минимум- наличие в них гармонических колебаний с некоторым характерным спектром, отличающимся от спектров текста, картинок или там, исполняемых файлов.

Вот так FLAC и работает!

Все более-менее современные алгоритмы сжатия без потерь - это "два-в-одном" - предиктор и кодер. Предиктор по предыдущем значениям пытается предсказать следующее, а ошибку между предсказанным и истинным значением кодер уже переводит в битовый поток. Что касается кодера - то тут уже вряд ли можно ожидать каких-либо прорывов после Arithmetic-а, тем более что все сроки патентов на него давно истекли. Тут уже только про скорость - тот же tANS. А вот что касаемо предикторов - тут еще ИМХО есть куда расти. При этом действительно, знание природы входных данных дает возможность создать гораздо более точно "предсказывающий предиктор". В FLAC используется целый ансамбль из предикторов, где для каждого фрейма выбирается наиболее подходящий (но информация о том, который был выбран - так или иначе должна тоже записываться в выходной поток). А далее - кодер (в FLAC это коды Голомба-Райса, ЕМНИП), уже преобразовывает разницу между предсказанным и реальным значением в биты. Он не оптимален, но ОЧЕНЬ быстр (даже в сравнении с тем же Хаффманом). Заменив Голомба-Райса на tANS или арифметик - можно выиграть 1-2%. Но это - предел. Дальше - только совершенствовать предикторы (тут уже походу запахло нейросетями).

Конвертацию любых форматов друг в друга можно осуществлять

А я вот попробовал переделать WavPack во FLAC и столкнулся с сообщением что FLAC не поддерживает данные с плавающей точкой. Или это я такой невезучий?

Mp3 устарел, когда вышел aac. То есть в 1998. По возможности избегайте mp3. Если хочется свободный кодек, то opus хороший вариант. Ну а так MPEG кодеки самые продвинутые по фичам.

mp3 устарел еще в 2003 году.

Но людям, к сожалению, и в 2025 "mp3 320 с головой". Фейспалм.

Это было невероятно.

По-моему в хештегах не хватает #нейросеть.

Или #перевод. Дословное переведение английского, например, incredible - точно не знаю, что именно это могло быть и ориентируюсь на кажущиеся правдоподобными предположения, не всегда адекватно контексту.

Затратить на хранение треков на смартфоне раз в 5 больше места, а потом дальше слушать на китайских беспроводных затычках, у которых потолок передачи сигнала порядка 192Кбит - отличный план... Зато будут лучше брать телефоны от 1ТБ памяти.

Идите в жопу со своим losless compression и устаревающими форматами вообще. Не все слушают музыку на комнате с измерительными приборами, знаете ли.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий