sasha237 Dec 14 2008 at 15:46

Как еще можно классифицировать музыку

1 min

1.5K

Sound

+57

Comments 58

ExxY Dec 14 2008 at 16:08

Существуют бесплатные системы с большими БД треков работающие подобным образом. MusicBrainz например.

vvivan Dec 14 2008 at 16:22

А ссылочку дайте пожалуйста, как раз долго искал такие системы.

Alert Dec 14 2008 at 16:25

musicbrainz.org

sasha237 Dec 14 2008 at 16:30

Чорд! Меня опередили. =)
Тогда пробую реабилитироваться (не реклама — просто что нашел) несколько ссылок
en.wikipedia.org/wiki/Acoustic_fingerprint — это про музыкальные «отпечатки пальцев»
www.znamensk.net/forum/showthread.php?s=29411b531180010f66ba401f6feb7542&t=1544 — это одно описание
www.liveinternet.ru/community/lj_slavik46/post70474208/ — это второе описание
А я в следующий раз буду повнимательней ;)

Killy Dec 14 2008 at 16:26

http://ru.wikipedia.org/wiki/MusicBrainz

Alert Dec 14 2008 at 16:26

А вот и еще:
— ru.wikipedia.org/wiki/Tunatic
— ru.wikipedia.org/wiki/TrackID

sasha237 Dec 14 2008 at 16:31

Поняслась родииимая =)

SilenceAndy Dec 15 2008 at 08:29

MusicDNS

ExxY Dec 14 2008 at 16:31

Преимущество MusicBrainz в том что она работает по принципу wiki. То есть вы можете добавлять свои композиции, за счёт чего база быстро растёт

Killy Dec 14 2008 at 16:42

Однако, с коммерческой CDDB тягаться всё-равно может с трудом.

Любопытно, какими путями пополняется база CDDB.

(С CDDB работает, например, функция Auto-tag в Winamp'е.)

GreyCat Dec 14 2008 at 19:58

Не соглашусь с тем, что «тягаться может с трудом». CDDB есть несколько:

Есть «официальная», которая cddb.com от gracenote, распространяется за деньги, lookup'ать в ней можно весьма ограничено. Пополняют ее большинство коммерческих CDDB-enabled плееров по умолчанию, даже не спрашивая у пользователя, хочется ему туда или нет. «Официальная» cddb пестрит диким проблемами с кодировками и довольно хламным содержимым, несмотря на то, что на дворе уже почти 2009 год и utf-8.

Есть freedb.org, в которой все чуть получше, с ней по умолчанию обычно работают (=забирают информацию и пополняют) все фришные плееры и дисковые библиотеки (типа kscd и т.п.), но бардака там примерно столько же. Попробуйте поискать там CD какого-нибудь русского исполнителя — с большой вероятностью найдете варианты в windows-1251, koi8-r и utf-8, причем половину — каких-то сильно поломанных.

В MusicBrainz подход радикально иной — там оценочная система модерации и, как правило, весь получающийся бардак подчищают. Есть достаточно четкие правила описания дисков (например, как записать название трека — «Komodia I — The Beginning», «Komodia 1: The Beginning», «Komodia pt.1. The Beginning.» или еще как-то — там определяется единый стандарт), есть люди, которые следят за соблюдениями этих правил и стандартов. В результате почти по всем записям (а уж по русскоязычным — точно) порядок намного больший, чем в любых CDDB.

Кстати, MusicBrainz умеет импортировать данные из CDDB, чтобы их не вбивать руками. Но почти всегда эти данные приходится дополнительно править.

Killy Dec 14 2008 at 20:46

Меня интересуют в первую очеред японские исполнители. А русских почти совсем нет.
С японскими тегами в CDDB проблемм не было. Всегда юникод. Shift-JIS не попадался. :)

> Пополняют ее большинство коммерческих CDDB-enabled плееров по умолчанию, даже не спрашивая у пользователя, хочется ему туда или нет.

Вот и ответ, я думаю. Толпа юзеров iTunes и Winamp'а гораздо быстрее наполняет базу, чем отдельные гики с линуксом или MisicBrainz Picard.
Не всегда результат приемлимый, но чаще это всё-таки так.
Здесь уместно говорить о качестве и количестве. Будь там хоть суперкачественные теги, если я не нахожу нужных мне — зачем мне этот сервис?

Думаю, надо додавить авторов AIMP, чтобы добавили поддержку MusicBrainz. Если работать с сервисом будет также просто, как и в коммерческих плеерах, база будет быстрее пополняться.

> Кстати, MusicBrainz умеет импортировать данные из CDDB, чтобы их не вбивать руками. Но почти всегда эти данные приходится дополнительно править.

А можно про это поподробнее? В Picard'е не видел. Поправить — не проблемма. Вот целиком руками вбивать — проблемма.

GreyCat Dec 14 2008 at 21:11

> С японскими тегами в CDDB проблемм не было. Всегда юникод. Shift-JIS не попадался. :)

Сильно повезло ;)

> Здесь уместно говорить о качестве и количестве. Будь там хоть суперкачественные теги, если я не нахожу нужных мне — зачем мне этот сервис?

Абсолютно согласен — но в последнее время MusicBrainz покрывает процентов 99 того, что я нахожу. В том числе по японским исполнителям — это одна из наиболее полный баз, которые я знаю.

> А можно про это поподробнее? В Picard'е не видел. Поправить — не проблемма. Вот целиком руками вбивать — проблемма.

Все банально и ни от кого не прячется — musicbrainz.org/freedb/freedb.html. В том числе там есть хитрая определялка кодировки на тот случай, если добрые люди в freedb положили не utf-8 ;)

GreyCat Dec 14 2008 at 21:12

В смысле, конечно, без точки — musicbrainz.org/freedb/freedb.html

Killy Dec 14 2008 at 21:43

>> You need to login to view this page

Прячется. Я ещё не регистрировался. :)

> Кстати, MusicBrainz умеет импортировать данные из CDDB, чтобы их не вбивать руками.

И всё-таки freedb. И не сразу, а через сайт.

GreyCat Dec 14 2008 at 22:09

> Прячется. Я ещё не регистрировался. :)

Логично, так как речь идет о том, что будет производиться редактирование базы. В MusicBrainz все редактирования делаются из под авторизованных пользователей (в отличие от MediaWiki / Wikipedia, где можно подписываться IP-шником и не регистрироваться).

> И всё-таки freedb

Да, согласен, неверно написал. freedb, конечно, т.к. из cddb нельзя просто так бесплатно информацию брать в промышленных масштабах.

>И не сразу, а через сайт.

Логика примерно такая: Picard и любые тэггеры — это такое средство, которое в первую очередь «читает» из БД MusicBrainz и позволяет пользоваться информацией. А для редактирования MusicBrainz первичен сайт, и только то, что технически нельзя сделать через сайт, делается через всякие тэггеры (такие вещи, как DiscID и собственно акустический фингерпринтинг через PUID/TRM).

leshaogonkov Dec 15 2008 at 08:22

по-моему в подобных системах по определению будет мусор. Кто может заставить пользователя вводить теги правильно? Кто-то любит с капс-лока всё писать, другой всё переводит на свой родной чешский, к примеру.

Я пользуюсь подобными системами, но после этого в 99 % случаев приходится потом поправлять капитализацию, и мелкие опечатки. (last.fm эффект в действии)

Alaunquirie Dec 15 2008 at 06:40

В телефоне Sony-Ericsson класса walkman музыка так же может быть инициализирована, причем даже (!) с прямой записи отрывка, скажем, на концерте или дискотеке. Интересно, как это реализовано.

lecter Dec 26 2008 at 00:53

TrackID

Alaunquirie Dec 26 2008 at 05:53

ГЕНИАЛЬНО!!! А как именно оно работает?

lecter Dec 29 2008 at 14:04

ru.wikipedia.org/wiki/TrackID
Выше уже давали ссылку. Сарказма не понял.

Alaunquirie Dec 29 2008 at 16:09

К сожалению, там не сказано, как оно работает. Ну да, сравнивается с образцами, т.е. у них на сервере просто огромное кол-во музыки, и сравнивается звучание и частоты со всеми? Интересно само устройство технологии.

Nakilon Dec 15 2008 at 07:54

а ещё к винампу по дефолту идет плагин AutoTagger или как-то так

porqz Dec 14 2008 at 16:18

Ух ты!

tenshi Dec 14 2008 at 16:40

1. берём вавчики
2.…
3. сравниваем мидишки
4. профит.

частота переходов между нотами — такая же бесполезная информация, как и гистограмка. последняя не учитывает историю вообще, а первая — учитывает, но только на одну ноту назад.

а то, что получилось у тебя на картинке — матрица вероятностей для цепей маркова.

sasha237 Dec 14 2008 at 16:55

Она родимая =)

sasha237 Dec 14 2008 at 17:41

хммм… Ваши предложения?

tenshi Dec 14 2008 at 17:55

предложения для решения какой проблемы?
тэгирование композиций? вычисления степени похожести? определения нот в звуковом потоке? выделения доменов? составления рекомендаций? создания автоматического генератора музыки?…

sasha237 Dec 14 2008 at 18:09

Неизвестная мелодия — тэгирование исключается.
Вычисление степени похожести, определение нот в звуковом ряде и выделение доменов. Методов достаточно большое количество. Можно несколько изменить алгоритм и учитывать последовательности не из двух нот, а из нескольких, а потом выявление наиболее частых — домены и учитывание истории.
Не совсем понял про рекомендации и автоматический генератор музыки.
Как бы я предлагал поиск, а с рекомендациями и генерацией, это интересно, надо подумать. =)

aulismedia Dec 14 2008 at 23:40

С точки зрения широкого пользователя есть пара идеальных применений аудиофингерпринта. Во-первых, скачал совершенно неизвестный трек без тэгов, натравил на него программу, и она автоматически определила что это за песня. Второе примение: слышишь по радио какую-то песню, нажимаешь на кнопку, музыка распознаётся и ты получаешь информацию о ней. Альтернатива: подсунуть программе фрагмент в несколько секунд песни в каком угодно качестве (мало ли, записал на сотовый телефон неизвестную песню, проходя мимо открытого окна машины), а тебе информация о ней в ответ.

Теоретических вариантов решения данных задач немало, но пока все они находятся в такой стадии, что для работы с ними нужен как минимум пользователь хабра. Простых однокнопочных (или вообще бескнопочных) решений как не было, так и нет. А мы знаем, что настоящая популярность к подобному сервису приходит только тогда, когда пользователь должен совершать минимум действий, пример — Last.FM. Кроме того, в любом случае для этих процессов требуются нехилые вычислительные мощности и совершенно гигантская база данных фактически всей музыки в мире. Не просто порядок треков и длинами, как у CDDB, а именно аудиоданные.

UFO landed and left these words here

theRavel Dec 14 2008 at 17:30

P.S.Если кому интересно – картинках Бетховен
на картинках ;)

sasha237 Dec 14 2008 at 17:38

Спасибо, исправил.

RinLis Dec 14 2008 at 17:40

А можно для особо одарённых объяснить, почему на первом графике, где по оси Х идёт порядковый номер ноты, стоит i от 0 до 40. Нот всего 7 ещё бемоль, диез для нот… неужели всего 40 наберётся? Вот не могу понять. Объясните, пожалуйста!

sasha237 Dec 14 2008 at 17:45

Там взято несколько октав. То есть отдельно для первой октавы 12 нот (7 основных+5 диезов), для второй и так далее. Естественно весь звуковой ряд оформить трудновато… Хотя идея использовать всего 12 нот достаточно интересная. Кстати можно расширить и брать частоту перехода между тремя нотами (будет уже трехмерный график) или даже больше.

RinLis Dec 14 2008 at 17:58

Спасибо за объяснение, причём, очень быстрое. Думаю, переход, между 4-мя нотами отобразить не получится :) Если, конечно, вы видите 4-х мерное пространство, то всё возможно :)
Ex3NDR тоже спасибо, всем же ответить не получится, сами понимаете :)

Ex3NDR Dec 14 2008 at 17:45

Во-первых в октаве 12 нот=) бемоли — это те же ноты=)
Во-вторых октав шеть наберется, но, к примеру, совсем низкие ноты не используются, совсем высокие — тоже, да и основная мелодия, как правило в двух-трех октавах укладывается=)

Enlightened Dec 16 2008 at 06:26

Мало кто способен спеть мелодию, которая в две октавы не укладывается;)

Loctos Dec 14 2008 at 17:40

Я ничего не понял, но раз народ оживился значит проблема актуальна =)

UFO landed and left these words here

sasha237 Dec 14 2008 at 18:12

Поправил, хотя могу выкрутиться — переводим в параллельную мажорную тональность, а затем в до мажор. Но это уже экзотика, и не факт, что сработает для всех.

UFO landed and left these words here

sasha237 Dec 14 2008 at 18:24

Так я же ее не слушать собрался — глядишь какой-нибудь модный хит окажется переделанным произведением Моцарта.
Как там в бородатом анекдоте про профессора консерватрии.

Профессор консерватории говорит своему студенту: «Когда будете писать дипломный проект, возьмите произведение классика и запишите его задом-наперед». Ну студенттак и сделал с дипломной работай профессора. Получился Чайковский. =)

UFO landed and left these words here

sasha237 Dec 14 2008 at 18:27

Как сказал, DarkPhoenix, будем пилить напильником — может и транспонировать вообще не надо. Слишком оптимизировать тоже плохо.

DarkPhoenix Dec 14 2008 at 17:51

Тысячачертей, я пять лет занимаюсь музыкой и SFX, а нихрена не понял… Но из того что понял: есть мнение, старая классификация по гармонии (key) тоже вполне хорошая.

sasha237 Dec 14 2008 at 18:20

Эй, а никто и не говорит, что она плохая, я просто предложил еще один вариант. Вон tenshi меня ща критикует — мне приходится изворачиваться и дорабатывать. В итоге либо будет, что-нить интересное, либо ничего не будет. =)

DarkPhoenix Dec 14 2008 at 18:25

Я ж ни разу не говорил, что предложенная тобой схема плохая, нет. Она клевая, и то, что ты до такого догадался — тоже клево. Да, её нужно дорабатывать напильником, но вектор задан и это мегакруто, в наше время таким почти никто не занимается. Только паразитируют.

sasha237 Dec 14 2008 at 18:26

Пасиб. =)

spleaner Dec 14 2008 at 18:42

Хм, я один подумал, что в этом топике расскажут про еще один способ систематизации своей муз. библиотеки? :)

ajaxtelamonid Dec 14 2008 at 19:22

Забавно, но все-таки надуманно.

fleshy Dec 14 2008 at 21:00

Было бы здорово иметь возможность найти песню неизвестного исполнителя (например услышанную по радио), напев ее. Правда не уверен что это возможно даже с описанным алгоритмом, да и точность высокая не получится скорее всего

diomas Dec 16 2008 at 09:58

midomi.com был задуман изначально для этого, и у меня иногда даже получалось что-то находить, насвистев. Но, когда юзеры туда начали постить мелодии вместе с аккомпанементом, весь поиск, естесственно, ухудшился в разы. Тем не менее, иногда это может помочь.

Есть еще вариант: www.musipedia.org/query_by_humming.html но там результаты как-то вообще не радуют

schoolptor Dec 14 2008 at 21:22

А еще можно побитово файлики сравнивать. :)

GodenDo Dec 15 2008 at 02:15

по графику перехода трудно будет идентифицировать,
это то же самое что пытаться сравнивать тексты по графику перехода между буквами, т.е вы скорей изучаете свойства самого языка (в данном случае музыки).

afi Dec 15 2008 at 07:25

пожалуйста, замените в тексте «мелодию, на столько, на сколько это возможно.» на «мелодию, насколько это возможно.»

sasha237 Dec 15 2008 at 14:46

Поправил, спасибо.

hmage Dec 16 2008 at 09:44

www.shazam.com — наводишь мобильник на то что слышишь и узнаешь название композиции.