sasha237 14 дек 2008 в 18:46

Как еще можно классифицировать музыку

1 мин

1.5K

Звук

+57

Комментарии 58

ExxY 14 дек 2008 в 19:08

Существуют бесплатные системы с большими БД треков работающие подобным образом. MusicBrainz например.

vvivan 14 дек 2008 в 19:22

А ссылочку дайте пожалуйста, как раз долго искал такие системы.

Alert 14 дек 2008 в 19:25

musicbrainz.org

sasha237 14 дек 2008 в 19:30

Чорд! Меня опередили. =)
Тогда пробую реабилитироваться (не реклама — просто что нашел) несколько ссылок
en.wikipedia.org/wiki/Acoustic_fingerprint — это про музыкальные «отпечатки пальцев»
www.znamensk.net/forum/showthread.php?s=29411b531180010f66ba401f6feb7542&t=1544 — это одно описание
www.liveinternet.ru/community/lj_slavik46/post70474208/ — это второе описание
А я в следующий раз буду повнимательней ;)

Killy 14 дек 2008 в 19:26

http://ru.wikipedia.org/wiki/MusicBrainz

Alert 14 дек 2008 в 19:26

А вот и еще:
— ru.wikipedia.org/wiki/Tunatic
— ru.wikipedia.org/wiki/TrackID

sasha237 14 дек 2008 в 19:31

Поняслась родииимая =)

SilenceAndy 15 дек 2008 в 11:29

MusicDNS

ExxY 14 дек 2008 в 19:31

Преимущество MusicBrainz в том что она работает по принципу wiki. То есть вы можете добавлять свои композиции, за счёт чего база быстро растёт

Killy 14 дек 2008 в 19:42

Однако, с коммерческой CDDB тягаться всё-равно может с трудом.

Любопытно, какими путями пополняется база CDDB.

(С CDDB работает, например, функция Auto-tag в Winamp'е.)

GreyCat 14 дек 2008 в 22:58

Не соглашусь с тем, что «тягаться может с трудом». CDDB есть несколько:

Есть «официальная», которая cddb.com от gracenote, распространяется за деньги, lookup'ать в ней можно весьма ограничено. Пополняют ее большинство коммерческих CDDB-enabled плееров по умолчанию, даже не спрашивая у пользователя, хочется ему туда или нет. «Официальная» cddb пестрит диким проблемами с кодировками и довольно хламным содержимым, несмотря на то, что на дворе уже почти 2009 год и utf-8.

Есть freedb.org, в которой все чуть получше, с ней по умолчанию обычно работают (=забирают информацию и пополняют) все фришные плееры и дисковые библиотеки (типа kscd и т.п.), но бардака там примерно столько же. Попробуйте поискать там CD какого-нибудь русского исполнителя — с большой вероятностью найдете варианты в windows-1251, koi8-r и utf-8, причем половину — каких-то сильно поломанных.

В MusicBrainz подход радикально иной — там оценочная система модерации и, как правило, весь получающийся бардак подчищают. Есть достаточно четкие правила описания дисков (например, как записать название трека — «Komodia I — The Beginning», «Komodia 1: The Beginning», «Komodia pt.1. The Beginning.» или еще как-то — там определяется единый стандарт), есть люди, которые следят за соблюдениями этих правил и стандартов. В результате почти по всем записям (а уж по русскоязычным — точно) порядок намного больший, чем в любых CDDB.

Кстати, MusicBrainz умеет импортировать данные из CDDB, чтобы их не вбивать руками. Но почти всегда эти данные приходится дополнительно править.

Killy 14 дек 2008 в 23:46

Меня интересуют в первую очеред японские исполнители. А русских почти совсем нет.
С японскими тегами в CDDB проблемм не было. Всегда юникод. Shift-JIS не попадался. :)

> Пополняют ее большинство коммерческих CDDB-enabled плееров по умолчанию, даже не спрашивая у пользователя, хочется ему туда или нет.

Вот и ответ, я думаю. Толпа юзеров iTunes и Winamp'а гораздо быстрее наполняет базу, чем отдельные гики с линуксом или MisicBrainz Picard.
Не всегда результат приемлимый, но чаще это всё-таки так.
Здесь уместно говорить о качестве и количестве. Будь там хоть суперкачественные теги, если я не нахожу нужных мне — зачем мне этот сервис?

Думаю, надо додавить авторов AIMP, чтобы добавили поддержку MusicBrainz. Если работать с сервисом будет также просто, как и в коммерческих плеерах, база будет быстрее пополняться.

> Кстати, MusicBrainz умеет импортировать данные из CDDB, чтобы их не вбивать руками. Но почти всегда эти данные приходится дополнительно править.

А можно про это поподробнее? В Picard'е не видел. Поправить — не проблемма. Вот целиком руками вбивать — проблемма.

GreyCat 15 дек 2008 в 00:11

> С японскими тегами в CDDB проблемм не было. Всегда юникод. Shift-JIS не попадался. :)

Сильно повезло ;)

> Здесь уместно говорить о качестве и количестве. Будь там хоть суперкачественные теги, если я не нахожу нужных мне — зачем мне этот сервис?

Абсолютно согласен — но в последнее время MusicBrainz покрывает процентов 99 того, что я нахожу. В том числе по японским исполнителям — это одна из наиболее полный баз, которые я знаю.

> А можно про это поподробнее? В Picard'е не видел. Поправить — не проблемма. Вот целиком руками вбивать — проблемма.

Все банально и ни от кого не прячется — musicbrainz.org/freedb/freedb.html. В том числе там есть хитрая определялка кодировки на тот случай, если добрые люди в freedb положили не utf-8 ;)

GreyCat 15 дек 2008 в 00:12

В смысле, конечно, без точки — musicbrainz.org/freedb/freedb.html

Killy 15 дек 2008 в 00:43

>> You need to login to view this page

Прячется. Я ещё не регистрировался. :)

> Кстати, MusicBrainz умеет импортировать данные из CDDB, чтобы их не вбивать руками.

И всё-таки freedb. И не сразу, а через сайт.

GreyCat 15 дек 2008 в 01:09

> Прячется. Я ещё не регистрировался. :)

Логично, так как речь идет о том, что будет производиться редактирование базы. В MusicBrainz все редактирования делаются из под авторизованных пользователей (в отличие от MediaWiki / Wikipedia, где можно подписываться IP-шником и не регистрироваться).

> И всё-таки freedb

Да, согласен, неверно написал. freedb, конечно, т.к. из cddb нельзя просто так бесплатно информацию брать в промышленных масштабах.

>И не сразу, а через сайт.

Логика примерно такая: Picard и любые тэггеры — это такое средство, которое в первую очередь «читает» из БД MusicBrainz и позволяет пользоваться информацией. А для редактирования MusicBrainz первичен сайт, и только то, что технически нельзя сделать через сайт, делается через всякие тэггеры (такие вещи, как DiscID и собственно акустический фингерпринтинг через PUID/TRM).

leshaogonkov 15 дек 2008 в 11:22

по-моему в подобных системах по определению будет мусор. Кто может заставить пользователя вводить теги правильно? Кто-то любит с капс-лока всё писать, другой всё переводит на свой родной чешский, к примеру.

Я пользуюсь подобными системами, но после этого в 99 % случаев приходится потом поправлять капитализацию, и мелкие опечатки. (last.fm эффект в действии)

Alaunquirie 15 дек 2008 в 09:40

В телефоне Sony-Ericsson класса walkman музыка так же может быть инициализирована, причем даже (!) с прямой записи отрывка, скажем, на концерте или дискотеке. Интересно, как это реализовано.

lecter 26 дек 2008 в 03:53

TrackID

-1

Alaunquirie 26 дек 2008 в 08:53

ГЕНИАЛЬНО!!! А как именно оно работает?

lecter 29 дек 2008 в 17:04

ru.wikipedia.org/wiki/TrackID
Выше уже давали ссылку. Сарказма не понял.

Alaunquirie 29 дек 2008 в 19:09

К сожалению, там не сказано, как оно работает. Ну да, сравнивается с образцами, т.е. у них на сервере просто огромное кол-во музыки, и сравнивается звучание и частоты со всеми? Интересно само устройство технологии.

Nakilon 15 дек 2008 в 10:54

а ещё к винампу по дефолту идет плагин AutoTagger или как-то так

porqz 14 дек 2008 в 19:18

Ух ты!

-2

tenshi 14 дек 2008 в 19:40

1. берём вавчики
2.…
3. сравниваем мидишки
4. профит.

частота переходов между нотами — такая же бесполезная информация, как и гистограмка. последняя не учитывает историю вообще, а первая — учитывает, но только на одну ноту назад.

а то, что получилось у тебя на картинке — матрица вероятностей для цепей маркова.

sasha237 14 дек 2008 в 19:55

Она родимая =)

sasha237 14 дек 2008 в 20:41

хммм… Ваши предложения?

tenshi 14 дек 2008 в 20:55

предложения для решения какой проблемы?
тэгирование композиций? вычисления степени похожести? определения нот в звуковом потоке? выделения доменов? составления рекомендаций? создания автоматического генератора музыки?…

sasha237 14 дек 2008 в 21:09

Неизвестная мелодия — тэгирование исключается.
Вычисление степени похожести, определение нот в звуковом ряде и выделение доменов. Методов достаточно большое количество. Можно несколько изменить алгоритм и учитывать последовательности не из двух нот, а из нескольких, а потом выявление наиболее частых — домены и учитывание истории.
Не совсем понял про рекомендации и автоматический генератор музыки.
Как бы я предлагал поиск, а с рекомендациями и генерацией, это интересно, надо подумать. =)

aulismedia 15 дек 2008 в 02:40

С точки зрения широкого пользователя есть пара идеальных применений аудиофингерпринта. Во-первых, скачал совершенно неизвестный трек без тэгов, натравил на него программу, и она автоматически определила что это за песня. Второе примение: слышишь по радио какую-то песню, нажимаешь на кнопку, музыка распознаётся и ты получаешь информацию о ней. Альтернатива: подсунуть программе фрагмент в несколько секунд песни в каком угодно качестве (мало ли, записал на сотовый телефон неизвестную песню, проходя мимо открытого окна машины), а тебе информация о ней в ответ.

Теоретических вариантов решения данных задач немало, но пока все они находятся в такой стадии, что для работы с ними нужен как минимум пользователь хабра. Простых однокнопочных (или вообще бескнопочных) решений как не было, так и нет. А мы знаем, что настоящая популярность к подобному сервису приходит только тогда, когда пользователь должен совершать минимум действий, пример — Last.FM. Кроме того, в любом случае для этих процессов требуются нехилые вычислительные мощности и совершенно гигантская база данных фактически всей музыки в мире. Не просто порядок треков и длинами, как у CDDB, а именно аудиоданные.

НЛО прилетело и опубликовало эту надпись здесь

theRavel 14 дек 2008 в 20:30

P.S.Если кому интересно – картинках Бетховен
на картинках ;)

sasha237 14 дек 2008 в 20:38

Спасибо, исправил.

RinLis 14 дек 2008 в 20:40

А можно для особо одарённых объяснить, почему на первом графике, где по оси Х идёт порядковый номер ноты, стоит i от 0 до 40. Нот всего 7 ещё бемоль, диез для нот… неужели всего 40 наберётся? Вот не могу понять. Объясните, пожалуйста!

sasha237 14 дек 2008 в 20:45

Там взято несколько октав. То есть отдельно для первой октавы 12 нот (7 основных+5 диезов), для второй и так далее. Естественно весь звуковой ряд оформить трудновато… Хотя идея использовать всего 12 нот достаточно интересная. Кстати можно расширить и брать частоту перехода между тремя нотами (будет уже трехмерный график) или даже больше.

RinLis 14 дек 2008 в 20:58

Спасибо за объяснение, причём, очень быстрое. Думаю, переход, между 4-мя нотами отобразить не получится :) Если, конечно, вы видите 4-х мерное пространство, то всё возможно :)
Ex3NDR тоже спасибо, всем же ответить не получится, сами понимаете :)

Ex3NDR 14 дек 2008 в 20:45

Во-первых в октаве 12 нот=) бемоли — это те же ноты=)
Во-вторых октав шеть наберется, но, к примеру, совсем низкие ноты не используются, совсем высокие — тоже, да и основная мелодия, как правило в двух-трех октавах укладывается=)

Enlightened 16 дек 2008 в 09:26

Мало кто способен спеть мелодию, которая в две октавы не укладывается;)

Loctos 14 дек 2008 в 20:40

Я ничего не понял, но раз народ оживился значит проблема актуальна =)

НЛО прилетело и опубликовало эту надпись здесь

sasha237 14 дек 2008 в 21:12

Поправил, хотя могу выкрутиться — переводим в параллельную мажорную тональность, а затем в до мажор. Но это уже экзотика, и не факт, что сработает для всех.

НЛО прилетело и опубликовало эту надпись здесь

sasha237 14 дек 2008 в 21:24

Так я же ее не слушать собрался — глядишь какой-нибудь модный хит окажется переделанным произведением Моцарта.
Как там в бородатом анекдоте про профессора консерватрии.

Профессор консерватории говорит своему студенту: «Когда будете писать дипломный проект, возьмите произведение классика и запишите его задом-наперед». Ну студенттак и сделал с дипломной работай профессора. Получился Чайковский. =)

НЛО прилетело и опубликовало эту надпись здесь

sasha237 14 дек 2008 в 21:27

Как сказал, DarkPhoenix, будем пилить напильником — может и транспонировать вообще не надо. Слишком оптимизировать тоже плохо.

DarkPhoenix 14 дек 2008 в 20:51

Тысячачертей, я пять лет занимаюсь музыкой и SFX, а нихрена не понял… Но из того что понял: есть мнение, старая классификация по гармонии (key) тоже вполне хорошая.

sasha237 14 дек 2008 в 21:20

Эй, а никто и не говорит, что она плохая, я просто предложил еще один вариант. Вон tenshi меня ща критикует — мне приходится изворачиваться и дорабатывать. В итоге либо будет, что-нить интересное, либо ничего не будет. =)

DarkPhoenix 14 дек 2008 в 21:25

Я ж ни разу не говорил, что предложенная тобой схема плохая, нет. Она клевая, и то, что ты до такого догадался — тоже клево. Да, её нужно дорабатывать напильником, но вектор задан и это мегакруто, в наше время таким почти никто не занимается. Только паразитируют.

sasha237 14 дек 2008 в 21:26

Пасиб. =)

spleaner 14 дек 2008 в 21:42

Хм, я один подумал, что в этом топике расскажут про еще один способ систематизации своей муз. библиотеки? :)

ajaxtelamonid 14 дек 2008 в 22:22

Забавно, но все-таки надуманно.

fleshy 15 дек 2008 в 00:00

Было бы здорово иметь возможность найти песню неизвестного исполнителя (например услышанную по радио), напев ее. Правда не уверен что это возможно даже с описанным алгоритмом, да и точность высокая не получится скорее всего

diomas 16 дек 2008 в 12:58

midomi.com был задуман изначально для этого, и у меня иногда даже получалось что-то находить, насвистев. Но, когда юзеры туда начали постить мелодии вместе с аккомпанементом, весь поиск, естесственно, ухудшился в разы. Тем не менее, иногда это может помочь.

Есть еще вариант: www.musipedia.org/query_by_humming.html но там результаты как-то вообще не радуют

schoolptor 15 дек 2008 в 00:22

А еще можно побитово файлики сравнивать. :)

-5

GodenDo 15 дек 2008 в 05:15

по графику перехода трудно будет идентифицировать,
это то же самое что пытаться сравнивать тексты по графику перехода между буквами, т.е вы скорей изучаете свойства самого языка (в данном случае музыки).

afi 15 дек 2008 в 10:25

пожалуйста, замените в тексте «мелодию, на столько, на сколько это возможно.» на «мелодию, насколько это возможно.»

sasha237 15 дек 2008 в 17:46

Поправил, спасибо.

hmage 16 дек 2008 в 12:44

www.shazam.com — наводишь мобильник на то что слышишь и узнаешь название композиции.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время