Comments / Profile of yurkennis / Habr

Денис Юркин @yurkennis

User

Profile Publications 7Comments 132Bookmarks 5

Как Яндекс распознаёт музыку с микрофона

yurkennis Jun 5 2013 at 16:22

при оценке качества не учитывался случай, когда не опознается композиция, отсутствующая в базе

Ну вот и разобрались с причиной (б) в расхождении наших показателей качества — мы такие случаи учитываем как нераспознанное.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis Jun 5 2013 at 13:15

Количество хешей — функция от нескольких параметров прореживания (они приведены в статье).

Опускающееся лезвие (и все остальные приёмы для выбора пиков), на первый взгляд, вполне может работать и для real-time определения — почему нет?

Про среднее число вхождения ключей — давайте тогда уточним, что называть средним. А максимальное — это же просто выброс, как он поможет? Допустим есть один (или даже несколько) ключей, которые встречаются почти во всех треках — но разве это может помочь сделать какой-либо вывод? Кажется, нет.

30% времени вещания распознать не удается

Тогда непонятно, как это соотносится с цифрами 95..99.9% в вашем первоначальном комментарии.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis Jun 4 2013 at 21:45

Попробую ответить:
1. Сейчас под рукой нет точной цифры по большому числу треков; по нескольким трекам (первым попавшимся) цифра порядка 60 хешей в секунду.

2. Мы используем пары пиков. Если это и есть двузвёздные созвездия в терминологии Шазама, то ответ «да».

3. В статье есть все исходные для этой цифры: 6 млн / 2^20 ≈ 6 документов на пару. Максимального значения под рукой сейчас нет, а как оно может помочь с вашими вопросами?

Как нам кажется, разница в точности с вашим решением вызвана тремя причинами:
а) вы имеете дело с сильно более чистым сигналом — у вас нет ни посторонних шумов бара/кафе, ни акустики помещения, ни искажений АЧХ микрофона.
б) я правильно понимаю, что у вас база заведомо содержит все треки, которые играются на радио — и отсутствие трека в базе не считается результатом «не найдено»? В нашем случае считается — а наши пользователи спрашивают, вообще говоря, не только треки из нашей базы. Т.е. в наши 20% нераспознанного входят оба случая — и «треки, которых мы не знаем», и «алгоритм не смог найти» (например, из-за шумов).
в) вы сами написали, что ваша база на порядок меньше нашей. В общем случае с ростом базы точность падает (растёт вероятность «зацепить» что-то похожее, но другое)

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 30 2013 at 17:11

Действительно, очень хорошая картинка.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 30 2013 at 17:09

Спасибо — действительно любопытно.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 29 2013 at 18:38

Просьба действительно совсем не по теме статьи — но в порядке исключения отвечу, цитирую коллегу:

Мы делаем все возможное, чтобы наша база пополнялась новым и актуальным контентом. К сожалению, не все правообладатели готовы сотрудничать с нами, и на некоторые песни нам не удается получить лицензию. В других случаях, правообладателя бывает трудно отыскать, чтобы заключить с ним договор. Чаще всего контент появляется и пропадает на сервисе в том случае, если у рекорд компании, которая лицензировала нам песни, заканчивается срок действия договора с артистом, а новый договор между ними не подписывается. В этом случае контент может появиться в каталоге другой рекорд компании, и тогда контент остается на сервисе или очень быстро снова становится доступен. Или же артист может решить оставить все права у себя, и для получения контента нам потребуется идти договариваться к артисту напрямую, что не всегда удается сделать.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 29 2013 at 17:28

Недавно ответили в соседнем треде: habrahabr.ru/company/yandex/blog/181219/#comment_6301868

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 29 2013 at 16:03

Если это вопрос, можете его переформулировать? Пока мы не очень поняли, о чём в точности вы спрашиваете.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 29 2013 at 16:01

Мы недаром привели в списке литературы статью, подробно разбирающую применение вейвлетов для этого класса задач :-)

Shumeet Baluja, Michele Covell: «Audio Fingerprinting: Combining Computer Vision & Data Stream Processing»

Наверняка вам будет любопытно прочесть, если ещё не успели.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 29 2013 at 15:56

В ближайшее время точно не получится. Со временем — может быть, следите за анонсами.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 29 2013 at 12:56

Да, всегда один — самый релевантный. В ремиксах он, скорее всего, не идентичен оригиналу. А если в сборники — какая разница, из какого сборника показать этот трек?

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 21:58

Если совсем на пальцах:
= любую периодическую функцию можно приблизить рядом Фурье
= музыкальную запись можно разрезать на множество временных интервалов, и на каждом интервале приближать её своим рядом Фурье — тогда длину этого интервала можно считать периодом (и тогда слово «периодической» в предыдущем пункте уже не важно)
= быстрое преобразование Фурье — просто вычислительно недорогой алгоритм получения первых N коэффициентов для такого разложения

Вы об этом спрашивали?

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 18:27

Спасибо за примеры.

С классикой — похоже, ключевая причина в том, что даже несколько записей одного и того же произведения, исполненные одним и тем же коллективом — это разные записи. Даже небольшие изменения темпа, тембра — оказываются критичными. Такая проблема гораздо реже случается для популярной музыки, там исполнитель гораздо реже варьируется, да и для одного исполнителя гораздо реже случаются повторные записи одного произведения.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 18:20

Тут есть довольно много нюансов, но если совсем кратко — нет, пока не пробовали :-)

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 17:47

По второй проблеме — скиньте мне пожалуйста ваш email-адрес в личку. Я передал вашу проблему коллегам в поддержку полоьзователей, они свяжутся с уточнениями.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 17:40

Про первую часть: а можете назвать конкретные треки, которые не удалось распознать? (в идеале — сразу ссылками на треки на Яндекс.Музыке, так будет чуть проще разбираться)

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 15:18

Спасибо!
Мы планируем увеличивать полноту поиска — и в этих направлениях, конечно, тоже думаем :-)

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 15:16

Думаем про это :-)

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 15:10

По нашему опыту, с точки зрения алгоритмов распознавания живое исполнение всегда отличается от студийного.

А если речь идёт о нескольких студийных записях, которые совсем неотличимы — то какая разница, какой из нескольких идентичных треков мы отдадим пользователю? :-)

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 15:00

Спасибо, мы отдельно исследовали этот вопрос. На наши рынки патент Shazam не распространяется.

Look

1 2

4 5 6 7