Спасибо за отличную статью!
Давно было интересно как же они осуществляют сравнение двух песен.
Прочитал вашу запись касательно угроз от обладателей патентных прав на Shazam в вашу сторону и все комментарии по теме — мне кажется они банально запугивают вас. Они, фактически, являются единственными кто придумал как использовать подобный алгоритм в коммерческих целях и очень боятся раскрытия сути работы приложения или скорее даже появления на рынке аналогов. Именно поэтому они требовали также и удаления самого поста, раскрывающего суть работы алгоритма. Патенты же, скорее всего, просто притянуты за уши, дабы добавить веса к их угрозам.
Так что я думаю что имеет смысл отстаивать свои права до последнего и искать законные лазейки для опровержения того, что ваш код подпадает под указанные патенты. С другой стороны это может обернуться большими финансовыми трудностями и отнять много вашего времени, поэтому, если разумно рассудить, возможно оно того и не стоит вовсе — тут уже всё зависит от ваших желаний и возможностей.
нене, мы только перевели статью. ни ко мне, ни к Яндексу это не относится) Более того, статье почти 3 года, и сейчас уже появилась дюжина аналогов Shazam) Запугивать патентами и угрозами — бессмысленно.
Странно, что для преобразования Фурье, тем более в виртуальной машине телефона, используют массивы ссылок на объекты Complex, а не двумерный массив double с действительными и мнимыми частями.
Еще из известных есть SoundHound.
В бесплатной версии у него кстати есть занятная и полезная функция отображения субтитров к песням в реальном времени, правда к сожалению такие субтитры есть далеко не у всех песен (Сейчас проверил на песне Alex Clare – Too Close).
Не совсем понятно, что автор имеет в виду, говоря, что после преобразования Фурье каждый бит информации касательно временных данных будет потерян. «Не будет в прямой доступности» — да, но потерян? Обратное преобразование Фурье еще никто не отменял.
Эта заметка конечно интересная, но она остается студенческой заметкой. Значительно более полное описание содержится в общедоступной статье авторов самого Shazam-а: Avery Li-Chun Wang «An Industrial-Strength Audio Search Algorithm» (легко гуглится).
На автора заметки наезжали как раз не по поводу раскрытия деталей алгоритма (в той статье они описаны более подробно), а по поводу публикации (в первоначальной версии заметки) кода, реализующего запатентованный алгоритм.
Создаем Shazam на Java