Определения начала и конца композиции добиться, думаю, не получится из-за того, что скробблеру без плагина не отправляются никакие данные, а только берутся им самостоятельно.
Предполагаю, что алгоритм нужен более сложный — случайный/периодический скробблинг, время следующей проверки которого можно уточнять информацией о предполагаемом месте композиции от gracenote.
Допустим, если случайный скробблинг распознал конкретный кусок вступления трека, то, имея данные о длине композиции и времени самого скробблинга, можно предположить время начала следующего. Если юзер будет щёлкать треки, то ничего страшного в том, что они не попадут в статистику нет — они ведь не прослушаны целиком.
Насчёт кино или игр в браузере хочется придумать более изящное решение, чем распознавание сайта/урла во вкладке и вопроса пользователю. Можно попробовать начинать скробблить более мягко — если в каком-то приложении или на каком-то сайте музыка слушается регулярно, то данные скроббла начинают включаться в статистику. Если разово — нет. Вроде вполне себе вариант для крупных сервисов.
Да, у меня много музыки без тегов — полный интернет с потоковым аудио и АЛАК-и всякие. Слушать музыку онлайн — нормальная тенденция в масштабах интернета, странно закрывать на неё глаза. Речь не про файлы с тегами (которые, кстати, тоже могут быть с ошибками).
Про передачу сервиса пароля от ласт.фм идея как раз помогает. Пароль хранится только в локальном скробблере, от сайта же не нужно ничего, кроме воспроизведения аудио. Скробблер забирает звук из приложения (браузер), скробблит случайные 5 секунд, опознаёт на gracenote и пишет в last.fm.
Пример — пользователь с приложением (скробблером) ласт.фм, который слушает музыку как в привычном плейере в системе, так и во вконтакте, в яндекс.музыке, на простоплейере без авторизации, в блогах на городском или провайдерском портале, по прямым ссылкам в браузере. Это всё проходит мимо last.fm, а может довольно легко в него попасть.
Не забывайте, что плагины пишут одни люди (как правило, волонтёры), а в развитии своих крупных сервисов совсем другие, поэтому одно другому не противоречит, просто разная мотивация.
Gracenote работает не с полной копией файла, а с отпечатками. Трафик отправляется абсолютно минимальный, технология сбора и отправки отпечатка прекрасно работает в самых обычных телефонах Sony Ericsson, называется TrackID. Пятисекундный отрывок моментально обрабатывается и по отпечатку сервис показывает исполнителя, название композиции и альбом.
Повторюсь — ни серьёзные вычислительные мощности, ни какой-то заметный трафик даже для gprs просто не нужны. Кроме того, кэш никто не отменял: незачем сканировать и определять уже определённые ранее треки, например.
Что касается пополнения. Тоже проблемы не вижу, есть несколько способов решения — это и использование более крупных слепков, чем стандартные пятисекундные, в начале интеграции, и просто накопление мелких слепков с композиций — для более-менее популярных песен, которые слушаются ну хотя бы раз 60 (с пяти секунд стандартный слепок, пятиминутный трек) разными юзерами, информация уже сможет появиться.
То есть, id3 с отпечатками перетекает на gracenote, значительно пополняя коллекцию, а last.fm с юзерами взамен получают заметно более точную статистику: файлы без id3 в любых плейерах, любые приложения и веб-сервисы.
Вот база gracenote и может пополниться, благодаря скробблингу и last.fm.
Имеет смысл накладывать сверху скробблинг по отрывку не только для онлайн-плейеров. Это применимо для аудио без тегов во всех плейерах, а также для веб-плейеров без скробблеров (в частности, из крупных это ВКонтакте).
По-моему, выгодно для обеих сторон, а юзеры вообще в шоколаде.
Ничего себе, как поверхностно.
1. Улучшение качества сервиса не обязательно возводить в абсолют.
2. Gracenote нужен не абсолютно полного распознавания (я и написал, что last.fm поможет gracenote пополнить базу, а не наоборот), а для того, чтобы скробблить аудио, независимо от наличия id3-тегов.
Подход с поиском причин и поводов «почему нет» совсем убил, вы наверное успешный человек? ;)
Начал из интереса играть в WoW, прошёл его (убил Лича и Халиона в 25-ке), подружился с отличными людьми, в том числе оффлайн, и бросил. Всё это уложилось где-то в полгода, без ущерба работе, семье и здоровье. Вот такой рекорд — выжать из MMORPG только позитив и на этом остановиться.
Определения начала и конца композиции добиться, думаю, не получится из-за того, что скробблеру без плагина не отправляются никакие данные, а только берутся им самостоятельно.
Предполагаю, что алгоритм нужен более сложный — случайный/периодический скробблинг, время следующей проверки которого можно уточнять информацией о предполагаемом месте композиции от gracenote.
Допустим, если случайный скробблинг распознал конкретный кусок вступления трека, то, имея данные о длине композиции и времени самого скробблинга, можно предположить время начала следующего. Если юзер будет щёлкать треки, то ничего страшного в том, что они не попадут в статистику нет — они ведь не прослушаны целиком.
Насчёт кино или игр в браузере хочется придумать более изящное решение, чем распознавание сайта/урла во вкладке и вопроса пользователю. Можно попробовать начинать скробблить более мягко — если в каком-то приложении или на каком-то сайте музыка слушается регулярно, то данные скроббла начинают включаться в статистику. Если разово — нет. Вроде вполне себе вариант для крупных сервисов.
Про передачу сервиса пароля от ласт.фм идея как раз помогает. Пароль хранится только в локальном скробблере, от сайта же не нужно ничего, кроме воспроизведения аудио. Скробблер забирает звук из приложения (браузер), скробблит случайные 5 секунд, опознаёт на gracenote и пишет в last.fm.
Пример — пользователь с приложением (скробблером) ласт.фм, который слушает музыку как в привычном плейере в системе, так и во вконтакте, в яндекс.музыке, на простоплейере без авторизации, в блогах на городском или провайдерском портале, по прямым ссылкам в браузере. Это всё проходит мимо last.fm, а может довольно легко в него попасть.
Gracenote работает не с полной копией файла, а с отпечатками. Трафик отправляется абсолютно минимальный, технология сбора и отправки отпечатка прекрасно работает в самых обычных телефонах Sony Ericsson, называется TrackID. Пятисекундный отрывок моментально обрабатывается и по отпечатку сервис показывает исполнителя, название композиции и альбом.
Повторюсь — ни серьёзные вычислительные мощности, ни какой-то заметный трафик даже для gprs просто не нужны. Кроме того, кэш никто не отменял: незачем сканировать и определять уже определённые ранее треки, например.
Что касается пополнения. Тоже проблемы не вижу, есть несколько способов решения — это и использование более крупных слепков, чем стандартные пятисекундные, в начале интеграции, и просто накопление мелких слепков с композиций — для более-менее популярных песен, которые слушаются ну хотя бы раз 60 (с пяти секунд стандартный слепок, пятиминутный трек) разными юзерами, информация уже сможет появиться.
То есть, id3 с отпечатками перетекает на gracenote, значительно пополняя коллекцию, а last.fm с юзерами взамен получают заметно более точную статистику: файлы без id3 в любых плейерах, любые приложения и веб-сервисы.
Имеет смысл накладывать сверху скробблинг по отрывку не только для онлайн-плейеров. Это применимо для аудио без тегов во всех плейерах, а также для веб-плейеров без скробблеров (в частности, из крупных это ВКонтакте).
По-моему, выгодно для обеих сторон, а юзеры вообще в шоколаде.
1. Улучшение качества сервиса не обязательно возводить в абсолют.
2. Gracenote нужен не абсолютно полного распознавания (я и написал, что last.fm поможет gracenote пополнить базу, а не наоборот), а для того, чтобы скробблить аудио, независимо от наличия id3-тегов.
Подход с поиском причин и поводов «почему нет» совсем убил, вы наверное успешный человек? ;)