Comments / Profile of yurkennis / Habr

Денис Юркин @yurkennis

User

Profile Publications 7Comments 132Bookmarks 5

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 14:57

Приложение под платформу Windows Phone уже находится в разработке, следите за анонсами.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 14:54

Мы будем работать над тем, чтобы функция распознавания становилась удобнее. Это один из вариантов, который будем рассматривать.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 14:51

Да, действительно раньше использовали технологии SoundHound — и совсем недавно перешли на собственное решение в мобильном приложении Яндекс.Музыка (и на iOS, и на Android). Причин перехода несколько:
1) нам удобнее самим контролировать качество продукта и развивать его в тех направлениях, которые важны для наших пользователей
2) так появляется больше возможности применять наши наработки к смежным областям (классификация жанров, склейка дублей и т.п.)

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 14:02

Спасибо — отлично подходит к нашему разделу «Малоперспективные подходы» :-)

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 13:57

Спасибо, интересный вопрос, такое исследование мы пока не проводили. На первый взгляд, оно потребует некоторой ручной работы по разметке жанра для нераспознанных треков.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 13:46

Мы рады что вам понравилось :-)

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 13:45

Пока мы не очень её продвигали, ей попробовали воспользоваться порядка 20% пользователей мобильного приложения Яндекс.Музыка.
Со временем планируем сделать её более заметной — это тоже должно повлиять на популярность этой функции.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 13:39

Нет, такой возможности не предусматривали — на первый взгляд кажется, что это совсем не массовая потребность.

Look

Как Яндекс распознаёт музыку с микрофона

yurkennis May 28 2013 at 13:10

Спасибо вам за отзыв, очень приятно!

Look

Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #2)

yurkennis Apr 10 2013 at 19:57

Получается, что сначала пишется сравнительно быстрый расчет фактора, а после одобрения экспертным советом еще «вылизывается» до последнего такта и байта?

Не совсем. Сначала делается «грязная» реализация, демонстрирующая только прирост в качестве — безотносительно вычислительных ресурсов. Если она не вызывает содержательных возражений у экспертов, дальше реализуется «чистая» версия, которая да, предельно оптимизируется по тактам и байтам :-)

Look

Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #2)

yurkennis Apr 4 2013 at 14:30

Спасибо за внимательность! Исправили.

Look

Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #1)

yurkennis Mar 28 2013 at 19:02

Давайте мы опубликуем оставшиеся два поста, а по итогу посмотрим, какие из ваших вопросов остались без ответа — годится?

Look

Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #1)

yurkennis Mar 27 2013 at 17:05

Любая классификация (в том числе определение заспамленности или «взрослости» контента) — вероятностная задача, в которой есть полнота и точность (которые никогда не достигают точных 100%).

Поэтому ситуации вроде ошибочной пессимизации или пропадания были и будут всегда. Мы следим за цифрами в среднем по всему множеству сайтов, и в случае значительных ухудшений ситуации в целом — откатываем алгоритм к предыдущей версии. Заниматься ручным исправлением ситуации с отдельными сайтами по жалобам — с точки зрения пользовательского счастья менее эффективно, чем решать более общую проблему, приведшую к жалобе. А мы работаем прежде всего на пользовательское счастье.

Look

Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #1)

yurkennis Mar 27 2013 at 16:32

Мы готовы обсуждать формы сотрудничества — пишите на адрес anaderi@yandex-team.ru

Выпускать в опенсорс не планируем.

Look

Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #1)

yurkennis Mar 27 2013 at 12:14

Илья добавил важное уточнение: habrahabr.ru/company/yandex/blog/174213/#comment_6057001

Look

Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #1)

yurkennis Mar 26 2013 at 20:53

В тексте уже звучала цифра:

В ранжировании эксперты определяют порядок, в котором нужно показывать документы по конкретным запросам. Таких запросов десятки тысяч.

В процентах, разумеется, это ничтожная доля — потому что уникальных запросов пользователи задают несопоставимо больше.

Look

Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #1)

yurkennis Mar 26 2013 at 20:24

В тексте уже звучала цифра:

В ранжировании эксперты определяют порядок, в котором нужно показывать документы по конкретным запросам. Таких запросов десятки тысяч.

Look

Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #1)

yurkennis Mar 26 2013 at 19:23

Если кратко — асессору выгодно делать много качественных оценок. Трудовые отношения с асессором — извините, тут совсем офтопик.

Look

Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #1)

yurkennis Mar 26 2013 at 19:06

У нас другие сведения :-) Вот, например, запрос [grand vitara], выдача для Краснодара.

Вот как он изменился даже за несколько месяцев — сравниваем выдачу сегодня и в сентябре-2012:

1 suzuki.drom.ru/grand_vitara/ www.suzuki-motor.ru/auto/new/grand-vitara/about/
2 www.grand-vitara.com/ suzuki.drom.ru/grand_vitara/
3 www.auto-creditline.ru/sell_cat.php?cid=352 www.club-vitara.ru/
4 www.suzukiauto.com/grand_vitara/ ru.wikipedia.org/wiki/Suzuki_Grand_Vitara
5 www.carexpert.ru/aresp.php?idmodel=suzkv www.drive2.ru/cars/suzuki/grand_vitara/
6 www.suzuki-motor.ru/auto/new/grand-vitara/about/ www.carexpert.ru/aresp.php?idmodel=suzkv
7 newmpv.ru/sites/95 www.vitara-club.ru/
8 www.r93.ru/suzuki/grand_vitara/ www.vitara-club.ru/
9 newmpv.ru/sites/95 www.grand-vitara.com/
10 www.yuginform.ru/auto/krd/suzuki/grandvitara www.cardriver.ru/catalogue/new/Suzuki/Grand_Vitara.html?comments=1

Что уж говорить про более длинные промежутки…

Look

Ранжирование в Яндексе: как поставить машинное обучение на поток (пост #1)

yurkennis Mar 26 2013 at 18:27

Цифры, разумеется, условные — лишь показывают разницу порядков на разных этапах.

Если же углубляться в смысл картинки:
— где 10^12 — подразумевались скорее известные УРЛы
— где 10^8 — грубая прикидка документов, найденных по короткому, простому запросу

Look

1 2 3

5 6 7