HTC Magic. Искал стихи — отлично находит. Искал дома — довольно тихо. На улице не пробовал. Возможно на качество поиска ещё влияет и качество микрофона в телефоне.
Есть только Canon IXUS 80 IS — текст разобрать трудно. Но, клянусь кармой, текст был правильный. Только гугл предложил заменить «не даром» на «недаром».
Фото результата: yfrog.com/0kimg2807gj
У вас сильная перегрузка при записи фразы, это заметно на видео. Говорите потише. «Квадратный корень» у меня распознается всегда, есть проблемы с цифрами. Если произносить «двести пятьдесят шесть» то все работает на ура. В рекламе конечно же приукрашено, но сервис работает вполне сносно, даже смски получается набирать.
В рекламе своего рода ошибка, нужно говорить не «из двух сот пятидесяти шести», а «из двести пятьдесят шесть», так как голосовой поиск сделан на основе «надиктовок» и к сожалению у него нет понятия морфология.
Подтверждаю, у меня «квадратный корень из двести пятьдесят шесть» — с первой попытки правильно распознался. И «японские рестораны на Арбате» — тоже с первой попытки.
Если что, то уменя LG GT540 и Android 2.1. А говорю я держа телефон перед собой, но приближая его ко рту в момент говорения на расстояние 15 сантиметров. То есть примерно также, как автор топика/видео.
При этом конечно не всё и не всегда находится и по моим голосовым командам.
В частности, дома тестовые запросы отлично распознаются, но когда на улице (не хотелось на холоде снимать перчатки и пялиться в экранную клавиатуру по среди цлицы) пробовал искать что-то в духе «интернет-кафе на Комсомольской» — пришлось повторять раз пять.
Поэтому технологию идеальной никак не могу назвать, но и не такая уж она ущербная, как можно решить, посмотрев ролик.
С учётом того, что Гугл сделал публичный голосовой поиск первым — он вполне может рассчитывать на снисхождение. ТВ-реклама — это риск: обычные пользователи (негики) могут попробовать и разочароваться, но Гугл, полагаю, рискует сознательно (хочет увеличить долю в рунете, а для этого надо чем-то эдаким и затейным как раз негиков привлекать).
Так и есть, нужно произносить «из двести пятьдесят шесть» — нашел с первого раза. Для убедительности попробовал еще несколько разных чисел произнести — нашел с первого раза.
Все не так просто у нас в законах в отношении рекламы… Например, когда вы видите рекламу пива (кружка с пеной), то вам на самом деле показывают чай с пеной от моющего средства. Когда вам показывают лапшу быстрого приготовления, то на самом деле вы видите не сам продукт, а полноценно сваренный суп. И так далее. На мой взгляд это тоже совершенно нечестно, но тем не менее — почему-то законно.
Я х.з. что у вас с дикцией. Мой телефон распознал эту фразу произнесенную мной — с первого раза. При wi-fi соединении, распознавание произошло почти моментально.
Вспомните, когда первые телефоны с голосовым набором появились — все тестили и мало у кого работало. Вместо Светы — Лариса, вместо Алексея — Николай. Каким образом можно было так путать — неизвестно, но ведь было. А потом — ничего, вроде, у некоторых даже работало.
Кстати да, сам совсем недавно вспоминал, что во многих (если не во всех) телефонах сейчас есть голосовой набор, но я ни разу не видел не слышал, чтобы кто-то им пользовался.
На самом деле, держа свой Desire примерно в 20-30 сантиметрах от лица, и не разворачивая его микрофоном к себе, а просто развернув монитором, как при обычной работе, получаю абсолютно нормальные результаты. Даже если не находится прямым запросом с первого раза, то в вариантах правильный ответ есть всегда. Во всяком случае, на все запросы которые я делал голосом, я получал правильный результат.
Волна выглядит как будто жёстким компрессором, хард-лимитером или перегрузом прошлись по голосу. У меня на LG GT540 так опасно волна выглядит только если надрывно кричать с 10 сантиметров в микрофон, либо если говорить нормально, но микрофонным краем почти касаться зубов.
Микрофон даже на шумной улице себя отлично показывает, не говоря уже о каких-то тихих помещениях. Так что он правда может быть «слишком мощным» для этих поисков гугл)
Похоже что проблема в качестве сигнала. То есть сам микрофон может и нормальный стоять, но сигнал фильтруется и усиливается програмно, что может сильно портить картину.
Можете попробовать использовать вместе с гарнитурой, и проверьте настройки чтобы не было включено никаких опций типа «разборчивость речи».
Попробовал и на удалении, и как в рекламе. Сколько раз пробовал, столько раз он мне находи квадратный корень из 256.
Вы на диктофон в этой же сотке запишите что вы нафпфеляфили фмкрфн и попробуйте сами это разобрать. И прикиньте заодно, почему отверстие микрофона в большинстве сототк сделано на нижней грани телефона.
только что попробовал «квадратный корень двести пятьдесят шесть» — с первого раза верное распознавание.
HTC Desire, Android 2.2, держал примерно 10см от лица. Кстати судя по форме волны на видео ролике вы говорили слишком громко, у меня форма звуковой волны получается нормальной, не достигает максимума.
Пробовал это и на HTC (Desire, кстати). Не определяло нормально ни с какого расстояния.
Я сам пользуюсь Liquid, так что категорически против: очень приятные устройства!
iPhone 3G — работает голосовой поиск в целом неплохо, хотя и не идеально. Только раз голосовой поиск доступен и для эппловской техники, почему топик в блоге Android?
Попробовал то же самое на htc desire, если говорить «квадратный корень из двухсот пятидесяти шести» то определяет правильно часть фразы до из включительно, а если сказать «квадратный корень из двести пятьдесят шесть» то все как в рекламе.
фотографии байкала распознала с первого раза
мокрые киски — тоже
а так же (!) о боже… — ИСПОДВЫПОДВЕРТА! я в шоке! я уверен тут бОльшая часть пользователей с первого раза произнести то не смогут… )))
Пардон, вы часто в рекламе видите истинную правду? А хотя бы просто правду?
Все что в рекламе видите — делите пополам…
Не буду спорить по данной функции, так как некоторые вещи он определяет на удивление четко, а данный запрос, пожалуй самый сложный, так как содержит предлоги и цифры, возможно из-за этого происходят разногласия и несовпадения.
А я пользуюсь, иногда даже заметки для evernote и смс надиктовываю.
При работающем в фоне телевизоре распознал с первого раза:
«Квадратный корень из тысячи сто семидесяти восьми»
«Японские рестораны в Тюмени»
«Живые обои на андроид»
между прочим, 1178 сразу представил в виде числа, трехзначные иногда выводит текстом.
аппарат Nexus One, у меня проблемы с произношением «р»
Вы ещё на lastfm.ru не видели рекламу bing`а. Согласно рекламе это мего интуитивный поиск. Какого же было моё удивление, когда я начала пробовать вводить тоже самое, оно не только не находило тоже, но и вообще обладало другим интерфейсом.
Голосом в вебе ищу редко, но как Google распознаёт адреса в Maps — очень нравиться.
Ведь это так логично — сказать, куда тебе надо проложить маршрут, а не набивать микроскопическими кнопками адрес.
А я так и не смог поставить его на телефон жене (Nokia X6), захожу по нужному URL — и ничего нигде нет, похожего на заявленный поиск голосом :) А поддержка Sybmian заявлена :)
Не верю! Может у автора ролика что-то с настройками языка? У меня мой нексус с первой попытки угадал (почти) )): он мне показал «квадратный корень из 5 до 6».
При этом, если сказать не «двухсот пятидесяти шести», а «двести пятьдесят шесть» — то с первой попытки. Пусть чуть не по-русски, но все же...
P.S. Я голосовым поиском не пользовался, потому обучиться он у меня не мог.
P.P.S. Хотя если у Voice Search обработка происходит на сервере, то вполне его сейчас Харбраволна «ищущих корень» могла и подучить — от того он мне сразу и ответил правильно :)
у меня тоже. Автор поломал основную фишку гугла, теперь никто не узнает какой квадратный корень из 256, школьники в панике.
Пусть автор ради приличия напишет ответ на этот вопрос где-нибудь
У меня есть подозрение, что точность определения сильно зависит от популярности фразы, ну или сочетания слов. На самом деле надо почитать, что пишут гугловцы о своем алгоритме.
Как я понимаю, этот поиск ничто иное как набор неких паттернов, которые последовательно применяются к голосу. При этом они дают некую оценку насколько хорошо паттерн подошел. Потом несколько таких паттернов собираются в одну фразу и получается некая релевантность фразы. Действительно чем популярнее фраза, тем выше у нее релевантность. Чем лучше подошли паттерны, тем также выше релевантность.
Долго проверял на айфоне 4.
В своей дикции я уверен, но «квадратный корень из двухсот пятидесяти шести» не распозавался никак (возможно, дело именно в морфологии).
Стоит отметить, что «японские рестораны на арбате» и «фотографии байкала на закате» распознались с первого раза.
Голосовой набор пока хорошо работает только на английском, и для английского я пользуюсь в основном только им. Даже если нужно повторить 2-3 раза это всё равно быстрее, чем печатать на экранной клавиатуре. А вот на русском — годится только для смеха.
Награды этого видео (9)
#89 — Лидеры обсуждений Сегодня)
#3 — Лидеры обсуждений Сегодня) — Наука и техника
#67 — Топ избранного Сегодня)
#70 — Топ избранного Сегодня) — Наука и техника — Весь мир
#1 — Топ избранного Сегодня) — Наука и техника
#37 — Лучшие оценки Сегодня)
#72 — Лучшие оценки Сегодня) — Наука и техника — Весь мир
#1 — Лучшие оценки Сегодня) — Наука и техника
#65 — Лучшие оценки За неделю) — Наука и техника
На самом деле гугл сделал гениальную фишку, я ей пользуюсь постоянно. Работает очень хорошо. В ролике просто пользовались ей неправильно. У меня на HTC Desire HD распознала со первого раза. Причем отлично работает и с БТ гарнитурой. Хитрость в том, что говорить надо не как в КПК, а как в телефон, то есть включаем голосовой поиск (удержанием кнопки поиска это сделать удобнее), после этого подносим телефон к уху, как при разговоре (или гарнитуру ставим туда, где она используется при реальном разговоре и проверено хорошо работает) и начинаем говорить. Как я понимаю, телефон заточен под такой паттерн использования и даже использует датчик ускорения, чтобы понять, что ты поднес телефон к уху. После того как все сказал, возвращаем телефон назад в поле зрения.
Единственное видел, что оно еще и понимает голосовые команды вроде play или call Вот эти штуки не работают ни на русском, ни на английском языке. Так же не работают голосовый команды с гарнитуры, он их просто игнорирует. Видимо не поддерживает эту фишку.
Собственно этот голосовой ввод это реально киллер фича, скажем менее удобный гугл мапс (относительно яндекса) я использую только изза нее. Попадание очень высокое.
Если бы еще допилили, чтобы с гарнитуры можно было позвонить таким образом или проиграть композицию. Или даже сделать запрос, чтобы тебе зачитали результат поиска… Или чтобы ты сказал, отведи меня домой и тебе голосом бы объяснили куда идти… В общем фишка клевая, но простора для роста хватает.
Так, оно, скорее всего, на серверах Google работает, ибо мощности телефонного железа вряд ли хватит, чтобы обеспечить распознавание. Скорее всего, телефон просто сигнал фильтрует и отправляет на сервер некую сигнатуру. А Google, пока (?), не знает, чего у вас за музыка в проигрывателе.
Мы с друзьями втроем тестили. Когда произносил первый у него на 95% попадало слово в слово почти любой запрос. У меня попадало процентов 50 или вылезало что-то фонетически похожее. Третий как не пытался, все время какая то хрень получалась. Ощущение что много зависит от тембра голоса.
С самого первого дня показа этой рекламы проверил все фразы нормальным голосом приложив телефон к уху (HTC Desire).
1. Говорил «квадратный корень из двести пятьдесят шесть» — нашел правильно. (Нельзя слепо верить рекламе — нужно экспериментировать).
2. «Фотографии Байкала на закате» — и опять в десятку.
Сейчас по запросу про корень первая ссылка ведет на хабр :)
Как и у предыдущих авторов, отлично распознал голосовой запрос с квадратным корнем(iPhone 3G). Похоже что с микрофонами у «отличной вещи» что то не так.
Тестил на своем Acer Liquid, надо очень громко и очень отчетливо говорить, если шум, то определяет с большим напрягом. Пробовал несколько раз, не распознал.
И даже у меня на Nokia E72 под Symbian ;)
Как уже верно сказали выше — автора ролика почему-то не насторожило, что он говорит слишком громко, и звук просто обрезается.
У меня все прекрасно работает на HTC Incredible,
Посмотри на настройки микрофона, у тебя амплитуда сигнала сильно зашкаливает, это видно в твоем ролике. Уверен практически, что все проблемы из-за этого. Микрофон либо рыпит при записи, либо завышена чувствительность. Я несколько раз повторял нормальным спокойным голосом с разными интонациями и громкостью и, если орать в трубку, то действительно находит гелентвагены с офисом 2007 :)
Распознавание речи это старинная задача, пока что не выполненная никем. Не думаю что на нормальном уровне это сейчас осуществимо. Может быть только на уровне голосового управления телефоном. Возможно допилят так, что можно будет выполнять поиск простых словосочетаний с 5-10ого раза.
Короче, зря вы придираетесь к Гуглу и тратите свои нервы, что «вот де они такие нехорошие, ещё ничего хорошего не сделали, а уже рекламу забабахали».
Ну во-первых, всё же очень большой процент запросов обрабатывается вполне корректно уже сегодня и у очеь большого числа людей, а ничего подобного пока от потенциальных конкурентов нет :)
Ну а во-вторых, и в главных, мне кажется, что Гугл так специально делает, а именно, начинает продвигать ещё сыроватый сервис. Распознавание речи, как и многие другие сервисы, такие как translate и search, основаны в первую очередь на сборе и автоматическом анализе данных, получаемых из вне. То, что вы попробовали один раз, увидев рекламу, а потом повторили очень близкую (для компьютера), а проще сказать ту же самую (для человека) фразу, когда результат вас не устроил, является прекрасным маркером того, что вот тут ошибка, это отправляется на автоматический анализ, таким образом накапливается база произношений, интонаций, нюансов голоса, чёткости речи и пр., что в будущем улучшит сервис. Именно поэтому Гугл выкидывает сначала довольно сырые продукты, продвигает, чтобы люди пробовали, тем самым применив эволюцию (в плане развития алгоритма распознавания) и любовь людей к халяве (голосовой поиск для всех бесплатный), чтобы развить свой сервис.
Так что вы в прямом эфире побыли хомячком, который в практически прямом эфире дал маленький толчок в сторону улучшения всего и вся в Гугл. Поздравляю :)
только что проговорил своему дроиду квадратный корень из 256 с первого раза выбило, просто нужно четко и медленно ему говорить, хотя не всегда распознает
У меня почти всегда находит, обычные поисковые запросы, думаю, ему по зубам. На английском вполне допилено — много сложных запросов правильно обрабатывает.
Квадратный корень из 256 или провал voice search