Pull to refresh

Comments 152

Когда-нибудь допилят, отрихтуют и будет все же работать.
Более 50 раз пришлось сказать одно и то же в тихом помещении. Что же на улицах?!
Допилят, не сомневаюсь. Но пусть тогда и ставят рекламу!
Не скоро это будет, видимо.
а какая разница? Пусть ставят тогда рекламу не скоро
HTC Magic. Искал стихи — отлично находит. Искал дома — довольно тихо. На улице не пробовал. Возможно на качество поиска ещё влияет и качество микрофона в телефоне.
Сейчас пробовал найти в помещении при включенной музыке — тоже всё отлично работает. Что я делаю не так?
Видео можно увидеть как Вы делаете. Тоже у вас хочу научиться.
Что Вы хотели сказать в первом предложении? Мне не ясен смысл. Я, кстати, не автор ;) Если вы об этом…
Думаю там знак вопроса потерялся. Иначе говоря, от вас хотят пруф.
Это я о том, что хотелось бы увидеть видео того, как вы используете голосовой поиск при включенной музыке.
www.youtube.com/watch?v=jNPPkQuKb-c

Есть только Canon IXUS 80 IS — текст разобрать трудно. Но, клянусь кармой, текст был правильный. Только гугл предложил заменить «не даром» на «недаром».
Фото результата: yfrog.com/0kimg2807gj
Вы не орете в микрофон, как автор видео, и не создаете дополнительных помех. :)
Верно, а говорите нежно как с девушкой:)
Меня понимает нормально. Но на шумной улице пока не проверял.
тоже не смог найти «квадратный корень из двухсот пятидесяти шести», а вот «квадратный корень из двести пятьдесят шесть» находит на ура.
У вас сильная перегрузка при записи фразы, это заметно на видео. Говорите потише. «Квадратный корень» у меня распознается всегда, есть проблемы с цифрами. Если произносить «двести пятьдесят шесть» то все работает на ура. В рекламе конечно же приукрашено, но сервис работает вполне сносно, даже смски получается набирать.
«Рецепт борща» с первого раза определил на улице, на подходе к «Ленте».
В рекламе своего рода ошибка, нужно говорить не «из двух сот пятидесяти шести», а «из двести пятьдесят шесть», так как голосовой поиск сделан на основе «надиктовок» и к сожалению у него нет понятия морфология.
Подтверждаю, у меня «квадратный корень из двести пятьдесят шесть» — с первой попытки правильно распознался. И «японские рестораны на Арбате» — тоже с первой попытки.

Если что, то уменя LG GT540 и Android 2.1. А говорю я держа телефон перед собой, но приближая его ко рту в момент говорения на расстояние 15 сантиметров. То есть примерно также, как автор топика/видео.
Двести пятьдесят шесть определяет быстрее, да)
При этом конечно не всё и не всегда находится и по моим голосовым командам.

В частности, дома тестовые запросы отлично распознаются, но когда на улице (не хотелось на холоде снимать перчатки и пялиться в экранную клавиатуру по среди цлицы) пробовал искать что-то в духе «интернет-кафе на Комсомольской» — пришлось повторять раз пять.

Поэтому технологию идеальной никак не могу назвать, но и не такая уж она ущербная, как можно решить, посмотрев ролик.

С учётом того, что Гугл сделал публичный голосовой поиск первым — он вполне может рассчитывать на снисхождение. ТВ-реклама — это риск: обычные пользователи (негики) могут попробовать и разочароваться, но Гугл, полагаю, рискует сознательно (хочет увеличить долю в рунете, а для этого надо чем-то эдаким и затейным как раз негиков привлекать).
Так и есть, нужно произносить «из двести пятьдесят шесть» — нашел с первого раза. Для убедительности попробовал еще несколько разных чисел произнести — нашел с первого раза.
Корень не пробовал. А порно ищет прекрасно. пробовал с iPad'а
Порно было единственной вашей причиной для приобретения iPad?
как раз это было единственным разочарованием
UFO just landed and posted this here
порно на лапате нету. там нет флэша
UFO just landed and posted this here
UFO just landed and posted this here
Гугле оптимизировали функцию для поиска порно, очевидно же. Не терять же им такой большой рынок пользователей.
Самый популярный запрос в голосовом поиске по теме порно: «аа… ааа… АААА!!!!».
Ну, так когда будет работать, тогда и надо рекламировать!
Наивный чукотский школьник юноша, реклама по ящику вас нагло обманула, да?
А по вашему, рекламировать незаконченный продукт по ТВ(!) — это нормально?
Это называется недостоверная реклама, и за это есть наказание в законах России.
Все не так просто у нас в законах в отношении рекламы… Например, когда вы видите рекламу пива (кружка с пеной), то вам на самом деле показывают чай с пеной от моющего средства. Когда вам показывают лапшу быстрого приготовления, то на самом деле вы видите не сам продукт, а полноценно сваренный суп. И так далее. На мой взгляд это тоже совершенно нечестно, но тем не менее — почему-то законно.
О, да) Если я потеряю этот бедный аккаунт, буду в печали((
Я х.з. что у вас с дикцией. Мой телефон распознал эту фразу произнесенную мной — с первого раза. При wi-fi соединении, распознавание произошло почти моментально.
Если бы пытался только я. А с дикцией всё отлично)
наверняка зависит не только от дикции, но и от модели аппарата (микрофон), а так же от окружающей обстановки и т.д…
Было испробовано на разных аппаратах, разных компаний.
Возможно. Я в тихой комнате. Аппарат Google Nexus One

П.С: Что за мания сразу срать в картму?
Это не я. Я этого никогда не делал и делать не буду, ибо каждый имеет право на мнение. )))
Вспомните, когда первые телефоны с голосовым набором появились — все тестили и мало у кого работало. Вместо Светы — Лариса, вместо Алексея — Николай. Каким образом можно было так путать — неизвестно, но ведь было. А потом — ничего, вроде, у некоторых даже работало.
А вы не заметили, что не прижилась функция? Почти все до сих пор ручками набирают!)
Кстати да, сам совсем недавно вспоминал, что во многих (если не во всех) телефонах сейчас есть голосовой набор, но я ни разу не видел не слышал, чтобы кто-то им пользовался.
Я и голосовой поиск использовать не буду) Вообще больше Яндекс люблю (особенно за яндекс.маркет… купил там почти всё, что использую!)
Уважаемый, Вы меня пугаете. :)
И этот человек «как бы» пишет объективную статью о гугл. Ну-ну. :-)
Он удобен при наборах через гарнитурку, например когда за рулём.
не стоит судить только посебе. это очень удобная функция
Аналогично, только число как и написано выше надо произнести как «двести пятьдесят шесть». Все с первого раза. Motorola Milestone 2
Я вчера проверял кстати, например «кафе в люберцах» четко нашел.
Несложные слова нормально понимает.
А верить рекламе даже дети перестали.
У вас в ролике видно, что идет явное переусиление когда вы надиктовываете, поэтому железка не может ничего разобрать.
Я пытался издалека, пробовал за чаем говорить лежащему в метре от меня смартфону. Как я только не пробовал)
На самом деле, держа свой Desire примерно в 20-30 сантиметрах от лица, и не разворачивая его микрофоном к себе, а просто развернув монитором, как при обычной работе, получаю абсолютно нормальные результаты. Даже если не находится прямым запросом с первого раза, то в вариантах правильный ответ есть всегда. Во всяком случае, на все запросы которые я делал голосом, я получал правильный результат.
+100

Такое впечатление, что этот гуглоненавистнический пост писал владелец айфона. Почему у меня всё распознаёт хорошо, быстро и без ошибок?
Волна выглядит как будто жёстким компрессором, хард-лимитером или перегрузом прошлись по голосу. У меня на LG GT540 так опасно волна выглядит только если надрывно кричать с 10 сантиметров в микрофон, либо если говорить нормально, но микрофонным краем почти касаться зубов.
Возможно в настройках микрофона включено что-то вроде автоматического «гейна»?
Микрофон даже на шумной улице себя отлично показывает, не говоря уже о каких-то тихих помещениях. Так что он правда может быть «слишком мощным» для этих поисков гугл)
Похоже что проблема в качестве сигнала. То есть сам микрофон может и нормальный стоять, но сигнал фильтруется и усиливается програмно, что может сильно портить картину.
Можете попробовать использовать вместе с гарнитурой, и проверьте настройки чтобы не было включено никаких опций типа «разборчивость речи».
Попробовал и на удалении, и как в рекламе. Сколько раз пробовал, столько раз он мне находи квадратный корень из 256.

Вы на диктофон в этой же сотке запишите что вы нафпфеляфили фмкрфн и попробуйте сами это разобрать. И прикиньте заодно, почему отверстие микрофона в большинстве сототк сделано на нижней грани телефона.
только что попробовал «квадратный корень двести пятьдесят шесть» — с первого раза верное распознавание.
HTC Desire, Android 2.2, держал примерно 10см от лица. Кстати судя по форме волны на видео ролике вы говорили слишком громко, у меня форма звуковой волны получается нормальной, не достигает максимума.
опа, выше уже про громкость сказали ) видимо дело в микрофоне аппарата. как я уже и говорил раньше: асер — фуфло )
Пробовал это и на HTC (Desire, кстати). Не определяло нормально ни с какого расстояния.
Я сам пользуюсь Liquid, так что категорически против: очень приятные устройства!
UFO just landed and posted this here
«Квадратный корень из 256 или провал Coverbacker»
UFO just landed and posted this here
UFO just landed and posted this here
iPhone 3G — работает голосовой поиск в целом неплохо, хотя и не идеально. Только раз голосовой поиск доступен и для эппловской техники, почему топик в блоге Android?
Для тех, кто мне не верит, пройдите по ссылке — www.google.ru/mobile/voice-search/
Цитирую:
В телефонах iPhone и Nokia (версия S60 V3) Голосовой поиск – это одна из функций приложения Google Mobile App.
Блог считаю наиболее подходящим, так как наилучшая интеграция с самим Android, да и устройства в ролике работают на этой ОС.
Не убедительно. ИМХО, считаю, что лучше поместить топик в блог Google.
Отличная интеграция с устройствами Symbian v3, два нажатия и готов результат. Использую на Nokia E66.
А почему вы не попробовали распознать фразу, вырезанную из самой рекламы? Было бы интересно.
Если говорить
«Корень из двести пятьдесят шесть»
«Корень из сто»
то все уверенно распознается с первого раза.
Коряво конечно, но работает…
Ну и ничего не коряво. С киборгом всё таки общаетесь. =)
Попробовал то же самое на htc desire, если говорить «квадратный корень из двухсот пятидесяти шести» то определяет правильно часть фразы до из включительно, а если сказать «квадратный корень из двести пятьдесят шесть» то все как в рекламе.
«Фотографии Байкала» не распознается.
«Мокрые киски» отлично.
фотографии байкала распознала с первого раза
мокрые киски — тоже
а так же (!) о боже… — ИСПОДВЫПОДВЕРТА! я в шоке! я уверен тут бОльшая часть пользователей с первого раза произнести то не смогут… )))
У меня тоже самое. И дикция то у меня не самая идеальная:) Видимо большую роль играет сам аппарат.
Пардон, вы часто в рекламе видите истинную правду? А хотя бы просто правду?
Все что в рекламе видите — делите пополам…

Не буду спорить по данной функции, так как некоторые вещи он определяет на удивление четко, а данный запрос, пожалуй самый сложный, так как содержит предлоги и цифры, возможно из-за этого происходят разногласия и несовпадения.
С первого раза распознал
Спица 2.2
А я пользуюсь, иногда даже заметки для evernote и смс надиктовываю.

При работающем в фоне телевизоре распознал с первого раза:
«Квадратный корень из тысячи сто семидесяти восьми»
«Японские рестораны в Тюмени»
«Живые обои на андроид»

между прочим, 1178 сразу представил в виде числа, трехзначные иногда выводит текстом.

аппарат Nexus One, у меня проблемы с произношением «р»

В целом, считаю, что очень удачно распознает.
UFO just landed and posted this here
UFO just landed and posted this here
Вы ещё на lastfm.ru не видели рекламу bing`а. Согласно рекламе это мего интуитивный поиск. Какого же было моё удивление, когда я начала пробовать вводить тоже самое, оно не только не находило тоже, но и вообще обладало другим интерфейсом.
UFO just landed and posted this here
Да, через Американский прокси ищет лучше и даже стало похоже. Но ещё до уровня, который показывался в рекламе очень далеко.
у меня почему-то на lg optimus практически все что я пытался найти отлично находилось. «Квадратный корень из четырех» в том числе.
я думаю при большом желании все эти проблемы можно списать даже на погоду и на запах изо рта автора ролика :)

идея то хорошая и правильная, ну да, местами сыровата — допилят

возможно ещё дело в микрофоне телефона, было бы интересно сравнить поведение на разных машинках и от разных производителей
UFO just landed and posted this here
Голосом в вебе ищу редко, но как Google распознаёт адреса в Maps — очень нравиться.
Ведь это так логично — сказать, куда тебе надо проложить маршрут, а не набивать микроскопическими кнопками адрес.
А я так и не смог поставить его на телефон жене (Nokia X6), захожу по нужному URL — и ничего нигде нет, похожего на заявленный поиск голосом :) А поддержка Sybmian заявлена :)
Не верю! Может у автора ролика что-то с настройками языка? У меня мой нексус с первой попытки угадал (почти) )): он мне показал «квадратный корень из 5 до 6».

При этом, если сказать не «двухсот пятидесяти шести», а «двести пятьдесят шесть» — то с первой попытки. Пусть чуть не по-русски, но все же...

P.S. Я голосовым поиском не пользовался, потому обучиться он у меня не мог.
P.P.S. Хотя если у Voice Search обработка происходит на сервере, то вполне его сейчас Харбраволна «ищущих корень» могла и подучить — от того он мне сразу и ответил правильно :)
Теперь есть реальный повод распеваться по утрам
«квадратный корень из двести пятьдесят шесть» распознал моментально, и первая ссылка в гугле — на этот топик =))
у меня тоже. Автор поломал основную фишку гугла, теперь никто не узнает какой квадратный корень из 256, школьники в панике.
Пусть автор ради приличия напишет ответ на этот вопрос где-нибудь
Квадратный корень из 256 равен 16 :D
У меня есть подозрение, что точность определения сильно зависит от популярности фразы, ну или сочетания слов. На самом деле надо почитать, что пишут гугловцы о своем алгоритме.
Как я понимаю, этот поиск ничто иное как набор неких паттернов, которые последовательно применяются к голосу. При этом они дают некую оценку насколько хорошо паттерн подошел. Потом несколько таких паттернов собираются в одну фразу и получается некая релевантность фразы. Действительно чем популярнее фраза, тем выше у нее релевантность. Чем лучше подошли паттерны, тем также выше релевантность.
Продам ноутбук Санкт-Петербург кишки
Долго проверял на айфоне 4.
В своей дикции я уверен, но «квадратный корень из двухсот пятидесяти шести» не распозавался никак (возможно, дело именно в морфологии).
Стоит отметить, что «японские рестораны на арбате» и «фотографии байкала на закате» распознались с первого раза.
на айфоне 2ж (3.1.3) распозналось со второго раза, только предлог «из» пропал, а так ровно как в рекламе)
Голосовой набор пока хорошо работает только на английском, и для английского я пользуюсь в основном только им. Даже если нужно повторить 2-3 раза это всё равно быстрее, чем печатать на экранной клавиатуре. А вот на русском — годится только для смеха.
Награды этого видео (9)
#89 — Лидеры обсуждений Сегодня)
#3 — Лидеры обсуждений Сегодня) — Наука и техника
#67 — Топ избранного Сегодня)
#70 — Топ избранного Сегодня) — Наука и техника — Весь мир
#1 — Топ избранного Сегодня) — Наука и техника
#37 — Лучшие оценки Сегодня)
#72 — Лучшие оценки Сегодня) — Наука и техника — Весь мир
#1 — Лучшие оценки Сегодня) — Наука и техника
#65 — Лучшие оценки За неделю) — Наука и техника
На самом деле гугл сделал гениальную фишку, я ей пользуюсь постоянно. Работает очень хорошо. В ролике просто пользовались ей неправильно. У меня на HTC Desire HD распознала со первого раза. Причем отлично работает и с БТ гарнитурой. Хитрость в том, что говорить надо не как в КПК, а как в телефон, то есть включаем голосовой поиск (удержанием кнопки поиска это сделать удобнее), после этого подносим телефон к уху, как при разговоре (или гарнитуру ставим туда, где она используется при реальном разговоре и проверено хорошо работает) и начинаем говорить. Как я понимаю, телефон заточен под такой паттерн использования и даже использует датчик ускорения, чтобы понять, что ты поднес телефон к уху. После того как все сказал, возвращаем телефон назад в поле зрения.
Единственное видел, что оно еще и понимает голосовые команды вроде play или call Вот эти штуки не работают ни на русском, ни на английском языке. Так же не работают голосовый команды с гарнитуры, он их просто игнорирует. Видимо не поддерживает эту фишку.

Собственно этот голосовой ввод это реально киллер фича, скажем менее удобный гугл мапс (относительно яндекса) я использую только изза нее. Попадание очень высокое.

Если бы еще допилили, чтобы с гарнитуры можно было позвонить таким образом или проиграть композицию. Или даже сделать запрос, чтобы тебе зачитали результат поиска… Или чтобы ты сказал, отведи меня домой и тебе голосом бы объяснили куда идти… В общем фишка клевая, но простора для роста хватает.
Так, оно, скорее всего, на серверах Google работает, ибо мощности телефонного железа вряд ли хватит, чтобы обеспечить распознавание. Скорее всего, телефон просто сигнал фильтрует и отправляет на сервер некую сигнатуру. А Google, пока (?), не знает, чего у вас за музыка в проигрывателе.
Как только увидел сразу проверил, iPhone 3G с первого раза всё нашлось.
Пользуюсь регулярно. Девять из десяти раз распознает верно.
Иногда достаточно сложные запросы.
Очень удобно пользоваться голосовым поиском в Картах Гугл. Написание адреса иногда занимает очень много времени, а тут произнес — вот и искомое место.
Только что попробовал и с первого раза получил верный ответ.
У меня получилось «квадратный корень из двухсот пятидесяти 6i». Работает, если 256 в именительном падеже.
Вы не пробовали в качестве запроса подсунуть звуковой фрагмент из рекламного ролика?
На iPhone из 20 запросов только 1 был похож на правду.
Может что-то изменилось но сейчас поиск работает отменно
Порой конечно не распознает голос, но достаточно точен
Мне вообщем непонятно в чём дело
Мы с друзьями втроем тестили. Когда произносил первый у него на 95% попадало слово в слово почти любой запрос. У меня попадало процентов 50 или вылезало что-то фонетически похожее. Третий как не пытался, все время какая то хрень получалась. Ощущение что много зависит от тембра голоса.
Сказал в Galaxy S «квадратный корень из двести пятьдесят шесть» и он мне открыл вот эту страницу хабра. Как бы сам себя разоблачает =)
Spica 2.2 с первого раза распознал.

По запросу «Квадратный корень из 256» этот пост на первом месте в гугле )
С самого первого дня показа этой рекламы проверил все фразы нормальным голосом приложив телефон к уху (HTC Desire).

1. Говорил «квадратный корень из двести пятьдесят шесть» — нашел правильно. (Нельзя слепо верить рекламе — нужно экспериментировать).
2. «Фотографии Байкала на закате» — и опять в десятку.

Сейчас по запросу про корень первая ссылка ведет на хабр :)
Распознал с первого раза, посчитал, а первым линком — эта статья;))
Iphone. С первого раза все определил. Возможно дело в микрофоне или в речи.
Хотя у меня есть дефекты речи, и я никак не диктор.
Как и у предыдущих авторов, отлично распознал голосовой запрос с квадратным корнем(iPhone 3G). Похоже что с микрофонами у «отличной вещи» что то не так.
Тестил на своем Acer Liquid, надо очень громко и очень отчетливо говорить, если шум, то определяет с большим напрягом. Пробовал несколько раз, не распознал.
Вы просто как-то не так его держите(Джобс(с))
может гугль просто плохо умеет работать с падежами в русском?
например, «квадратный корень из двести пятьдесят шесть» распознал с первого раза
Глупый ролик. У меня на нексусе все нормально работает
И даже у меня на Nokia E72 под Symbian ;)
Как уже верно сказали выше — автора ролика почему-то не насторожило, что он говорит слишком громко, и звук просто обрезается.
«компьютер, квадратный корень из двухсот пятидесяти шести запустить процедуру самоуничтожения! Код допуска 0000, капитан Джеймс Кирк...»
первый раз у меня сразу нашёл корень, без попыток повтора.
сейчас попробовал второй раз спросить — гугл отправил на этот пост.
У меня все прекрасно работает на HTC Incredible,
Посмотри на настройки микрофона, у тебя амплитуда сигнала сильно зашкаливает, это видно в твоем ролике. Уверен практически, что все проблемы из-за этого. Микрофон либо рыпит при записи, либо завышена чувствительность. Я несколько раз повторял нормальным спокойным голосом с разными интонациями и громкостью и, если орать в трубку, то действительно находит гелентвагены с офисом 2007 :)
говорите дальше от микрофона — у вас уровень записи зашкаливает
У меня Acer Liquid. Юзал и дома и на улице ещё месяц назад — никаких нареканий. Что-то с вашим голосом не то.
Распознавание речи это старинная задача, пока что не выполненная никем. Не думаю что на нормальном уровне это сейчас осуществимо. Может быть только на уровне голосового управления телефоном. Возможно допилят так, что можно будет выполнять поиск простых словосочетаний с 5-10ого раза.
на десайре распозналось с 4го раза
Короче, зря вы придираетесь к Гуглу и тратите свои нервы, что «вот де они такие нехорошие, ещё ничего хорошего не сделали, а уже рекламу забабахали».

Ну во-первых, всё же очень большой процент запросов обрабатывается вполне корректно уже сегодня и у очеь большого числа людей, а ничего подобного пока от потенциальных конкурентов нет :)

Ну а во-вторых, и в главных, мне кажется, что Гугл так специально делает, а именно, начинает продвигать ещё сыроватый сервис. Распознавание речи, как и многие другие сервисы, такие как translate и search, основаны в первую очередь на сборе и автоматическом анализе данных, получаемых из вне. То, что вы попробовали один раз, увидев рекламу, а потом повторили очень близкую (для компьютера), а проще сказать ту же самую (для человека) фразу, когда результат вас не устроил, является прекрасным маркером того, что вот тут ошибка, это отправляется на автоматический анализ, таким образом накапливается база произношений, интонаций, нюансов голоса, чёткости речи и пр., что в будущем улучшит сервис. Именно поэтому Гугл выкидывает сначала довольно сырые продукты, продвигает, чтобы люди пробовали, тем самым применив эволюцию (в плане развития алгоритма распознавания) и любовь людей к халяве (голосовой поиск для всех бесплатный), чтобы развить свой сервис.

Так что вы в прямом эфире побыли хомячком, который в практически прямом эфире дал маленький толчок в сторону улучшения всего и вся в Гугл. Поздравляю :)
«квадратный корень из двухсот пятидесяти шести минус кишки минус галенваген минус продать минус купить»
только что проговорил своему дроиду квадратный корень из 256 с первого раза выбило, просто нужно четко и медленно ему говорить, хотя не всегда распознает
У меня почти всегда находит, обычные поисковые запросы, думаю, ему по зубам. На английском вполне допилено — много сложных запросов правильно обрабатывает.
Sign up to leave a comment.

Articles

Change theme settings