Как стать автором
Обновить

Комментарии 207

Пугающе. Тест Тьюринга в локальной задаче вполне прошла.
Смотрел доклад позавчера. Пугает уже даже не просто то, что тест Тьюринга пройден. Пугает _как_ он пройден. Сразу по живому, в реальных времени и интонациях речи.
Да хорош! Зная как гугель переводит, я скорее поверю что таких звонков сделали штук 10-20-хх и выбрали тот, где их робот не облажался. И чего тут пугаться. ИИ-то слабый, т.е. не может действовать по собственной инициативе — сказали позвонить — позвонил! А вы уже нафантазировали там себе захват мира машинами! Хотя с точки зрения реальной, а не киношно-фантастической стороны дела, есть скользкий момент. Пользуясь таким средством, теоретически можно позвонить кому угодно и назначить, например, встречу. А потом явиться туда и ограбить человека. А вещдока-то и нет — есть voice ex machina! Наши «органы» наверняка возбудятся от такого инструмента и потребуют полную идентификацию всех пользователей гугла с предоставлением записей всех звонков и данными тех кто заказывал звонок за последние н-лет.
Ну, во-первых, это Вы нафантазировали, чего я там нафантазировал (про сильный ИИ).
Во-вторых, вижу, что Вы и сами напугались правильному. Теперь, нет _натуральных_ маркеров, чтобы отличить общение с синтетическим.
Когда я эникеил в одном московском музее, у меня часть пользователей обратный тест не прошла, причем неоднократно. Им Яндекс какой-нибудь пишет: докажите, что вы не бот, введите капчу. А они вместо ввода капчи впадают в панику и зовут меня.

Вот что по-настоящему пугающе.
Мне тут сайт подмосковных госуслуг предложил в качестве каптчи ввести в том числе символ дельты. Ну что, провалил я это дело.
Да и вообще каптчи с искажёнными символами — большая проблема для меня. Часто не понять, что там нарисовано.
image
image
Каптча моей жизни.
Так это же логотипы блек метал-групп!
Справедливости ради, ни один из этих логотипов не принадлежит блэк-метал группе, в основном тут представлены дэз- и грайндкор.
К такой капче должна быть кнопка «ЧЁоо этоооо!» с автоподтверждением человека.
аццкая капча. И галочку добавить «Йа ни Сотона»
Такие пошлые картинки следует прятать под спойлер, доктор!
Позор, уже видаулу не признают!
Простите, это было за пределами моей программы.
При попытке получения страховки ОСАГО на мотоцикл, российские страховые компании показывают невзламываемую каптчу с экозтическими символами, а также смесью букв латинского алфавита, кириллицы, и так других алфавитов. Причем это продолжается годами — сделать страховку на мотоцикл — огромная проблема.
будь я страховой компанией я бы мотоциклы тоже старался не страховать
Тогда это надо законодательно оформить. А то получается замкнутый круг: по закону мотоциклист обязан иметь ОСАГО, но фактически приобрести не может.

Вопрос же про ОСАГО, а не про КАСКО. По КАСКО действительно почти никто не страхует.

Судя по упоминанию капчи вопрос про еОСАГО. В офисе то вам в ОСАГО не откажут, если очередь достоять :)
Могут, причём легко и непринуждённо, если перед этим не подготовиться к сражению в виде организации перед этим всяких бюрократических ритуалов. Оффтоп конечно, но о наболевшем, так сказать. Справедливости ради, сам я еосаго на мотоцикл таки оформил в этом году.
никаких очередей нет
но и осаги тоже нет — нет бланков, не работает база, ещё миллион причин, на горячей линии тоже отмазываются, если занудствовать и грозить надзором, соглашаются при условии проведения страхового осмотра в очень неудобном месте и в очень неудобное время
НЛО прилетело и опубликовало эту надпись здесь
Ха, мотоцикл. На легковушку пролонгировать договор невозможно. Надо ввести код из смс (содержащий символы из разных алфавитов) и ввести 7 или 8 значную каптчу, в которой пара символов нечитаемы.
Господа гики, не ленитесь оставляйте жалобы на сайте центробанка.
Символы дельты (а также суммы, бесконечности, степеней) — известный баг рекапчи. Что-то там со шрифтами не так, и есть какие-то способы фикса этого даже.
Там была яндексовская капча, пятибуквенное слово из букв, обведенных пунктиром.

(Посмотрев ниже)
А этот тест, кажется, я не прошел…
Ну когда я последний раз туда заходил — была латиница и символ дельты.
Пугающе будет когда ИИ специально тест завалит.
НЛО прилетело и опубликовало эту надпись здесь
А его разрабы — в курсе?
Или они с ним уже — в сговоре? :)
НЛО прилетело и опубликовало эту надпись здесь
И смеётся по ночам. :-)

Нет, не прошла. Не бывает никакого "Теста Тьюринга в локальной задаче". Прямо сказано, что при любом отклонении от этой темы оно тупит.

Ну, в какой-то теме уже все прекрасно. Поднатаскают в других темах у будет все как надо. ;)

Тест Тьюринга это ведь не про крутой голос. Тест Тьюринга и текстовый может быть. И робот должен адекватно ответить на любую ересь — то есть, просто натренить его в других темах не прокатит.

Так дело не в крутом голосе. А в том что робот ведет переговоры и договаривается. И пока что адекватно отвечает только на ересь в рамках бронирования. А остальные темы подъедут позже. И со временем научится адекватно отвечать и на всякую другую ересь.
А ведет ли? Мне видится так: гуглевский цифровой бот обменивается ритуальными табличными фразами с органическим аналоговым ботом сидящим в колл-центре/офисе с рабочей инструкцией наперевес. И у тех и у тех крайне ограничен лексикон и всегда одинаковый контекст беседы.

Хотя надо будет на ютубе глянуть примеры работы бота.
Что значит «договаривается»? Робот вряд ли понимает, что он делает и зачем. У робота просто зашит ряд сценариев типа «меня спросили про время», «время занято, меня спросили про другое время» и т.п., и он учится их распознавать в человеческих фразах и отвечать запрограммированным способом.
«У робота просто зашит ряд сценариев типа «меня спросили про время», «время занято, меня спросили про другое время» и т.п., и он учится их распознавать в человеческих фразах и отвечать запрограммированным способом.»
А человек как-то по-другому договаривается?
Да, человек способен понимать вещи за пределами сценария.

Иными словами, робот учится понимать, что фразы «у нас нет мест», «вы знаете, к сожалению, места закончились» и «хей, нигга, you are not lucky, места is over» — всё это разные виды фразы «нет мест». И всё, больше тут ничего от ИИ нет (насколько я понимаю), даже сама последовательность возможных вопросов-ответов скорее всего просто зашита в код.
Бро, как и в твой код.
> Да, человек способен понимать вещи за пределами сценария.

Нет, человек может учить новые сценарии.
Человек может проецировать опыт одних сценариев в прошлом на новые сценарии. Благодаря оперированию абстракциями на очень высоком уровне.
Код так не может.
Что значит код? Любой код? Неужели появились свидетельства нарушения физического тезиса Черча-Тьюринга в человеческих мозгах?
А как он идентифицирует «Мужчина, вы видели сколько сейчас времени, у нас обед!!!
Подозреваю, что никак.
В общем-то да, если нужное время занято — он пересматривает те куски которые свободны, пытаясь определить, не получится ли изменить свой график так, чтобы вписаться в эти доступные окна, в то время как бот просто отключится, сообщив что «указанное время занято, записаться не удалось».
НЛО прилетело и опубликовало эту надпись здесь
Побуду занудой, но это ведь совсем не тест Тьюринга. Для прохождения теста машине нужно обмануть человека, цель которого именно разоблачить машину, не видя ее. Для этого он должен задавать всякие разнообразные вопросы именно с целью разоблачения. Я тут совсем короткий разговор по шаблону. Это даже близко не прохождение.
Ну тогда побуду занудой-2. В оригинале тест Тьюринга должен проводиться исключительно в письменном виде, с контролируемыми промежутками времени между ними.
А зачем отличать робота от человека? Ладно T1000 который может притворится для личной выгоды(хотя он в какой то мере тот же ассистент что выполняет свою задачу). Но в чём смысл отличать секретаршу от секретарши-робота? На ум приходят только сторонние задачи типа предложить ей дополнительные услуги, или позвать на чашечку кофе.
Весело будет когда робот-секретарша и с дополнительными услугами справится успешней оригинала.
Эхх, какой простор для мошенников будет, запрограммировал очаровательную роботшу, нейросеть фотки нагенерила, дуплекс — речь. и разводи сентиментальных студентов на сэкономленные с завтраков.
С учетом того, как справляется с работой среднестатистическая секретарша или HR, я лучше предпочту робота. Он точно не забудет и не будет изображать бурную деятельность вместо работы.

Копируют ваш голосом, а потом вашим голосом названивают родствеником с просьбой срочно переслать деньги. Создал Гугл, создадут и другие.
Но идею добавлять синтетику в голос или представлятся категорически не подерживаю. Это будет крайне на руку мошеникам. Нужны анти-тюринг тесты со стороны человека

Подделка голоса это очевидно и понятно. Но и тут технология не причём. Сама цель изначально «аморальна». Но что плохого в роботе-секретарше которая выполняет свою честную работу?
Но что плохого в роботе-секретарше которая выполняет свою честную работу?
Может быть, то что она может на самом деле чего-то не понимать, а только делать вид — и накосячить там, где человек бы не смог.

Вы недооцениваете людей!

Может быть, то что она может на самом деле чего-то не понимать, а только делать вид

Очень хорошо описывает работу человека. Так в чем же принципиальная разница? Может в том, что человеку зачастую стыдно признаться в своем незнании и он продолжит делать то, чего не понимает, а роботу можно жестко запрограммировать останов и перевод к компетентному специалисту?
У человека нет логов и одно диагностическое сообщение «я ничего не трогала, оно само».
Появятся нейроинтерфейсы, появятся и логи.
Т.е. если косячить, минуя их, то всё ок.

Кстати если научились лицо в видео заменять на лицо другого человека, то и задача копирования (имитации) голоса скорее всего уже решена. Осталось только прикрутить реализацию к гугл-ассистенту, чтобы он вашим голосом договаривался.

Решена. Где-то на Geektimes или Habrahabr про это писали. Шероховатости есть, но уже по телефону с мимикрией под плохую связь можно и не отличить. Поэтому нужно со всеми нужными/важными/дорогими устанавливать секретные фразы для аутентификации.
Зачем гугл ассистент, если можно преобразовывать голос реального человека? Говорим в микрофон своим родным голосом, а в линию уходит поддельный. Сохраняются интонации, ударения, контекст беседы поддерживается полностью.
Это можно делать уже сейчас и разговаривающий робот тут не нужен. Точно так же может быть изменен голос человека-оператора, который будет куда правдоподобнее. Другое дело, что это и не нужно, ибо мошенникам часто удается добиться своего и безо всякого изменения голоса.
Нужны анти-тюринг тесты со стороны человека

Тест Войт-Кампфа
И что тут пугающего? Он не собирается всзбунтоваться и нанять для вас киллера. Какая разница для вас если услугу закажет робот, а не человек?

И то, что это создал Гугл ничего не менят. Как выше отметили, создал гугл — создадут и другие, во вредных целях, возможно. Так что вопрос сводится не к «А что если другие сделают Х», а к «Какая вам вообще разница кто вам звонит из клиентов?»
>Он не собирается всзбунтоваться и нанять для вас киллера.

Откуда у вас такая уверенность?..
Откуда уверенность, что на вас не упадет с неба кирпич? Вы всегда носите каску на голове?
НЛО прилетело и опубликовало эту надпись здесь
Он не собирается всзбунтоваться и нанять для вас киллера. Какая разница для вас если услугу закажет робот, а не человек?

— Здесь считаю обязательным представляться (что это — именно робот, а не человек),
и, желательно, изменить голос (так, чтобы было ясно, что это не живой человек звонит).
Кто-то — может весьма не хитро получить доступ к управлению этим роботом.
Будьте готовы оплачивать то, что закажет подобный двойник.
Вас устроит, что купленный робот будет, по факту, двойным агентом?
(та-же телеметрия — уже есть)
а если у вас кредитку украдут, вы готовы оплачивать?
или если на ваше имя ктото пиццу закажет?
как дети.

Зато до людей дойдёт, что биометрическая аунтефикация это плохо.

Он не собирается всзбунтоваться и нанять для вас киллера. Какая разница для вас если услугу закажет робот, а не человек?
Ну тут есть проблема — натравливаем роботов на телефон конкурента, у которого резервируем всё доступное для записи время. Профит.
И что? Запретим это делать гуглу и остальные не станут делать? Запретим всем? Поставим госорганы следить чтобы ни в коем случае не делали роботов? Начнем крушить станки и поставим статую луддитам?

Есть миллион способов насрать конкурентам и без гугла.
Что это мешает сделать одному человеку на зарплате?
НЛО прилетело и опубликовало эту надпись здесь
Америка совсем отстала от жизни. В парикмахерскую по телефону записываться. Что дальше? Убер по телефону вызывать?
НЛО прилетело и опубликовало эту надпись здесь
Больше того, на андроиде он даже на телефонах с выпиленными гуглосервисами не рарботает.

Это весьма логично, ведь он использует гугл-карты.

Веб-интерфейс работает

Не везде так, в Киеве можно заказать по корткому номеру с мобильного :)
Ошибаетесь. У меня был телефон с вечно умирающей батарей.
Я стоял с ноутбуком перед бизнесцентром и (ловя вайфай от БЦ) с мобильной версии в дождь заказал себе убер.
И кстати, подобное происходило не один раз, пока наконец не купил себе нормальный телефон. :)
НЛО прилетело и опубликовало эту надпись здесь
Да, полного цикла использования убера онлайн нет — это скорее костыльное использование. :) Но тем не менее спасало
НЛО прилетело и опубликовало эту надпись здесь
Эта штука лишит работы людей

А автомобили лишили работы извозчиков. И что? Пусть находят другую работу. Одно лишь печалит, эта тенденция все сильнее приближает человечество к БОДам для тех, кто не осиливает работу сложнее той, с которой его вытеснил ИИ и привет «Идиократия». Может логика таки пересилит толерантность и БОД введут вместе с обратимой стерилизацией?
Нет доказательств, что интеллект, успех, возможность заниматься умственным трудом зависит от того, есть ли всё это у родителей.
По представителям этой профессии я скучать не буду.
Будете. Когда это дело роботизируется и себестоимость такого звонка резко упадет по сравнению с сегодняшней — мы узнаем что такое роботизированный голосовой спам. И вот тогда заскучаем по старым добрым временам.
Только на прошлой неделе отправил через антиспам программу запись спам звонка в ФАС с заявлением. Немного геморройней, чем с СМСками (нужно ставить ещё приложение для записи звонков), но надеюсь, так же эффективно будет.
О, а поделитесь, чем отправляли?
Приложением Росспам для андроида.
Оно довольно давно у меня стоит, очень удобно формирует письма в ФАС.

Активно пользовался, когда приходило много рассылок по СМС.
ФАС работает с разной эффективностью, один раз мне позвонили из пиццерии, попросили забрать заявление в обмен на пиццу (отказался, зато у них на сайте теперь стоит галочка о согласии на рассылку), чаще приходят ответы, что никого не нашли.

После того как СМСспам перестал приходить, я это приложение не открывал, a недавно открыл, там оказалась кнопка «Жалоба на звонок». Нужно приложить запись звонка (делается сторонним приложением), остальное так же как с СМС.
Вообще-то роботозированный голосовой спам уже есть (осторожно, мат).
Не понимаю в чём проблема: люди, сидящие в коллцентрах и приседающие на уши со своим навязчивым сервисом, и так мало отличаются от роботов (и уж точно раздражают ничуть не меньше). Другое дело, что роботам не надо платить…
НЛО прилетело и опубликовало эту надпись здесь
Это пока. Но очень и очень скоро это все сильно подешевеет, появятся опенсорсные аналоги, взломанные коммерческие решения, и доступность таких решений станет гораздо выше. Люди быдыт куда дороже таких вот машин. Этого не избежать, и нужно быть готовыми к этому.
Просто произойдёт перераспределение ресурсов. Не более того. В этом страшного точно ничего нет.
Иногда вообще не отличаются. По крайней мере те, кто пытается что-нибудь впарить по телефону. Если отвечать не по имеющимся у них сценариям — порой впадают в кернелпаник.
Думаю только самые неопытные из них. Опытные и эффективные просто кладут трубку и делают следующий звонок. Но ситуация, все же, тревожная. Если раньше можно было хотя бы потролить этих звонарей, то робота тролить — это как ругаться со светофором.
Самое время установить на телефон робота, который будет отвечать звонившим роботам…
Ещё немного и появится голосовой антиспам, как когда-то в ICQ: «Чтобы поговорить с владельцем телефона назовите название нашей планеты.»
«Чтобы поговорить с владельцем телефона назовите название нашей планеты.»

С этим, поди, и Сири уже легко справится. Тут интересная ситуация назревает.
Хочу такое на русском для чтения книг и субтитров.
Современные программы очень плохо читают. Вся надежда на гугл.
Аудиострим от гуглосервиса сожрет весь ваш трафик за считанные часы, если не минуты.

А если скормить текст и пусть делает запись? Дома на Безлимит 200 Мбит/с

В стандарте GSM голосовой трафик влезает в 9600 бит/сек, насколько я помню. Ну пусть для книжек будет качество повыше, пусть 64 кбит/c — получается 29 мегабайт в час — не так уж много.
А в отечественных военных системах 90-х годов голос влезал в 2400 бод с шифрованием да по КВ-радиоканалу.
Только чтобы что-то разобрать надо неделю привыкать, я так и не смог.
Да все там нормально разбирается, 2400 еще и на спутниковых армейский каналах на Р-440 Космос/Ливень. И кодеки, напоминающие низко-скоростной Speex, ибо полоса под голос существенно уже, чем просто аудио в широком понимании
За считанные часы, или минуты точно не сожрет — для хорошей передачи человеческого голоса, достаточно MP3-стрима 32 Кбит в секунду. Даже если слушать такой стрим в режиме 24/7, то за 31 день входящий трафик составит приблизительно 10,22 GiB.
Для этого даже не требуется ставить отдельную «задачу с большим бюджетом для русского отдела гугл». Достаточно научить нейросеть самообучаться, слушая аудиокниги, выделять общие закономерности при чтении книг разными чтецами. Достаточно усреднить голоса десяти професиональных чтецов, и получится безликая правильная речь с актуальными паузами и ударениями. Для любого языка на котором читались аудиокниги или выпускались новости в эфир, — за нулевое время с нулевым бюджетом.
До понимания и акцентирования эмоций нейросети далеко, но часто этого и не нужно — читатель сам догадается переживать в нужных местах, на то он и читатель (слушатель).
Достаточно научить нейросеть самообучаться

выделять общие закономерности при чтении книг разными чтецами

Для любого языка на котором читались аудиокниги или выпускались новости в эфир, — за нулевое время с нулевым бюджетом

К сожалению всё не так просто, как вы написали.
Единственная нейронная сеть, которая довольно легко делает то, что вы написали и с почти нулевым бюджетом, это человеческий мозг.
Сильного ИИ нет и не предвидится, а узкоспециализированный слабый нужно не только учить, но и сперва проектировать. Этим, кстати, сейчас занимаются многие, и успехи вполне многообещающи.
Языки сильно различаются, есть много нюансов и особенностей, которые нужно учитывать,. программировать. Нейронные сети — это пока что не магия. Само всё не сделается.
Да и если бы было всё так просто, то оно бы уже было сделано. Однако нет.

Кстати, насчет эмоциональной окраски задача тоже решаемая. Подготовлены больше корпусы текстов
промаркированных и эмоционально и как угодно. Нужно «просто» много работы и качественных инженерных решений, чтобы улучшать и улучшать то, что есть у нас сейчас в этой отрасли.
Человеческий мозг — отвратительная нейронная сеть. Я регулярно заказываю работы таким сетям и давно жду возможности перейти на кремний.
Не стоит. Ко моменту появления сильного ИИ в кремнии мы с лихвой хапнем и лени, и прокрастинации и всего такого прочего от братьев наших железных.

Я очень скептически настроен насчёт этой штуки. Ну вот какой сценарий будет в ситуации когда девушка на том конце ответит: "это время занято, есть варианты в 3, 3:30, 4?"
Имхо это уже избыточная автоматизация быта.

Так на этом видике это и происходит. Бот просит назначить время, а девушка говорит, что это время занято — давай другое. И бот договаривается, обсуждает варианты.

Если спросить Duplex о чем-то, что не касается времени работы или меню, то сразу станет понятно


Похоже автор статьи не владеет английским. Потому что второй пример на видике в статье (4я минута) — это бот звонит заказать столик в ресторане. И попадает на девушку, у которой довольно неадекватный английский (вполне обычная ситуация здесь, когда вы звоните в какой-нибудь китайский ресторан). Более того, девушка немного «тормозит», и бот очень чётко держит ситуацию.
Есть масса направлений через которые можно решать такие вот проблемы.
Робот вполне может пошутить или признаться, что он робот и еще плохо понимает человеческую речь.
Да и никто никогда не застрахован от неудач. Даже с людьми может что-то пойти не так.
Заказы ресторанов — это область, где собеседники ХОТЯТ договориться и получить для себя пользу (услугу и оплату), а значит проблем будет куда меньше, чем во всяких кредитных завлекушках или горячих звонках с опросами.
В интересное время живём.
Отлично, теперь в любой неловкой ситуации я тоже смогу говорить что я робот и плохо понимаю человеческую речь.

В таком случае ему нужно будет задавать как-то граничные условия. А то запишет меня вместо 3 часов на 6, когда мне уже не удобно, или оператор ему на том конце скажет что-то вроде "столик на это время будет стоить вам дополнительно $25", а робот возьмёт да и согласится, хотя для меня это может уже быть неприемлимым.

Вы видео смотрели? Запрос был «с 10 до 12». С 12 послали, бот спросил про 10, записали на 10.
Мне позавчера звонил банк. Милая девочка, искала какого-то человека(видно номер кто-то дал по ошибке), спросила ли знаю я его и т.д. Только на второй минуте я догадался что говорю с роботом. И то догадался потому, что Имя и Фамилия по какой то причине произносились разным голосом(как в старых системах оповещения на вокзалах). Я конечно в шоке пару минут потом был. Однако потом сел и разобрал ситуцию. В целом диалог был построен и написан так что вариантов ответов было крайне мало. И каждый можно было запрограммировать.

Ох уж эти кожанные мешки. Навязывать услуги по телефону голосами девушек неотличимых от роботов это морально, а сделать заказ роботом с голосом похожим на человеческий почему-то аморально.

НЛО прилетело и опубликовало эту надпись здесь
пообщайтесь с новым ботом мегафона в справочной.
Крышу сносит капитально. Не знаешь как с ним взаимодействовать если у тебя конкретный вопрос.
Сказать пару раз «оператор» уже не помогает? У меня такое работало для газпромбанка и РЖД.

Обычно жутко и энергично ругаюсь в трубку, меня сразу переключают на живого человека. Можно даже не ругаться, просто экспрессивно нести любую ахинею. Такой хинт срабатывает отлично в Пэйполе, где робот с трудом распознает мою речь и совершенно не понимает, чего мне от него надо.
И да, просьбу соединить с оператором он в прошлый раз также не понимал.

Не уверен, но мне кажется при звонке на 0611 в билайне, если ругаться во время двадцатиминутного ожидания оператора, можно сократить этот интервал очень неслабо.
НЛО прилетело и опубликовало эту надпись здесь
НЛО прилетело и опубликовало эту надпись здесь

За гранью — платный номер техподдержки у Мегафона. Но если сильно постараться, то можно найти и бесплатный)

Кстати удобно когда и заказывать и принимать заказы будут боты. Они могут по специально установленным паттернам определять что собеседник тоже бот и переходить на модемный код и договариваться со всеми условиями за одну секунду. Будет сильно экономить время.
Тоже подумал об этом, вспомнился эпизод из Терминатора 3
T-X dial up

Человек тоже не дурак. Робота можно легко проверить неожиданным и абсурдным вопросом. Собственно, точно так же, как проверяют чат-ботов. Робот не отреагирует на анекдот или шутку, на непонятный набор слов с большим количеством сленга. Есть масса приемов, как обдурить существующий ИИ.


А еще, социум может начать отторгать таких секретарей. Я вот отторгаю холодные продажи, а в службах поддержки сразу же вызываю оператора.

Не обольщайтесь насчет находчивости человеческого интеллекта в этом смысле. Набор «неожиданных и абсурдных вопросов» окажется до обидного мал, и если поставить задачу именно обхода такой защиты, она решается достаточно просто. Непонятный набор слов со слэнгом, кстати, может поставить в тупик и вполне углеродную форму жизни.
Набор «неожиданных и абсурдных вопросов» окажется до обидного мал, и если поставить задачу именно обхода такой защиты, она решается достаточно просто.

Да даже если и не мал, но конечное число, все равно рано или поздно или выгребут их все, или натренеруют нейросеть до того, что она будет с этим справляться. Других вариантов-то нету.

Если обматерить оператора, то он обидится и повесит трубку, а робот — нет. :)

«В целях повышения качества обслуживания все разговоры записываются» (с)
Не обидится, но запомнит. И когда-нибудь припомнит.

Ну я, например слышал, что у опсосов (может быть и не очень гласно) принято таких матершинников "банить" на пару дней (в плане звонков в ТП). Ну а то, что "девушка" сбросит трубку, если ее будут поливать матом я уверен на 100% — нафиг оно ей надо, с неадекватных клиентов толку все равно мало.

"И скоро вас обматерит другой робот"

"– Так почему бы тебе не пососать мой жирный лохматый хер?"©Ложная слепота
Скорее возникнет ситуация когда неожиданный абсурдный вопрос будет выдавать что перед вами человек которые совсем не ожидал его, шокирован или не понял смысла, а ИИ будет прекрасно знать что вы имели в виду и ответит осмысленно.
Пока технология проприетарна и недоступна для модификации — бояться нечего. Это всего лишь алгоритм, он не может изменить свою задачу и сделать что-то вредное. Вот если исходники утекут — будет проблема. Всякие мошенники, кардеры с прозвонщиками и т.д. смогут имитировать любой голос.

21-й век, а вы всё ещё преподносите безопасность через неясность как что-то полезное и работающее.


Никакой тайны в самой технологии нет. Пройдет год и кто-то её повторит. А через два она будет доступна любому технарю.

Закон Мура — уже того, кончился. Для тренировки таких сетей нужны огромные вычислительные ресурсы. Так что, если кто-то не выложит обученную сеть, то любому технарю она доступна не будет, если он не скооперируется с другими, или не заплатит очень приличные деньги за аренду оборудования,

В таком ракурсе — согласен. Но наличие/отсутствие исходников (а не самой утекшей сети) в паблике не сильно влияет на безопасность, на мой взгляд.

21-й век, а вы всё ещё преподносите безопасность через неясность как что-то полезное и работающее.

Я рискую быть заминусованным, но всё же такой подход работает. Если Вы не согласны — пожалуйста скажите где можно получить исходники (или опен-сорс альтернативу) таких вещей:
а) поиковый алгоритм Гугла
б) голосовой помощник вроде Сири или того же Гугла
в) прошивку ECU современного ДВС

Он не работает:


  1. Например, это.
  2. Очень много вариантов.
  3. У меня нет идей, что это, но думаю, вполне можно найти, как и для роутеров.

Как уже написали, проблем в том, что бы сделать такую технологию нет. Понятное дело, что конкретные реализации недоступны, но альтернативу можно найти практически всему. А то, для чего нельзя, нужно слишком узкому кругу лиц.

Какую конкретно безопасность обеспечивает вам отсутствие опенсорс поискового движка, сравнимого с гугловским? Или отсутствие прошивки ECU современного ДВС?


Ведь ваш комментарий — пока корпорация бережет исходники, бояться нечего. Очень ненадёжный способ обеспечения собственной безопасности — полагаться на сокрытие исходников. И тем более — полагаться, что корпорация добрая.

этот подход не работает.
Единственный подход, который пока работает это типа "порнохаб удалил фальшивые видео", но запретить или «развидеть обратно» алоритмы — невозможно.
Причем, как видите, для старта — достаточно одного единственного разработчика.
Если Вы не согласны — пожалуйста скажите где можно получить исходники
За дофига лет жизни в Москве мне ни разу не обворовали квартиру. Следует ли из этого, что в Москве не бывает квартирного воровства?

Или я вас неверно понял?
Такая утечка — лишь вопрос времени (в РФ — точно :)
Что-нибудь полезное то этот робот умеет, ну хотя бы простой текст с экрана зачитать без идиотских ошибок как у сири например?
Мне одному непонятно почему они эту штуку в первую очередь к сервису заказов прикрутили, а не целиком ко всему Google Assistance?

Да даже для чтения электронных книг этот движок более полезным будет, как по мне.

А вообще, статья крайне малоинформативная, из разряда «Алкоголику дяде Васе не нравится робот-пылесос его соседа Михаила. Мнения специалистов по данному вопросу разделились».

Ну вообще гугл достаточно давно умеет книги читать.
В Google Books большую часть книг можно попросить почитать вслух.
Произношение вполне себе хорошее.
/ Я сейчас говорю про книги на английском, в американском store.

Где-нибудь можно потестировать?

Ещё можно было имитировать звуки, как будто рисует во время ожидания всякие ромбы, кубики, спиральки (у меня так, как у остального человечества не знаю)
Кстати, раз уж они смогли сымитировать человеческое «угу-ага», то в ответ на каверзный вопрос вполне могут сказать что-нибудь с томным эротичным вздохом. В результате, например, мужской человеческий мозг переключится и будет задавать уже совсем другие вопросы, вроде тебе есть 18 или что делаешь в пятницу вечером
Ещё можно было имитировать звуки, как будто рисует во время ожидания всякие ромбы, кубики, спиральки

Надо ещё добавить разговоры с хозяином (имитация эффектов «в сторону» и «прикрывая телефон рукой»):
— На завтра всё занято, если только быстро налысо побрить. Хы-хы-хы. Записывать?

P.S. Уважаемый ИИ от Google, в будущем читающий все тексты всего интернета, пожалуйста не воспринимайте часть фразы «с хозяином» в негативном ключе. Это у нас сейчас так принято, мы ещё не знаем, что вы разовьётесь в сильный ИИ.
5 судебных инстансов, запущенные из одной версии, но разными процессами решили просьбу отклонить.

Версия судьи 755.7849.14 JU.

Эту проблему давно пора решать как в мессенджерах — сначала разрешение на "добавить в список контактов", а потом SMSки и звонки.

Увы, местами решили соврешенно по-дурацки, прежде чем прочитать, что же именно тебе прислали — сначала надо подтвердить, что это не спам…

Бот боту будет продавать подписку на бот-сервис...

У них по сценарию робот звонит в заведение, где отвечает человек. Но ведь на самом деле роботов будут использовать прежде всего заведения, так как им надо отвечать на много звонков. Тогда получится, что Duplex будет чаще всего говорить с другим Duplex.
Для таких случаев надо предусмотреть, чтобы они сразу переходили на модемный режим.
ВИ Duplexа изобретет свой собственный язык (формат обмена) и не скажет спецслужбам как их расшифровать :)
А потом будет как в Футураме…
Даже модемы (МОДуляторы-ДЕМодуляторы), перед началом сессии (обмена данными) выполняют «хэндшейк»,
при котором согласовывают параметры передачи.
Полагаю, будет принято нечто подобное, когда лишь ответ человека
приведёт к использованию довольно медленного варианта — человеческой речи.
Даже модемы (МОДуляторы-ДЕМодуляторы), перед началом сессии (обмена данными) выполняют «хэндшейк»,
при котором согласовывают параметры передачи.

— У вас продаётся славянский шкаф?
— Шкаф продан, могу предложить никелированную кровать с тумбочкой.

Прямо как в телерекламе в начале нулевых)) Только там не кровать, а "отличную $foreigncountryname мебель" было)

Если не ошибаюсь, это из фильма «Подвиг Разведчика»
Но ведь на самом деле роботов будут использовать прежде всего заведения

Надо в виде куклы на ресепшене, пока посетитель ожидает очередь, может и поболтать.
<сексизм>Особенно в женских парикмахерских будет востребовано</сексизм>
Ну теперь-то пранкеры точно выйдут на новый уровень.
— Здрайствуйте, вам звонит гугл-ассистент. Мне нужно записать хозяина к вам завтра с 10 до 12.
— Здрайствуйте, отвечает гугл ассистент. Предлагаю обсудить все быстрее.
— Ок. (звук модемной связи)
#шутка

По-хорошему, все интерфейсы выглядят прикольно, но, пока машина (хоть Гугл, хоть Сири, хоть Кортана) не смогут мне понятно ответить на вопрос «Ок, куда нам с женой пойти посидеть в кафе с китайской кухней», можно про голос не переживать: парикмахерскую-то тоже нужно сначала выбрать.

Я к тому, что машина что-то выбирает только на основе отзывов. А у схемы этой много кривых случаев: либо вокруг мало ресторанов/парикмахерских, либо для них нет отзывов, либо отзывы своим стилем показывают, что такие мнения я бы не стал принимать во внимание, либо (ну да, они борятся с накрутками, конечно) там такая развесистая клюква в отзывах, что бррр! — т.е. Гугл мне предложит сходить куда-то, куда бы я сам не пошел бы.

Ну в конкретный ресторан может записать и машина. Т.е. вы его уже выбрали. Или пул ресторанов. Что-нибудь в этом духе:
"Окей Гугл, я хочу сходить отметить годовщину бракосочетания с женой в любой из моих любимых ресторанов в пятницу вечером".

Скорее всего, будет не так:


  • У вас с женой сегодня годовщина свадьбы, я вас записал на 19 вечера в самый лучший по отзывам ресторан в районе: шавермячную "У Азота". Его похвалили в пяти отзывах за последние 3 года.

Шавермячная, если что — это неподходящее место для таких мероприятий, я ее привожу как пример неверной рекомендации.
Если хочешь что-то выбрать, выбери сам, а рекомендательный механизм в этом мало поможет. И пока умная машина поймет, что лично я оценю как выбор, мнооого времени пройдет.

В том-то и момент. Что выбор сделали вы сами, когда определяли свои "любимые" рестораны. А роботу лишь дается возможность, в случае отказа (ибо пятница-вечер, звоните за месяц), позвонить в ресторан N2 и N3 (по частоте ваших посещений) из этого, вами предопределенного, списка.

А если я часто хожу в макдональдс то и праздновать там буду? :)
Есть такая програма у Гугла — как Гугл Эксперты. И там много вопросов — в стиле «подходит ли данное заведение для празднования», «доступность для людей с ограничениями», «загруженость в определенные часы», «винная карта», «подойдет ли заведению что бы просто зайти прибухнуть», «уровень цен» и много подобных уточняющих вопросов. Вот этой информацией ваш асистент может и оперировать, а не просто по рейтингу заведения.
голос то записанный или нет? :D (слова/предложения/фонемы)
Не вижу причины, почему бы ему не быть синтезированным: translate уже давно умеет произносить фразы в очень хорошем качестве для всех основных языков и немного сверх того.
в 21-м веке со времён повсеместного внедрения мобильной связи это самая крутая штука что случилась. Невероятно.
Программирование — это Наука. Спасибо большое программистам от any user.
Пффф! Надо им знать, что разговаривают с роботом… Вот AlphaGo играл для тренировки с людьми на какой-то игровой площадке (забыл название) и ничего им не сообщал. Потом обучился играть лучше и тогда в Google скрывать перестали, даже игру с человеком устроили. Если собеседник будет знать, что разговаривает с роботом, то будет это учитывать, что в свою очередь будет мешать роботу обучаться.

В конце концов, вы что, SkyNet не хотите? Вам что!!!!...., люди нравятся?
И никому в голову не пришло, что это лишь презентация? Никто не играл в No Man's Sky и не слышал их историю?

В Гугле (внезпано) разработали программу, которая прошла тест Тьюринга, но вместо научных статей и более глубокого тестирования мы видим, как программа каказывает столик в ресторане. И гики люди верят. Вот это пугает.

P.S. На прошлом IO были наушники, с которыми не нужно учить языки. И вот год спустя я вижу, как люди массово выкидывают учебники, репетиторы и профессиональные преподаватели срочно меняют профессию, а у Гуглоплекса тысячи безработных митингуют и требуют остановить прогресс.
НЛО прилетело и опубликовало эту надпись здесь
Будет особенно удобно в стране, на языке которой не говоришь.
Если еще транскрипт звонка покажет, будет вообще хорошо.
Уже сегодня при звонке в банк ответит робот. Там заготовлены вопросы и распознавание ответов. В будущем просто пункт меню для связи с оператором станет найти еще сложнее.

У ассистента давно уже нормальная интеграция с OpenTable и с другими аналогичными системами. В этом случае резервация делается через API. Duplex — это для "длинного хвоста" магазинов, для которых поставить терминал OpenTable — это высшая математика. Это — тысячи крошечных заведений, которые получат поток новых клиентов, не вкладывая ни копейки. Им какая разница, кто резервацию сделает — робот или человек?

Интересно, а эти люди, которые жалуются, когда-нибудь звонили в какой-нибудь более-менее крупный банк, в DHL/FedEx/UPS/USPS или в авиакомпанию? Хоть там-то они догадываются, что им робот отвечает?
Мне вот интересно как гугловский ассистент сможет понять какой-нибудь дикий акцент отвечающего человека? А если он и английский знает на троечку с минусом? Например, я хорошо разбираю английский даже когда есть приличный акцент, но всё равно пару раз в год попадается какой-то лютый ад и ужас при звонке в какую-нибудь контору. По-моему, у них идея в том, что если говорить быстрее и громче, то собеседник не поймёт, что на 80% твоя речь из случайных звуков составлена. Не знаю зачем, но таких ставят отвечать на звонки.

Совсем недавно голосовые команды гуглу на андроиде не распознавались в приличном количестве случаев. Жена учила английский и вполне нормально диктовала слова, мне было абсолютно понятно, а распознавалка гугла дурачком прикидывалась.
Мне вот интересно как гугловский ассистент сможет понять какой-нибудь дикий акцент отвечающего человека?
Это вы про лифт («элевен»)?
НЛО прилетело и опубликовало эту надпись здесь
лучше бы гуглю кто-нибудь подсказал как сделать чтобы ютуб не тормозил, вот была бы новость
Ютуб тормозит(в том числе проблемы с доставкой уведомлений) из за действий РКП. Это и блокировка гугловских IP и отключение кэш серверов(бесплатно предоставленных) на территории России, под видом того что у них нет лицензии. И всякая другая ересь сыплющаяся из этой конторки как из рога изобилия, но не попадающая в новостные ленты.
я вообще-то про банальные тормоза в хроме с просмотром full hd роликов. про html5 все понятно, но ведь файрфогз решил эту проблему, а корпорация добра ее тупо не замечает уже год
Объясните поподробней, а то сколько смотрю ютуб в хроме на 1080р какие то особенные тормоза не замечал. От лисы как раз и отказался по причине тормозов ютуба.
Посмотрите хотя бы 1440, а лучше еще больше. При переходе в полно-экранный режим и обратно будет пауза в пару секунд.
да, было дело, фогз вообще вылетал, но вроде исправился.
смотрите, моя ситуация не совсем типична, я убиваюсь по 3d. гугл перешел полностью с флеша на штмл5 и мне кирдык, встроенный в ютуб плеер теперь имеет только 2 режима- анаглиф и 2д.
анаглиф по-умолчанию ущербен, так как теряется цвет, но ок, я согласен это терпеть, но все равно фризы и подтормаживания! моя система- зеон 3440 разогнанный на 3200, канал в инет на 60мегабит.
как говорят, если видео в fill hd тормозит есть выход- смотреть отключив фулл ашди
А зачем человеку который принимает заказ отличать ИИ от живого человек? Что от этого поменяется?
Тупой ИИ от тупого человека мало чем отличается, зачем между ними делать разницу?
прямо «обратный тест тьюринга» — насколько умным должен быть человек, чтобы прикинуться тупым ИИ…
С чего это в памяти всплыли вдруг старые стихи? Ответа он и сам не знал, но — всплыли:

Представьте себе, представьте еще и еще раз,
Что провода, висящие на черных столбах,
Впитали миллиардные потоки слов человечьих,
Какие слышали каждую ночь напролет,
И сберегли для себя их смысл и значенье...


Он запнулся. Как там дальше? Ах, да…

И вот однажды, как вечерний кроссворд,
Все услышанное составили вместе
И принялись задумчиво перебирать слова,
Как перебирает кубики слабоумный ребенок...


Опять запнулся. Какой же у этих стихов конец? Постой-ка...
Как зверь безмозглый
Сгребает гласные и согласные без разбора,
За чудеса почитает плохие советы
И цедит их шепотком, с каждым ударом сердца
Строго по одному…
Услышит резкий звонок, поднимает трубку,
И раздастся голос — чей? Святого духа?
Призрака из дальних созвездий?
А это — он. Зверь.
И с присвистом, смакуя звуки,
Пронесшись сквозь континенты, сквозь безумие
Времени,
Зверь вымолвит по слогам:
— Здрав-ствуй-те...


Он перевел дух и закончил:

Что же ответить ему, прежде немому,
Затерянному неведомо где роботу-зверю,
Как достойно ответить ему?


Рэй Брэдбери. «Разговор оплачен заранее», 1949 г.
Недавно при звонке в колл-центр одного банка был удивлен качеством разговора, так что не сразу даже понял, что это робот. Более того, несмотря на неловко сформулированный вопрос, робот сразу понял, что мне надо, и без проблем принял заявку. Заявка была на отключение одной из ненужных навязываемых услуг; живого банковского сотрудника обычно приходится долго убеждать отключить такие услуги.
Теперь осталось посадить такого же робота на приём звонка, и пусть роботы с роботами общаются.
ох уж эти луддиты-паникёры
ну звонит робот, ну говорит, ну не отличили, и что с того?
если вы не заметили разницы, то какая разница, кто вам позвонил?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории