Как стать автором
Обновить

Как Google подсунул нам котлеты и чуть не погубил проект. Почти юмористическая и почти детективная история одной ошибки

Время на прочтение3 мин
Количество просмотров51K
Всего голосов 235: ↑232 и ↓3+282
Комментарии108

Комментарии 108

Была похожая история, но со сторонним сервисом - вылез интересный фильтр "дора дура", откуда он появился и как это исправили кануло в лету, но до сих пор интересно, как это произошло в рабочей версии

В прошлом году на портале Госуслуг в форме подачи заявлений абитуриентом была точно такая же проблема, и по той же причине.

Ну почему такой перевод то, как вообще переводчик до такого дошёл

О, тут кроме гугла ответить ни кто не сможет. Хотя, когда-то натыкался на публикации о том как работает их переводчик

Ну как же? В переводчике есть возможность оценить перевод и предложить свой вариант, который будет использоваться для машинного обучения. Видимо кто-то накрутил.

Блин, неужели он не видит, что буквы не английские? О_о

Вы никогда не переводили сайты со смешанным контентом, на более чем 1 языке?

Гугл шуд би эйбл ту андестенд зыс

А на этот вопрос, боюсь, уже никто никогда не ответит. Ибо то, как Artificial Idiot пришёл к этой мысли, мы не узнаем. Вы же обратили внимание на то, что это попытка перевести слово "содержит" с английского на русский?

Потыкался в переводчике и проверил, действительно только с некоторых языков такой котлетный «перевод» (или еще хуже), с других бывает немного искажает.
прим.







Небось, с японского они через английский переводили.

так сообственно и есть, он через английский перреводит японский

Вот и доказательство, 現在 это ”сейчас", педаль в пол, гугл советует нормальный вариант "プレゼント " - ну показывает его как "настоящее время"(и естественно он такое значение не имеет)

Там вроде раньше была кнопочка "предложить свой вариант" или что-то вроде того.
Одно исправление конечно не сработает, но скоординированные действия кучки малолетних долботрясов вполне могли заставить жестяные мозги исправить перевод.

Она и сейчас как бы есть — через rate this translation

В 18-м году постили всякую смехоту с рандомно вылезающими вещами, я вот такое заскринил например:

Нейронные сетки же. Одно время по интернету ходили всякие приколы, когда на каком-нибудь малоиспользуемом языке вбивали "ААААААААААААААААААААААААААА" разной длины, а на выходе получали некоторую шизофазию. Для русского языка соотвествие оказывается еще проще.

там есть кнопка «предложить свой перевод». Нередко этим пользовалась для подобных развлечений. Обычно это не укореняется, мало ли что один человек ввёл. Но, видимо, кое-что срабатывает.

Обычно это не укореняется, мало ли что один человек ввёл.

Есть такое слово — флэшмоб. Организованная группа людей ради лулзов что угодно укоренит — может, даже передачу России под суверенитет Японии :)

да, в том числе.

специально, чтобы ошибку быстрее задетектить. опечатку заметить сложнее с:

Вот устраиваешься на работу, думаешь, щас как будут пилить крутые фичи, шикарный ux\ui, буду делать всё модно, современно, оптимизированно, интересные задачи и тд и тп, а в итоге целый день исследуешь откровенно шизоидный баг.

Но ведь это же лучше, чем работа.

Это google translate. У них постоянно такая фигня с переводом.

Тут ситуация хуже, когда язык оригинала отличается от языка перевода — это заметно невооружённым взглядом. А когда язык оригинала русский и он пытается перевести его с английского на русский, — тут становится непонятно что происходит.

Именно поэтому переводчик, равно как и другие расширения, излишне любящие залезть в контент — зло. Хотите что-то перевести — не поленитесь и скопируйте текст в переводчик, открытый в отдельной вкладке.

Контекстным меню переводить проще

А головой переводить ещё проще, ничего даже жмякать не надо :)

Это только для избранных

НЛО прилетело и опубликовало эту надпись здесь

А зачем? ИМХО те, кто пользуется любыми автоматическими улучшайзерами, должны пройти путем боли и страдания до его конца (отключения оных).

На одном проекте тоже пришлось добавить эти строки, потому что не все проекты созданы для пользователей. Этот встроенный перевод от Хрома любит так же модифицировать DOM и у нас страдали интерфейсы для внешних наемных работников. И на какой-то раз разбираясь почему у конкретного работника происходит в интерфейсе аномалия, вместо фразы "проверьте, что у вас выключен перевод сайта", гораздо проще стало его просто выключить глобально для всех.

Тем самым Вы поощрили пользователей к ламерству, а Гугл - к дальнейшему произвольному вмешательству в авторский код. Текущую проблему при этом решили, да.

Вы всё же не поняли. Еще раз: "не все проекты созданы для пользователей".
Вы предлагаете бизнесу тратить каждый раз время менеджеров и разработчиков на определение причины очередной непонятной проблемы в работе важного для компании интерфейса. И всё ради только того, чтобы наказать работника-ламера и погрозить Гуглу кулаком.

Или может быть, мы всё-таки правильно поступили?

Правильно или нет, можете решить только Вы сами, я лишь высказываю то мнение, что не встречая отпора Гугл бодро идет к формуле "Интернет = Гугл". HTML от Гугла мы уже получили.

Можно также отключить перевод только для определённых элементов с помощью класса notranslate.

Оторвать руку тому, кто анально огораживает свою страницу от перевода (`translate="no"`) и кто вообще придумал этот атрибут.

Вот захочет англичанин прочитать русский текст, а ему хренушки. Зачем?

Хорошо, что можно залезть руками (или экстеншеном) в код и оторвать атрибут. Но это - тем, кто умеет.

А это не ограничение конкретно на АВТОперевод?

Он, оказывается, регистрозависмый

всё чудесатее и чудесатее

(Возможно незначительное содержание ковров)

Ситуация по немногу проясняется

Почему в двух котлетах появились котята??? О_О

НЛО прилетело и опубликовало эту надпись здесь

Что поймали - из того из сделали.

А из трёх - полноценная киска

Таки тема про пирожки с котятами выходит на новый уровень

Ну а кучка котлеток в чём измеряется?
Правильно! В корзинках!

Тема математических операций не раскрыта.

содержит + содержит = лапы +короткие
содержит — содержит = ковры — содержит
содержит * содержит = лапы * содержит
содержит / содержит = маки /маски
содержит · содержит = маки · маки
содержит ≠ содержит = лапы ≠ лапы (в чём-то даже логично)
содержит ≈ содержит = лапы ≈ лапы
содержит ⩽ содержит = лапы ⩽ лапки (моё любимое)
содержит √ содержит = √ содержит
содержит! содержит = коты! котлеты (тут уже Хабраредактор пробел перед "!" откусил)

Фух, залипательно. Оказывается, при определённой настойчивости можно формализовать и вычислить первопричину.

Возможно, Сергею Брину с детства запомнился мультфильм про котёнка по имени Гав, спрятавшего котлету. Или просто АльфаГо выгуливают на просторах.
содержит = котлеты
содержит содержит = котенок
(содержит)x3 = киска
(содержит)x4 = корзина
(содержит)x5 = корзина
...
(содержит)x8 = корзина
(содержит)x9 = маленькие
(содержит)x10 = маленькие
(содержит)x11 = нет
(содержит)x12 = нет
...
(содержит)x16 = нет
(содержит)x17 = маленькие
(содержит)x18 = ошибки 
...
(содержит)x22 = ошибки
(содержит)x23 = все
(содержит)x24 = все
(содержит)x25 = все
                котлеты 
(содержит)x26 = все
                котенок 
(содержит)x27 = все
                киска
(содержит)x28 = все
                корзина
(содержит)x33 = все
                маленькие

Похоже на протокол исследований нового SCP-объекта?

Из этого можно делать отдельную шифровку:

Вон оно как

Подозрительно сюда затесался Яндекс со своим Кинопоиском ඞ

Смотреть кисок?

Не одними пирогами с котятами быть.

Выбираю этот вариант

Или даже так:

Ковид?

Есть ли смысл предложить в гуглопереводчике исправление? Потому что если это исправить, то другие люди когда встетятся с такой проблемой смогут найти эту статью про котлеты и понять в чём причина такого поведения.

Но если есть смысл, то давайте вместе предложим исправление гуглу https://translate.google.com/?sl=en&tl=ru&text=содержит

Им проверку бы добавить, что в переводимом тексте нет символов других языков.

Немцы за умлаут обидятся.

Почему? Если перевод с английского, то откуда там умлауты и кириллица?

И наоборот, если перевод с русского, то не должно быть латиницы.

Точнее, если слова не на том алфавите есть, то они не переводятся, а остаются как есть.

Умлауты отличают немецкий алфавит от латиницы. Пока во вводимом тексте их нет, можно трактовать его как английский. То же с португальским и другими. Как их различать?

Согласен, никак. Ну хоть какой-то процент отсеять

O que há de errado com o português? Мы же не детектированием языка занимаемся, а определением заведомо не относящихся к языку символов. Вот другое дело, что заимствованные слова на вариантах латиницы в английском вполне могут писаться как в оригинале.
А разве для детектирования не относящихся к языку символов не нужно сделать предположения о текущем языке?
Только если у нас автоопределение, а не принудительно выбранный язык. А в посте речь именно о последнем.

Вряд ли согласятся, для них это не баг, а фича. Если пользователь в "английское слово" намешал своих букв, то Гугль прежде всего пытается это исправить - сделать транслитерацию. Хотя иногда это может полностью исказить смысл:

Что-то у меня плохие предчуствия на тему грядущего повсеместного внедрения телемедицины и машинного обучения.

К примеру болгары кивают инверсно. «Тут больно?»

Здесь нет никакого искажения смысла, как ни странно. Вы написали по-русски "ангина", указав направление перевода "Английский→Русский". Гугл честно транслитерировал "ангина" как "angina" и честно выдал вам перевод: angina это, действительно, именно что стенокардия (один из известных ложных друзей переводчика, хотя даже в русском языке есть термины "ангинальные боли" и "антиангинальный препарат", и медики прекрасно понимают, что это именно про боли от ишемии миокарда, а не воспаленные гланды и горло).

А «Stomach ache» не имеет отношения к стоматологии.

хм, и правда

с ангиной то всё просто, в транслит вероятно переводит

Есть много других: <url>

А можно и так.

А на гугле нет переводчика сайта ,а вот раньше был .

Яндекс тоже весело переводит.

Вы сами можете помочь в переводе текста когда тренируетесь ,там есть градация ,лёгкий ,средний и затруднительный перевод .Таким волонтёрам ни гугл ,ни яндекс ничего не предлагает .

А на гугле нет переводчика сайта ,а вот раньше был .

Он и сейчас есть, просто интерфейс объединили.. Вставляешь ссылку в окно переводчика слева — справа он выдаёт ссылку на переведённый сайт.

А у меня IQ отрицательный ,я не умею в интеллектуальные задачи, там им наверное стыдно за интуитивный интерфейс ,можно в это окошко и символы пихать ?

Над гуглтранслейтом они угорают. Вы видимо, что такое промт забыли.

Угорают же не над качеством перевода, а над его попытками предложить хоть какой-то вариант перевода всегда, даже когда переводить то нечего. Это новый уровень.

Да лучше с тех пор не стало. Косяки только стали лучше прятаться в переводе.

Впрочем, тот самый промт по-прежнему существует в виде translate.ru, я иногда им перевожу.

Гугло-переводчик — это бесконечный поток лулзов. Мое любимое:


Загадка решается просто: 天啊 -> Gosh -> Гоша

Не знаю как китайский, ну японский он явно переводит через перевод на английский. Из за чего перевод даже без исправлений юмористов неадекватный

А что должно быть?

Предполагаю, что "собака" :)

Когда я работал в хостинге в саппорте, мне позвонил пользователь, у которого при заходе на сайт стала показываться ошибка "Плохие Ворота" в яндекс браузере. Я тоже не сразу сориентировался)

Фраза «смотреть как баран на новые ворота» заиграла новыми красками

Новые ворота — хорошие! А эти плохие!

А иногда в самих сервисах гугла странные переводы (да и в логике). Иногда просто где-то что-то не влезает в кнопку, иногда чуть смысл меняется, но иногда... до сих пор помню в настройках рекапчи кноку "ДА" над списком доменов, вообще без пояснений, которая при нажатии удаляла аккаунт целиком.

  • Скажи "да"

  • Что "да"? А что будет

  • Не важно, просто скажи "да"

  • Да

  • ...

Видимо, в оригинале было сокращение от Delete Account (DA)

Это же дичь какая-то, браузеры лезут в ДОМ без спросу. Процессы лезут в интернет тоже как попало. Их только файервол останавливает и предлагает выбрать действие, а они сами должны при первом коннекте представляться и спрашивать, типа "я процесс такой-то, нужен для того-то, можно мне интернета хлебнуть для таких-то дел?"

Ты пускаешь браузеры в свой ДОМ, а они меняют то, что он содержит на котлеты. Не доверяйте браузерам.

В angular material иконках на Яндекс браузере такая проблема была. Пользователи жаловались, что вместо иконок показывает текст огромным шрифтом и ничего не разобрать. А дело в том, что в html эти иконки на самом деле текст и ангуляр их сам заменяет на иконки. А Яндекс браузер почему-то считал, что нужно переводить этот текст

Звучит как вина angular'a, а не яндекса...честно говоря

Звучит как нечто очень странное, потому что иконки в Angular Material UI устроены по-другому: с точки зрения Ангуляра они компоненты, а не текст, и работа с ними идёт как с компонентами.


Возможно, Foduch имел в виду, что в DOM (не html!) был просто текст, который заменялся на иконку шрифтом (а не ангуляром!).

Когда дело доходит до настоящих котлет, все становится ещё хуже.

Судя по цветам и шрифту, это не Мак, а БК.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории