Как стать автором
Обновить

Стратегии локализации контента

Время на прочтение6 мин
Количество просмотров3.2K
Привет, Хабр! Представляю вашему вниманию перевод статьи «Strategien zur Lokalisierung von Content» автора Nicolai Goschin.

Настройка локализации контента и, следовательно, настройка языка интерфейса продукта таким образом, чтобы правильный язык отображался для правильного пользователя, чрезвычайно важен для каждой цифровой платформы.

Предпосылки и предварительные соображения


Цифровые проекты, предназначенные для аудитории в разных странах или в разных языковых областях, желают использовать преимущества стратегий локализации.Таким образом, мы должны ответить на следующий вопрос: каким пользователям должен быть предоставлен какой контент и на каких языках? Вопрос на первый взгляд кажется простым. Но позже в этой статье мы укажем, почему эта тема, на самом деле, сложная. И, конечно же, мы также рассмотрим, как бороться с этой сложностью.

По мере того как мы углубимся в тему локализации в этой статье, есть два механизма, которые нам необходимо понять с самого начала. Первый — это настройка языка браузера, а второй — IP-адрес пользователя.

Настройка языка браузера


Каждый раз, когда запрашивается веб-сайт, веб-браузер автоматически отправляет на сервер язык браузера, который может быть настроен пользователем через настройки браузера. Язык по умолчанию — это язык операционной системы. Важно знать, что большинство пользователей не знают, что они могут изменить язык. Каждый язык обычно состоит из двух параметров: самого языка и региона. Германия использует de-de, то есть, Германия-Германия, Австрия использует de-at, что означает «Германия-Австрия», а США используют en-us.

Кроме того, пользователь может указать список языков в порядке их предпочтений, например, например: en-us, en, de. В этом случае первым выбором пользователя является английский язык в регионе США, независимый от региона английский язык является их второстепенным вариантом, а независимый от региона немецкий язык является их наименее востребованным.

IP-адрес пользователя


IP-адрес (для краткости «IP») — это пользовательский «адрес в Интернете». Это назначенный номер, который может использоваться для идентификации пользователя в Интернете и содержит информацию об их местонахождении. Например, вы можете определить страну, из которой посетитель заходит на сайт, по IP-адресу. Это возможно, потому что определенные диапазоны IP назначены отдельным странам. Например, IP-адреса в диапазоне между 2.16.240.0 и 2.16.255.255 назначены Германии. Если у пользователя есть IP-адрес 2.16.265.100, мы знаем, что этот человек подключается к Интернету из Германии.

Следует отметить, что существуют другие методы, которые можно использовать для определения местоположения пользователя. Однако в этот момент мы их опускаем, поскольку в конечном итоге они предоставляют ту же информацию, что и IP-адрес.

Таким образом, теперь мы знаем, что есть два источника, из которых можно получить информацию о языке или местонахождении (стране) пользователя. На этом этапе мы рассмотрим, как мы можем использовать эту информацию для локализации, то есть адаптации контента к различным языкам.

Лингвистическая локализация


Самая простая и наиболее распространенная форма локализации — лингвистическая, основанная на настройках языка браузера. Этот метод предполагает, что пользователь установил нужный язык в настройках своего браузера.

В Германии большинство пользователей используют de-de, de и en. Эта комбинация подразумевает, что немецкоязычное содержание является предпочтительным для Германии (de-de). Если на определенном веб-сайте такой контент недоступен, далее будет использоваться немецкий контент из любого другого региона, даже если он не относится к Германии (de). Если нет другого контента на немецком языке, будет использоваться окончательный вариант английского (en).

В сценарии, который мы описали во введении (онлайн-журнал с немецкой, английской и арабской версиями), все покупатели, которые установили свой код языка на de, должны получать контент на немецком языке. Другими словами, это все пользователи, основным языком которых является de-de, de-at, de-ch, de и так далее.

Для пользователей, которые также понимают английский или арабский, ситуация немного более нестандартная. Хотя немецкоязычные страны (которые собираются в так называемом регионе DACH) географически граничат друг с другом, это не относится к англоязычным или арабоговорящим странам. Например, на английском говорят в США, Англии и Австралии. Кроме того, английский — это язык, который лучше всего понимают люди после своего родного языка в большинстве стран мира. Вот почему он часто указывается как дополнительный язык во всех настройках браузера.

Таким образом, если в нашем описанном сценарии мы настроили локализацию сайта исключительно на основе языка браузера, пользователи из США и Австралии получат наш англоязычный контент. Пользователи из Египта и Объединенных Арабских Эмиратов увидят арабский контент. Все идет нормально.

Недостатки локализации в зависимости от языковой настройки браузера
Этот тип определения языка становится проблематичным, если язык, установленный в браузере, не соответствует родному языку пользователя. Это может иметь место, например, когда немецкоязычный пользователь работает в Германии в международной компании, в которой операционная система и, по умолчанию, браузер также настроены на английский (en). Этот пользователь будет видеть контент на английском языке, даже если его родной язык — немецкий.

Аналогичная проблема возникает в странах, где официальным языком или деловым языком обычно является английский, но население говорит на другом языке. Это имеет место, например, в таких странах, как Объединенные Арабские Эмираты.

Географическая локализация на основе IP


Недостатки языковой локализации частично компенсируются локализацией на основе IP. При последнем методе язык определяется на основании страны, из которой пользователь имеет доступ к Интернету.

На первый взгляд, локализация на основе IP кажется водонепроницаемым решением, поскольку она разрешает описанный выше случай, когда браузер настраивал расходящийся язык. Таким образом, с помощью этого метода пользователь в Германии всегда получает контент на немецком языке, даже если его браузер установлен, например, на английский в качестве основного языка.

Недостатки IP-локализации


Итак, является ли локализация на основе IP панацеей? Тот, кто так думает, ошибается. Основное предположение заключается в том, что все пользователи, которые находятся в одной стране, являются носителями этого языка. И это, конечно, далеко от реальности. Например, тот, кто находится в Германии, но говорит только по-английски, увидит весь веб-контент на немецком языке, хотя сайт также доступен на его родном языке.

Наконец, локализация на основе IP игнорирует языковые настройки браузера и основана исключительно на местоположении. Например, мы сталкиваемся с этим недостатком, когда работаем в Интернете, находясь в отпуске, и не видим никакого контента на родном языке. Вместо этого веб-страницы отображаются только на языке страны, в которой мы находимся.

Комбинированная локализация


Чтобы выработать более оптимальное решение, оба описанных подхода теперь можно объединить, чтобы мы могли лучше обрабатывать эти пограничные случаи. Мы имеем в виду те случаи, когда нам не следует полагаться исключительно на IP-адрес или язык браузера. Как описано выше, это действительно для не носителей языка в стране пребывания и пользователей с неправильно настроенными языковыми предпочтениями браузера.

И вот как мы обрабатываем такие случаи:


  1. Мы используем локализацию IP в качестве основного критерия, то есть мы выбираемся из географического местоположения пользователя, такого как, например, Германия.
  2. Затем мы проверяем, было ли определенное место также установлено в настройках языка браузера. Если есть совпадение, мы отображаем контент на соответствующем языке. Если два источника данных не совпадают, мы будем использовать локализацию IP. Основное предположение здесь состоит в том, что пользователь из данной страны, вероятно, в некоторой степени освоил национальный язык.
  3. Наконец, мы проверяем, доступен ли контент и на других языках браузера. Если это так, мы показываем всплывающее окно (похожее на уведомление о cookie), информирующее пользователя о том, что веб-страница также доступна на альтернативных языках, которые они перечислили в настройках своего браузера. Чтобы посетители сайта могли переключаться на другой язык или закрывать всплывающее окно одним щелчком мыши.
  4. Файлы cookie используются для определения того, переключил ли пользователь язык или отклонил всплывающее окно. И в следующем сеансе контент будет отображаться на выбранном языке.

Например, пользователь, получающий доступ к Интернету из Египта, но использующий браузер с немецким языком, установленным в качестве основного языка, увидит такое всплывающее окно. Содержание будет первоначально отображаться на арабском языке. Однако пользователь все вместе увидит следующее сообщение на немецком языке: «Этот веб-сайт также доступен на немецком языке. Хотите перейти на немецкую версию?».

Теперь мы можем применить ту же логику к различным альтернативным языкам (языкам, которые отображаются, если требуемый язык недоступен), определив конкретные правила.

Доступ через Google


Еще одним преимуществом этого дифференцированного метода является то, что он позволяет лучше контролировать доступ к веб-сайту через поисковые системы, такие как, например, Google. Поисковые системы принимают во внимание язык браузера и не обязательно местоположение пользователя. Таким образом, пользователь, который попадает на сайт через поисковую систему, всегда направляется на версию, соответствующую языку браузера, даже если есть лучшее совпадение с местоположением (на основе IP-адреса). Пользователь все еще может переключаться на другой релевантный языковой контент через всплывающее окно, которое было описано выше.

Заключение


Надо учитывать сочетание «контент-язык-пользователь» не только для удобства использования или, скорее, для удобства пользователя, но также для маркетинга и стратегии. Следовательно, вышеприведенное задание не претендует на абсолютную корректность — решающим фактором является конкретная цель проекта. Тем не менее, если учитывать как местоположение, так и язык (то есть IP-адрес и настройку языка браузера), результаты будут намного лучше, поскольку пограничные случаи также могут обрабатываться корректно.
Теги:
Хабы:
Всего голосов 15: ↑13 и ↓2+11
Комментарии4

Публикации

Истории

Работа

Ближайшие события

15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань