На какие языки переводить проект в первую очередь?

    Всем привет!

    В Alconost мы занимаемся локализацией программного обеспечения, игр и сайтов на более чем 60 языков.

    Клиенты часто спрашивают — на какие языки стоит локализовать продукт? В качестве ответа, мы подготовили немного интересной статистики по степени распространения языков в Интернете:

    Язык                                                Количество Интернет-пользователей (миллионов) для которых указанный язык является родным
    Английский 565.0
    Китайский 509.9
    Испанский 164.9
    Японский 99.1
    Португальский 82.5
    Немецкий 75.4
    Арабский 65.4
    Французский 59.8
    Русский 59.7
    Корейский 39.4
    Турецкий 35.1
    Итальянский 30.0
    Филиппинский 29.7

    Информация приведена по данным www.internetworldstats.com.
    Alconost
    74,51
    Локализуем на 68 языков, делаем видеоролики для IT
    Поделиться публикацией

    Комментарии 56

      +7
      Internet users by language.

      И да, сведения от 31 мая 2011 года.
        +4
        Статистика — вещь великая. Но хотелось бы отдельно указать на то, что для многих украинцев русский язык не является проблемой, но насколько же приятнее иногда увидеть меню программы на родном языке!
        К тому же, в связи с их близостью перевести текст и на украинскую локализацию не составит практически никакого труда.
        Поэтому, если программа рассчитывается на страны СНГ — не экономьте, если есть возможность локализации — подумайте и о украинском, белорусском и других языках. Пользователи скажут огромное спасибо!
          –2
          Не вижу хинди… а между собой Создатели говорят именно на нем, а не на английском.
            0
            Речь идет о количестве пользователей Интернета.
              0
              Об этом и речь. И эти миллионы в первую очередь говорят на хинди.
              Цитата: Число пользователей Сети в Индии достигнет до конца года 150 млн человек во многом благодаря приросту молодежной аудитории. С соответствующим прогнозом выступили индийская Ассоциация мобильной связи и Интернета /Internet and Mobile Association of India/ и исследовательская компания IMRB International.
                0
                Это не так про хинди, см. ниже.
                  0
                  Думаю, эти 150 миллионов свободно владеют Английским, как вторым родным. Как украинцы русским.
                    –1
                    Я может как то не так название статистики прочел?? Но речь по-моему шла о родных языках, а не о вторых и третьих.
                    В противном случае статистику нужно переименовать в «Количество материала в сети на следующих языках.» вот тогда, разумеется, речи о Хинди в первой 20-ке не будет.
                      0
                      Статистика кривая как и вся статья, из-за этого мы свами спорим каждый о своем=)

                      1. Пользователи с спокойно пользуются приложениями и сайтами на втором родном языке (Индийцы на английском, Украинцы на Русском).

                      2. Статья несколько непоследовательная, в том плане, что сначала ставится вопрос «на какие языки стоит переводить приложения и сайты», а затем отвечается для кого язык является родным. Не совсем логично, согласитесь. Родной и используемый в интернете — часто не одно и тоже.

                      3. Не понятно как они считали — полагаю, что всех жителей США и Европы записали в соответствующие родные языки, не подумав для скольки процентов их населения родным, а главное используемым, является — Испанский, португальский и индейские наречия в США (а это до 30% населения), арабские языки в Европе (10-15% населения), и это молодые по большей части люди, которые сидят в интернете, в отличе от пожилого населения ностиля основного языка.
                        0
                        Согласен, что именно считали, не совсем понятно. Спорить, в общем то не о чем.)
                +1
                Боюсь они и пишут также программы
                  0
                  ну, во-1, проникновение интернета в Индии мягко говоря невелико,
                  во-2, вовсе не вся Индия говорит на хинди
                    0
                    Но хинди — основной язык, а английский живет только в развитых штатах как средство связи в бизнесе.
                    Да и потом, между собой индусы предпочитают говорить на хинди. Тек же как в Гонконге, все прекрасно знают английский, но говорят на гонконгском наречии и местные сайты.hk зачастую домашнюю страницу открывают на нем же.
                      0
                      > но говорят на гонконгском наречии

                      Нет такого понятия «гонконгское наречие», есть кантонский диалект, но при этом, что интересно, это только манера произношения _тех же самых_ иероглифов, то есть страница сама по себе никак не изменяется, будучи написаной в Пекине или Гонконге. Читают вслух ее по разному, да, но иероглифы одни и те же. Так что можно считать, что китайский язык один на всех китайцев.
                        0
                        Нет, нельзя так считать. Я регулярно бываю и в Гонконге и в континентальном Китае с большими группами коллег со всей станы, т.ч. в одной группе рядом сидят из Гонконга, Донгуна, Пекина, Шанхая (и рядом из Сингапура, Тайваня и Малазии.) У первых четырех языки на сегодняшний день разные, понимают друг-друга очень плохо. В основном говорим на английском. Ребята из Шанхая, как правило, вообще никого не понимают. Лучше всех понимают гонконгцы, т.к. помимо кантонского владеют мандарином. И иероглифы сейчас разные, в магазинах в Донгуне (это пара часов от Гонконга) гадаем всей группой, как чай называется — гонконгцы прочесть уже не могут, обычно помогают ребята с Тайваня, у которых образование шире, знают больше всех иероглифов.

                        По поводу 20 языков в Индии: можно посмотреть распределение этих языков — вся центральная часть вместе с Дэли, 90% населения говорит на Хинди.
                        Я согласен, что английский — второй государственный и все пользователи интернета в Индии на нем говорят, но даже в вашей же ссылки на Вики сказано, что в 1965г хотели лишить английский этого статуса, но оставили, т.к. английский вне конкуренции как средство связи в бизнесе. Однако между собой индусы предпочитают родной язык английскому, это факт.
                          0
                          По поводу 20 языков в Индии: можно посмотреть распределение этих языков — вся центральная часть вместе с Дэли, 90% населения говорит на Хинди

                          При этом общее число говорящих на хинди в Индии составляет около 40 процентов. При том, что его преподают в школе.
                          Менее половины. При этом, я уверен, там считается владеющим хинди «хотя бы как-то говорящий» (он очень простой, на самом деле).

                          Нет, нельзя так считать.

                          Можно-можно. Уверяю вас, страница, написанная китайцем из Горконга абсолютно ничем не будет отличаться написанной китайцем из Пекина или китайцем из Шанхая. А именно это учитывается в интернете. Существует разница в произношении, но язык — один и тот же, китайский. Не существует иероглифов для китайского пекинского диалекта, и иероглифов для китайского кантонского диалекта, и любых других диалектов устного китайского языка. Письменный китайский язык — единственный.
                            0
                            Ерунду говорите, я жил и там и там, иероглифы пишутся по-разному. Титры на гос. каналах на двух языках, иероглифы пишутся совершенно по-разному, их форма написания совершенно разная — мандарин очень плотный, очень много сложных комплексных иероглифов, а кантонский (хотя сами жители Гонконга называют свой язык гонконгским) имеет размашистое письмо, не терпящее сокращений или обобщений в очень сложные иероглифы.
                                0
                                У нас с вами недопонимание небольшое.
                                Я доверяю Вики, в разумных пределах. Но говорю вам о ситуации, в которой мне приходилось работать.

                                Я могу предположить, что реформа проходила в Китае неоднородно, в несколько этапов и с разным успехом. По-факту, и имеем упрощенное письмо — как гос. стандарт, одинаковое начертание во всех регионах.
                                И «традиционное» письмо, которое в каждом регионе имеет свои традиции. Я не лингвист, но на моих глазах это происходит именно так. Например тексты на товарах в магазине (вероятно, традиционным письмом) совершенно не читабельны жителями разных провинций.
                                Упрощена прижилась, кстати, тоже не везде. В южном Китае ее почти нет.
                                  +1
                                  Всем привет! Я живу в Китае с 1999 года, недавно написал здесь про китайский интернет и меня призвал сюда track вас рассудить.

                                  К сожалению, все в меру не правы, но Sterpa правее.

                                  Да, это верно, что в континентальном Китае используется упрощенное письмо, а в Гонконге, Макао и на Тайване — традиционное. При это на юге Китая есть провинция Гуандун, Гонконг и Макао, где говорят на кантонском диалекте. При этом только в двух последних пишут (а) традиционными иероглифами; (б) добавляя туда чисто "кантонские иероглифы".

                                  Поэтому фразу «страница, написанная китайцем из Горконга абсолютно ничем не будет отличаться написанной китайцем из Пекина или китайцем из Шанхая» — нельзя назвать на 100% верной. Скорее континентальные китайцы поймут от 30 до 70% информации (моя субъективная оценка).

                                  А теперь сравните визуально:
                                  кантонский — 係唔係佢哋嘅?
                                  традиционный — 是不是他們的?
                                  упрощенный — 是不是他们的?

                                  В итоге:
                                  Что написано на традиционным можно конвертировать в упрощенный (почти без потерь) и понятно континентальным жителям Китая.
                                  Что написано по-кантонские несовсем понятно китайцам. Еще вы упомянули шанхайцев, у которых на самом деле тоже свой диалект и есть свои иероглифы (и форумы, где они общаются на псевдошанхайском).

                                  Как-то так. Вот тайваньцы кстати говорят на стандартном диалекте (путунхуа), но пишут традиционными.
                                    0
                                    Почему я написал «что написано на традиционным можно конвертировать в упрощенный (почти без потерь)», потому что при упрощении иероглифов в 50-хх некоторые сложные иероглифы упростили и объединили в один (например: 干 или 发), при этом создав еще больше полных омонимов, чем было до того :)

                                    Это значит, что при конвертации из простого в традиционное: некоторые иероглифы нужны выбирать по значению.
                                      0
                                      От, спасибо, комрад, порадовал!)
                                      Вот про Шанхай не знал, но чувствовал, что о чем то своем говорят…
                                      Ну, ждем приглашения в гости, так сказать)
                                        0
                                        А вот на самом деле тема.
                                        Учитывая то, что иероглиф это все же понятие (ну, «половина понятия», так как слово целиком чаще всего обычно двухзнаковое), то можно ли считать наличие «эндемических слов» за «отдельный язык»?
                                        Допустим, почти уверен, что мало кто из не живших на Урале знает, что означает словечко "барагозить". Существуют и другие такие же «местные слова». Добрая половина словаря Даля состоит из таких. Но это же не позволяет говорит о специальном «уральском языке» (хотя вот по поводу «Сибирского языка» существовал, помнится, красивейший загон)
                                          0
                                          Не разу не был на урале, почти все знакомые знаю, что такое Барагозить)
                                      +1
                                      Вот, нашел, "специальное гонконгское письмо"! А то уж подумал, может правда сам ерунду выдумываю и все померещилось на дальних берегах.
                                      Полагаю, взаимные упреки теперь сняты, комрад.)
                                        +1
                                        Спасибо mayuxi, за третейский суд. Истина всегда дороже, да, был не вполне прав, не знал. :)
                                          +1
                                          Надо ехать в гости теперь. Мирового судью положено отблагодарить.)
                                  0
                                  Однако между собой индусы предпочитают родной язык английскому,

                                  Вот только в каждом штате «родной язык» для них будет разный.

                                  PS. Более того, есть штаты, где английский даже является единственным официальным языком.
                                  0
                                  И нет, иероглифы в кантонском и мандарине тоже разные… поверьте частому гостю Гонконга.
                                  Это легко заметить переключая каналы новостей с теми и другими субтитрами.
                                    +1
                                    Вы путаете Simplified и Traditional. В мэйнлэнде используют Simplified, введенные после реформы 50-х годов, а в Гонконге и на Тайване все еще довольно часто (особенно на Тайване) используют «дореформенную». Но это просто начертание иероглифа, упрощение его рисунка и сокращение составляющих его элементов.
                                      0
                                      Это тоже верно, но варианты написания не ограничиваются Simplified и Traditional.
                                      Поскольку мне приходилось работать с переводами документации с китайского, лично был свидетелем, что текст в оригинале уже не могут прочитать на удалении 1000км от места написания.
                              0
                              С Индией вопрос сложный. Почему-то многие считают, что жители Индии, весь миллиард, разговаривают на хинди. Это не так. Даже если не брать во внимание то, что английский в Индии — второй государственный язык, стоит помнить, что жители Индии говорят на примерно 20 языках четырех различных языковых групп. Причем многие не говорят ни на каком кроме родного языка своего штата (штаты Индии поделены преимущественно по языковому признаку).
                              +1
                              Эта статистика бессмысленна. Нужна статистика хотя бы по скачиваемости в странах.
                                0
                                Steam статистика http://store.steampowered.com/hwsurvey

                                English 53.62%
                                Russian 15.20%
                                German 5.92%
                                French 4.74%
                                Spanish 3.90%

                                  0
                                  А не запрещён ли, часом, этот Seam в Китае?
                                    0
                                    Ого, не думал, что наших так много)
                                    Немцы и французы не любят компьютерные игры?)
                                    0
                                    meta.wikimedia.org/wiki/List_of_Wikipedias

                                    Мне кажется, количество страниц в википедиях вполне коррелирует с количеством активных в интернете носителей языка.
                                      0
                                      Ага-ага. Давно ли Россия обогнала по количеству страниц хотя бы Польшу?
                                        0
                                        Не совсем, статистика по кол-ву статей вещь очень инертная, допустим по данным на 2012-й год носителей русского языка в интернете больше, чем носителей немецкого, но это было не всегда так, и за годы превосходство кол-во статей на немецком росло значительно быстрее чем на русском, и через пару лет мы увидим то, что русский обгонит немецкий по этому показателю.
                                          0
                                          Ну да, еще несколько серий вроде «Планетоиды», «объекты NGC» или «малые реки России» ботами пропашут — вообще всех на свете обгоним. :-/
                                            0
                                            Да как будто немцы и испанцы этим не занимаются, у них и базы побольше есть=) Бери да выкладывай всю отсканированную гугл-библиотеку, данные архивов и прочее.
                                              0
                                              Так о том и речь, что этим все занимаются, и число страниц нисколько не релевантно.
                                                0
                                                Согласен, как и статистика пользователей самой википедии, как вы же писали ниже — Китайцы туда не ходят, думаю есть отличия и по другим регионам.
                                          0
                                          20 апреля 2006 года ведущий китайский поисковик baidu.com заявил о запуске альтернативного проекта — «Байдупедии» (百度百科). Уже через три недели она обогнала китайскую Википедию по числу статей. В настоящее время Байдупедия содержит более 3 500 000 статей (в английской википедии — 3.7 млн).
                                          ru.wikipedia.org/wiki/Baidu
                                            0
                                            Я слышал, китайцы не платят и у них крайне специфические вкусы. Сдается мне, что это похоже на правду, тогда их в расчет можно особо не брать. Поправьте, если ошибаюсь.
                                              0
                                              Китайцы меньше платят, но их очень много, и они лучше реагируют не рекламу (больший CTR), т.к. несколько иначе ее воспринимают, менее негативно.
                                                0
                                                Посмотрел азиатскую рекламу, я тоже начинаю лучше реагировать на нашу :-)
                                          0
                                          Интересно бы сравнить это дело с учётом покупательной способности (у англоговорящих она, из общих соображений, повыше будет) и учётом культурных различий.
                                            0
                                            Довольно кривая статистика, носители языка посчитаны странно — для Английского, Немецкого, Испаского, Португальского, Французского явно посчитаны несколько стран, а для русского только пользователи из России (а ведь еще есть пространство бывшего СССР значительная часть которого владеет русским, мигранты в других странах).

                                            Думаю, число носителей русского языка в интернете можно смело писать >100 миллионов.
                                              –1
                                              Есть три вида лжи: ложь, наглая ложь и статистика ©.
                                              0
                                              Клиенты часто спрашивают — на какие языки стоит локализовать продукт?
                                              1. Выпустить на английском.
                                              2. Перевести, опираясь на статистику пользователей
                                                0
                                                Я бы еще взял зависимость от платформы — если iOS, нужно английский брать и европейские языки, если Андроид — английский, китайский и азиатские языки. Недавно на хабре мелькала статистика по платформам и странам использования.
                                                  0
                                                  действительно, если кол-во пользователей из определенного региона довольно большое, то скорее всего выгода от локализации значительно превысит ее стоимость. т.е. утверждение справедливо. но это не значит, что не нужно пробовать другие языки.
                                                  +1
                                                  Зашибись, ребята, вы локализуете приложения. То есть в принципе пофиг о чем приложение? Вас спрашивают на какие языки переводить, а вы отвечаете статистикой? Пользователи из разных стран часто пользуются вообще разными типами приложений и с разной частотой + ОС совершенно разные бывают распространены. Факторов-то дофига.
                                                    0
                                                    Приведенная статистика является «оценкой сверху» потенциальной аудитории продукта. Можно анализировать 100500 других факторов, но в итоге все равно получается что локализацию стоит делать именно на эти языки. Просто из-за большого отрыва этой десятки по величине аудитории от других языков. Понятно, что в Нидерландах покупательская способность отдельного человека больше чем в Китае или Мексике, что где-то MacOS распространена больше чем Windows или на AppStore покупают чаще чем на Google Play, но это вторичные факторы. Локализация ставит задачу максимального охвата. Приведенная десятка обеспечивает максимальный охват Интернет-пользователей планеты.
                                                    0
                                                    Количество Интернет-пользователей (миллионов) для которых указанный язык является родным

                                                    А эта статистика учитывает пользователей, для которых родным, или почти родным является более, чем один язык?

                                                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                    Самое читаемое