
Язык как средство коммуникации
Начнем с того, что язык - вообще-то инструмент для решения многих задач. Я лично рассматриваю его как механизм передачи информации между людьми (или группами людей). Но это - далеко не единственная возможная точка зрения. Очень уважаемые ученые (например Хомский) указывали что коммуникация может быть второстепенной функцией языка, а первой - например, мышление в виде внутреннего диалога. Я не буду спорить с авторитетами, поскольку ровным счетом ничего не понимаю в вопросах сознания и внутреннего диалога - и сосредоточусь именно на коммуникативной функции, и как она влияет на развитие языка. А дальше - как кривая вывезет...
Язык как живая задача оптимизации
Если бы вы выступали в роли творца, дающего язык неразумным людям - то уверяю вас, вы немедленно обнаружили бы себя в весьма неудобной позиции. Каким способом не создавай язык, надо бы наделить его двумя важными свойствами:
Эффективностью - то есть, способностью передать максимальное количество информации за единицу времени или на единицу вложенной энергии
Устойчивостью к ошибкам - то есть, возможностью восстановить передаваемое сообщение, даже если оно в процессе передачи было случайно (или даже намеренно) искажено
Ниже мы разберем эти принципы на примерах, но важно понимать - эти два условия нельзя выполнить одновременно. Устойчивость к ошибкам, в целом, заставит вас разносить комбинации допустимых элементов составляющих язык подальше друг от друга, а эффективность - напротив, будет требовать чтобы пространство разрешенных состояний было максимально компактным.
Таким образом, год за годом, каждый язык (если он не вышел из употребления) вынужден как-то решать задачу оптимизации, пытаясь усидеть сразу на двух стульях. Каждое слово или конструкция языка - это неизбежный компромисс между "говорить быстро" и "говорить понятно".
Оптимизация в фонетике
Как известно, в языке существуют гласные и согласные звуки - а почему так ? А потому что физика и ряды Фурье!
Рассмотрим гласный звук - это непрерывное периодическое движение голосовых связок под действием выходящего из легких воздуха. Если посмотреть на спектрограммы гласных звуков - это типичные примеры узкополосного сигнала!

Вся вложенная энергия сконцентрирована в нескольких довольно узких частотных полосах. Это дает целый ряд преимуществ:
Выходную мощность легко регулировать.
Малые искажения при передаче на расстояние (частотных компонент мало, и ослабляются они приблизительно равномерно)
Нечувствительность к импульсным помехам (энергия импульсной помехи: треска ломаемого сучка, звука падения предмета, и т.д. - "размазана" по всему спектру, и только малая часть придется на моночастоты составляющие звук 'а', или 'o', или другой гласный).
Недостаток гласных один, но фатальный - в сигнал с простым частотным спектром нельзя зашить много бит информации (под “битами” здесь я имею в виду не строгую меру Шеннона, а интуитивную плотность различимых состояний сигнала). В противовес этому, существуют согласные - которые имеют малое время звучания, и как следствие - намного более широкий спектр звуковых гармоник. У согласных звуков масса недостатков - но ширина спектра позволяет передать больше бит информации на единицу затраченной энергии.
Ради интереса повторите популярный эксперимент: выбросите из произвольного предложения все гласные - вы все еще сможете прочитать и понять написанное. Выбросьте согласные - и удачи вам разобрать оставшийся протяжный вой на бумаге... :-)
Собственно, уже с этого места понятно что язык подчиняется физическим законам. Именно поэтому потеряв подружку в лесу, полагается кричать "Ау-ау!", а не "Кд-бм!". Вам надо передавать не шибко много информации (просто обозначить "я здесь"), а сигнал с ограниченным спектром распространяется в лесу дальше (высокие частоты сложных согласных затухают быстрее из-за поглощения энергии деревьями и листвой) - да и много энергии в согласные вложить трудно. Впрочем... если есть ружье - то звук холостого выстрела тоже отлично распространяется (хвала высокой энергетике)!

Оптимизация в словообразовании
Известно, что из букв русского языка можно построить около 180 простых слогов, а активный словарь среднего человека составляет ~40 тыс. слов. Из чистой математики кажется, что весь корпус языка можно было бы уместить в двух-, максимум трехсложные слова. Но на практике, этого не происходит!
И снова информатика. Язык из двух- или трех-сложных слов будет весьма эффективным - слова и предложения в среднем будут намного короче чем то, к чему мы привыкли в повседневном русском языке. Однако, его (не)устойчивость к помехам приведет к краху локальной цивилизации. Будет весьма неприятно, если горючая жидкость из продуктов нефтепереработки будет называться в вашем языке "вога" вместо "керосин". Когда от свечки загорелась скатерть, а на ваш истошный крик: "Вода! Где вода?!" - вам принесут канистру керосина (вода? А-а, вога!!!) - ничем хорошим это не закончится...
Поэтому лексика в живых языках тоже подчиняется весьма сложным законам. Наиболее употребимые слова, такие простые как "да"/"нет" остаются максимально короткими, а более редким и специальным словам приходится удлиняться (см. также закон Ципфа).
Проблема в том, что разные народы жили и живут в разных географических и культурных условиях, и если одним нужно десять разных слов для обозначения видов выпавшего снега, то другие этот снег видят только вдалеке на недоступных горных вершинах. Вот и попробуй для всех этих прекрасных людей выработать единую универсальную лексику...
Оптимизация в грамматике
Интересно, что избыточности и устойчивости к ошибкам передачи данных уже встроенных в язык на уровне звуков и слов - оказалось недостаточно. Третьим уровнем оптимизации является грамматика - которая позволяет комбинировать слова в предложения только лишь определенным (разрешенным) образом.
Если мы прочитаем предложение: "Две женщины встретились на рынке, и он купил у другой пучок редиски" - оно немедленно вызывает вопрос: а причем тут мужик ?! И это - заслуга грамматики. Получив такой обрывок информации - вы явно понимаете: либо тут отсутствует существенная часть истории, либо что-то искажено при передаче. Потому что сложные правила изменения частей речи по падежам и родам - играют важную роль, делая пустым бОльшую часть пространства текстов. Каждый важный смысловой элемент текста кодируется разными способами несколько раз (в других языках это может быть порядок слов, или правила употребления артиклей) - и противоречие в кодировке служит для вас важным флагом, заставляя перепроверять и уточнять полученные сведения.
И, как вы понимаете, грамматические правила разных языков - являются до некоторой степени совершенно произвольными. Теории информации совершенно безразлично, какие именно сочетания слов будут в языке легальными, а какие - нет (лишь бы сохранялось минимальное Хэммингово расстояние между точками, которые вы хотите гарантированно различать). Все эти произвольные варианты, скорее всего, не лучше и не хуже в сравнении между собой - они прос��о разные (и имеют примерно одинаковую практическую эффективность)!
Кошмар по-Парето
Из сказанного выше должно быть понятно, что язык пытается наилучшим образом решить задачу эффективной и надежной передачи данных между людьми - причем оптимизация проводится по принципиально несовместимым критериям, да еще и на разных уровнях.
Что нам известно о таких сложных задачах оптимизации ? Что получение одного наилучшего решения ("глобального оптимума") - практически невозможно. Начав оптимизацию в произвольной точке - какое-то время вам удастся улучшать все измеряемые параметры сразу (градиентный спуск). Однако, в какой-то момент вы упретесь в то, что называется Парето-пределом: невозможность улучшить сразу все оптимизируемые параметры (чтобы улучшить одно - придется чем-то другим пожертвовать). И вот похоже, что все современные языки как раз и являются Парето-границей, по которой проходит линия между эффективностью и помехоустойчивостью в человеческом общении.
Практические выводы
Первое - не злитесь на сложности при изучении иностранных языков. Помните, что они решали ту-же задачу что и ваш родной ("услышав лай собаки - караульный передает сигнал дальше быстро, четко - и без искажений!"). И успешно ее решили - но, иначе!
Второе - языки не лучше и не хуже - они разные, и это так и должно быть.
Третье - искусственные языки по типу "эсперанто" являются тупиком: они менее оптимальны чем любой из естественных языков, и их единственное преимущество - это возможность общения людей из разных групп (и то, при условии что такой искусственный язык как-то удастся распространить). Однако, без широкого распространения - они остаются хуже (!) любого из локальных языков, и поэтому никуда и не распространяются. Гораздо более реалистичным является распространение определенных языков и диалектов в профессиональных сообществах (латынь в медицине, итальянский в искусстве, немецкий а потом английский в технических науках).
Четвертое - если вы хотите выучить язык - то надо учить не эсперанто, а тот, который будет более полезен вам географически, или принят в вашем профессиональном сообществе.
Что еще почитать, если зашло
How Efficiency Shapes Human Language (Edward Gibson, Richard Futrell, Steven Piantadosi, Isabelle Dautriche, Kyle Mahowald, Leon Bergen, Roger Levy)