
Продолжаем вспоминать технологические чудеса в области звука в компьютерных играх — обыденные ныне вещи, первая встреча с которыми в нашей жизни некогда поразила воображение тем, что такое в принципе возможно.
В прошлый раз я рассказал историю появления речи в играх, когда молчаливый прежде компьютер вдруг заговорил человеческим голосом. Чем же ещё он мог бы удивить после такого финта? Есть чем! Ведь круче разговаривающего компьютера может быть только компьютер поющий.
Сегодня поговорим о следующем эволюционном шаге после синтеза человеческой речи: вокальные партии в игровой музыке. Речь пойдёт про уже почти настоящие песни, доносящиеся из компьютера, специально созданные для компьютерных игр. Выясним, когда и как это стало возможным, и как развивалась история вопроса от древнейших времён до начала эпохи мультимедиа и CD-ROM.
Снова история
Внимание, спойлеры! В знаменитом кинофильме 1968 года «Космическая одиссея 2001 года» Стэнли Кубрика теряющий в процессе постепенного отключения разум бортовой компьютер HAL 9000 начинает петь песню «Дэйзи, Дэйзи». Хотя в фильме вокальный номер исполнил нормальный человеческий Дуглас Рэйн, этот фантастический эпизод вдохновлён суровой реальностью. В 1961 году в застенках Bell Labs автор сценария фильма и по совместительству популярный писатель-фантаст Артур Кларк увидел демонстрацию компьютера IBM 7090, поющего эту песню с помощью системы синтеза голоса.
Это впечатляющее историческое достижение было реализовано путём полностью программного моделирования вокального тракта по принципу «вокодера» — комбинации из генератора тона или шума и набора формантных фильтров, формирующих элементы звучания человеческой речи. В отличие от прочих подобных экспериментов, специального оборудования для синтеза не требовалось. Программа была разработана Джоном Ларри Келли-младшим, Луисом Герстманом и Кэрол Локбаум на Фортране, а запрограммированная вручную мелодия хранилась на перфоленте или перфокартах.

Сам компьютер образца 1959 года представлял собой полностью транзисторную версию более раннего тёплого лампового IBM 709, обладал памятью объёмом до 32768 36-разрядных слов и быстродействием порядка 100–200 тысяч операций с плавающей точкой в секунду — в шесть раз быстрее своего прародителя. Цифровой звук преобразовывался в аналоговую форму устройством, именуемым Digital to Analog Transducer, то есть сокращённо DAT, а не привычный нам сейчас DAC. Впрочем, по сути это одно и то же.
Хотя именно «Дейзи» вошла в массовую культуру, помимо неё на IBM 7090 было создано 18 композиций, инструментальных и вокальных, изданных на виниловой пластинке в 1960 году под названием Music From Mathematics.
Подобные примитивные синтетические звуки надолго оставались лишь предметом интереса лысеющих академиков в стенах лабораторий, не имея практического применения, пока в конце 1970-х годов развитие микроэлектроники не привело к рождению индустрии электронных развлечений, а затем и видеоигр. Там-то эти невостребованные космические технологии и пришлись ко двору.

Самые первые видеоигры не обладали никакими звуками вовсе, или самыми базовыми звуковыми сигналами. Но очень скоро простенькие синтетические мелодии, отдалённо напоминающие творения, созданные на IBM 7090, зазвучали в аркадных залах и домах игровых энтузиастов — теперь уже воспроизводимые не огромным суперкомпьютером, а маленьким микрочипом.
По историческим и экономическим причинам игровая музыка в своей массе долгое время оставалась чисто инструментальной — в роли музыкального инструмента применялся примитивный цифровой звуковой синтезатор, способный формировать простейшие тембры, а объёмы игровых носителей составляли поначалу единицы, и позже от десятка до пары сотен килобайт. Тем не менее, уже в самом начале 1980-х годов начались попытки добавлять в игры голосовые сообщения, о чём я подробно рассказывал в первой части этого мини-цикла.
Но не пиликанием и фразами едиными. Принципиальная возможность уже существовала, и когда видеоигровая техническая база возмужала и достаточно накачала свою полупроводниковую бицуху, начались эксперименты с добавлением к игровой музыке вокальных партий, с человеческим голосом и словами. Случилось это с ростом объёмов памяти и появлением более-менее развитых аркадных автоматов, а также первых домашних 16-битных машин.
Технолоджия
Технологии, применявшиеся для реализации игровых песнопений раннего периода, в своей основе совпадают: цифровые записи фрагментов вокальных партий, воспроизводимые в комбинации с синтезированными инструментами музыкального сопровождения. Отличаются детали реализации, главным образом способ хранения звуковых данных.
Как минимум однажды в истории в условиях ограниченных ресурсов памяти применялся LPC-синтез, подобный по звучанию той самой IBM-овской «Дейзи». Но так как эпоха пения началась уже в середине 1980-х, компьютерные системы вскоре обзавелись достаточным количеством памяти, и всё чаще стали рассчитывать на цифровые записи реального голоса в форматах PCM и ADPCM.
Когда же эпоха мультимедиа окончательно наступила, всё разнообразие решений свелось к потоковому аудио, воспроизводимому с компакт-диска в формате CD-DA или опять же в ADPCM. В этот период вместо технической составляющей начала развиваться художественная сторона вопроса — произошёл переход от довольно любительских попыток создать песни с вокалом к профессиональному исполнению и лицензированным композициям.
Сегодня мы обратим наше внимание именно на первую категорию технических решений, на самые первые шаги в этом направлении, обладающие разнообразием в практических реализациях.
Что интересно, развитие темы шло параллельно как на аркадных автоматах, где могли применяться новейшие специализированные технические решения, так и на домашних компьютерах, и даже на игровых консолях, обладающих куда более скромными возможностями. А попытки как-то связать игры с популярной музыкой и традиционными песенными формами, можно найти и раньше, чем начинается основная история.
В 1983 году компания Bally Midway выпустила аркадную игру Journey. Это был весьма необычный проект: аркада посвящалась одноимённой знаменитой рок-группе, находящейся в то время на пике славы, и предназначалась для продвижения её тура по стране. В пяти уровнях игры можно поиграть за каждого из участников группы, представленных своими чёрно-белыми пиксельными фотографиями, которым нужно каждому добраться до своего музыкального инструмента.

В финальном шестом уровне игрок защищает сцену от кражи инструментов фанатами, и именно на нём звучит отрывок одного из главных хитов группы, «Separate Ways», в полноценном исполнении реальными инструментами и с вокальной партией. Однако, воспроизводится он не цифровым способом, а в традиционном аналоговом формате, с помощью самого обычного кассетного магнитофона, скрытого внутри автомата.
В следующем 1984 году вышла другая крайне необычная игра Deus Ex Machine для домашнего компьютера ZX Spectrum. В ней игрок должен был запускать синхронно с игрой аудиокассету, которая содержала целую оперу, сопровождающую весьма психоделический игровой процесс. Крайне примечательный эксперимент, с которым стоит ознакомиться, и весомый аргумент в копилку тем, кто считает, что видеоигры — это форма искусства.
Хотя оба этих примера весьма занимательны, в рамках данного исследования нас всё же больше интересуют вокальные партии, воспроизводимые самим компьютерным устройством в цифровой форме, а не обычным магнитофоном. К слову, уже в этих двух примерах можно проследить разделение на категории лицензируемой и оригинальной музыки. Оно наметилось с самого начала, и как можно будет увидеть далее, сохранялось во все времена и до нынешних дней.
Далее наша ретроспектива превращается в длинный перечень игр с годами выпуска, где в той или иной форме были реализованы вокальные партии. Я остановился на самых интересных примерах, либо наиболее запомнившихся игрокам, либо обладающих особенными качествами, про которые можно сказать хотя бы пару слов, помимо обозначения факта наличия голоса в музыке: ранний пример, особенная технология, необычный источник материала, и так далее.
А чтобы во всём этом была хоть какая-то структура, я решил также сгруппировать примеры и истории по трём категориям: аркадные автоматы, домашние компьютеры и игровые приставки.
Аркады
Будучи сугубо коммерческой техникой, подобно грузовому транспорту, днями напролёт зарабатывающей деньги, аркадные автоматы могли позволить себе многое: быть очень дорогостоящими, иметь многочисленные микропроцессоры, непозволительно большие по меркам домашних платформ объёмы памяти и любое дополнительное железо. Неудивительно, что именно на этом передовом крае развлекательной науки и техники были достигнуты самые первые впечатляющие результаты, и аркады долго сохраняли лидерство в этой области.
Вероятно, самый ранний пример вокала в видеоигре заходит с козыря, прямо-таки врывается с ноги. В спортивной баскетбольной игре Double Dribble (1986, Konami) звучит композиция «The Star-Spangled Banner» — национальный гимн США!
Исполнена она явно непрофессиональным голосом, под не особо стройный и довольно примитивный аккомпанемент звукового чипа FM-синтезатора YM2203. Голос закодирован единым длинным сэмплом в LPC, что также придаёт ему синтетический оттенок. Всё это лишь добавляет олдскульного шарма.

Звуковыми чипами управляет отдельный процессор Motorola MC68B09, один из трёх в автомате. В качестве микросхемы LPC-декодера используется Sanyo VLM5030. Она кодирует голос 48-битными пакетами с длительностью пакетов 20 миллисекунд, то есть поток данных составляет 300 байт в секунду. Объём масочного ПЗУ, содержащего голосовые данные, составляет один мегабит (128 килобайт), что позволило хранить 7 минут звука — помимо гимна, в игре много других голосовых сообщений.
Следующий пример, Psycho Soldier (1987, SNK), демонстрирует уже более профессиональный подход к снаряду. В этой игре присутствует специально сочинённая и записанная заглавная песня, звучащая сродни анимешным опенингам. Также здесь впервые в истории произошло разделение на две версии: существует версия автомата с вокальной партией на японском и английском языке. Традиция такого разделения впоследствии перекочует на консоли пятого поколения и сохранится в играх на многие годы.

Этот автомат также содержит три микропроцессора, на этот раз Zilog Z80. Версия для Psycho Soldier содержит два звуковых чипа: YM3526 и Y8950. Оба этих чипа являются идентичными 9-канальными FM-синтезаторами, предками OPL2 из Adlib. Но второй чип отличается наличием поддержки одного канала ADPCM с возможностью прямой работы с внешней памятью.
Именно эта возможность Y8950 и задействована для реализации вокальной партии. Партия нарезана на фрагменты, запускаемые на фоне синтезированного FM-саундтрека в нужные моменты. Сэмплы закодированы в ADPCM с частотой дискретизации 16 килогерц и хранятся в отдельных четырёх 64-килобайтных ПЗУ на плате.
В последующих примерах технология остаётся примерно той же: чип синтезатора с поддержкой ADPCM плюс сэмплы вокальных партий. Аккомпанемент чаще формировался на основе засэмплированных инструментов. Объёмы ПЗУ со временем росли, повышая количество сэмплов и общее качество звучания музыки.
Следующий пример, игра Teenage Mutant Ninja Turtles: Turtles in Time (1991, Konami), переходит на территорию лицензированного контента. В игре про Черепашек-ниндзя на титульном экране звучит укороченная версия песни «Pizza Power».
Да, почему-то не знаменитая заглавная тема мультсериала, но этот трек также имел немалую популярность среди американских фанатов франшизы и имеет историю с налётом лёгкого безумия. Он был записан для студийного музыкального альбома «Coming Out of Their Shells» и исполнялся черепашками-ниндзя (людьми в костюмах) на живых выступлениях в их двухлетнем туре 1990-91 годов. Спонсировала это безумие сеть пиццерий Pizza Hut.
На этом Konami не успокоилась, и в малоизвестной, но крутой игре жанра «бей-их-всех» Violent Storm (1994), выходившей исключительно в формате аркады и никогда не переиздававшейся, можно услышать аж целых три оригинальные песни в различных музыкальных жанрах, звучащие непосредственно во время игрового процесса на разных уровнях игры. Треки даже имеют названия — «Who’ll Be The Hero», «Feel My Power» и «We Are Free». В титрах перечислены исполнители вокальных партий: Jeffrey, Junko, Mayumi.
Музыка в этой игре реализована в виде сэмплированных реальных инструментов, без применения FM-синтеза. Она синтезируется из сэмплированных фрагментов вокальных и инструментальных партий. Природу синтеза выдают партии электрогитары, иногда проявляющие нереалистичные обертона при звучании на высотах, отличающихся от засэмплированной ноты.
В том же году к делу подключилась Sega, и в одной из самых популярных аркад в истории, аркадной гонке Daytona USA, создала самый известный пример оригинальных видеоигровых песен, по уровню внедрению в голову сопоставимых с лучшими рекламными песенками, навеки въедающимися в мозг. Всего в игре звучит четыре песни: «Sky High», «Pounding Pavement» и «The King of Speed», и, конечно, самая меметичная «Let’s Go Away».
И хотя местный саундтрек звучит уже весьма убедительно, почти как настоящая полноценная аудиозапись, это всё ещё MIDI-подобная аранжировка, где голос также реализован в виде инструментов. Спойлерит это синтетическое вибрато в конце протяжённых фрагментов вокала, что придаёт звучанию треков особенный оттенок.
В играх-файтингах Killer Instinct (1994) и Killer Instinct 2 (1996), разработанных британской компанией Rare, также можно услышать пару оригинальных композиций с вокальными элементами, по одной песне в каждой. В несколько упрощённой форме они также звучат и в домашних версиях этих игр, для Super Nintendo и Nintendo 64 соответственно.
В обоих случаях это качающая евроденс-тема единственного женского персонажа игры, Орхид, звучащая на её локации. Лично мне эти треки очень сильно напоминают рекламу женской бритвы Gillette из 1990-х, где звучала композиция «Venus», и одновременно передают особый дух эпохи модной электронной танцевальной музыки тех лет.
Технически здесь мы уже вплотную приблизились к современному потоковому аудио. Декодированием звуковых данных здесь занимается так называемая «Digital Compression System» на базе DSP-чипа Analog Devices ADSP-2105, разработанная Williams Electronics и применявшаяся во многих аркадных играх и пинболах производства Williams, Bally и Midway.
Композиции записаны в виде полноценных заранее сведённых аудиодорожек и хранятся в ПЗУ в проприетарном сжатом формате, концептуально аналогичном MP3, но полностью оригинальном. В первой части Killer Instinct объём памяти, хранящей звуковые данные игры, которых тут очень много (вся музыка, голоса) составляет всего 4.5 мегабайт.
Наконец, завершает список примеров ещё одна файтинг-игра, довольно малоизвестная, но одновременно культовая — Waku Waku 7 (1996, Sunsoft), работающая на аркадной платформе Neo-Geo.
В этой типично анимешной игре на уровне типично анимешного персонажа, девушки-кролика Арины, звучит типично анимешная оригинальная композиция на японском языке, но с английским названием «The Excitement Never Stops».
Реализован музыкально-вокальный трек по классической схеме поздних игр на Neo-Geo: ADPCM-сэмплы, воспроизводимые местным чипом YM2610. Внушительное количество ПЗУ позволило реализовать хорошее качество звучания — игра имеет объём 35 мегабайт.
Компьютеры
Возможности домашних компьютеров долгое время были гораздо скромнее, чем у современных им аркадных машин. Зато они были не так ограничены в объёмах памяти, как приставки. Развитие идеи внедрения песен в игры как раз совпало по времени с началом широкого распространения гибких магнитных дисков на домашних компьютерах, и они вполне могли позволить себе потратить часть места на дискете на второстепенные вещи.

В области эффектного оформления игр на домашних компьютерах безоговорочно лидировала платформа Amiga. На момент своего появления в 1985 году она обладала довольно-таки прорывными техническими возможностями в области графики и звука, которые ещё долго догоняли остальные платформы. В том числе она первой обзавелась полностью цифровым синтезатором звука на основе сэмплов. Поэтому неудивительно, что именно на ней проводились первые «домашние» эксперименты с вокальными партиями.
Пожалуй, из всех платформ именно домашние компьютеры были ближе всего к народу, именно на них многие впервые сталкивались и с самими играми, и с различными нововведениями в них. И хотя Amiga продержалась на пике популярности не так ��же долго, оставшись довольно нишевой платформой в исторической перспективе, как минимум один самый знаковый, известный практически всем и каждому, пример в области компьютерных песен она породила. Но не сразу.
Однако, начало положено было очень быстро. Уже в 1986 году, когда Double Dribble спел гимн США, компания Argonaut Software разработала трёхмерный космический шутер Star Glider для Amiga, а также Atari ST, ZX Spectrum и IBM PC. Это вторая игра компании, которая через несколько лет станет основой для их самой известной работы — Star Fox для Super Nintendo.
Версии для Амиги и Атари содержат специально записанный оригинальный 15-секундный рекламный джингл, в котором пропевается название игры и издателя — «Star Glider from Rainbird». С технической стороны вопроса это просто один большой сэмпл, в нём нет синтеза музыки, это не трекерный модуль. Тем не менее, это была уверенная первая ласточка, в своё время наверняка уронившая на пол немало челюстей.
Следующий заход на территорию около-вокальных упражнений произошёл в довольно популярной леталке-стрелялке Xenon 2: Megablast (1989) компании Bitmap Brothers. Одновременно это и пример взаимопроникновения медиа: в игре звучит воссозданная с помощью сэмплов версия реального музыкального хип-хоп трека 1988 года группы BOMB THE BASS — «Megablast». Собственно, название трека и дало подзаголовок игре. Сам трек не содержит пения как такового, скорее это разные фразы и вокализы, являющиеся частью аранжировки, но в годы выхода игры это звучало модно и молодёжно.
Практически идентичный случай приключился и с игрой Ooops Up (1990), разработанной Silicon Warriors. В этом эксклюзивном для Амиги простеньком клоне аркадного Pang также звучит воссозданный в трекерном формате хитовый хип-хоп трек 1990 года группы SNAP!, который называется так же, как сама игра — «Ooops Up». Художественная часть его также похожа: голосовые фразы, являющиеся частью аранжировки.
В 1991 году компания Bitmap Brothers вернулась к вопросу, и выкатила сразу три игры для Амиги, использующие лицензированные музыкальные композиции.
В игре Gods звучит трек группы Nation 12 — «Into The Wonderful» с макси-сингла 1991 года Electrofear. Он воссоздан из сэмплов, из пения в нём присутствует фраза с названием трека и вокализ этнического характера. Эту мелодию также можно услышать в версии для Atari ST. К сожалению, более известная версия для MS-DOS утратила этот яркий элемент оформления, задающий особую атмосферу игры.
Игра Magic Pocket также обзавелась треком с вокализами без слов, который звучит очень похоже на современные «биты». Он основан на композиции Betty Boo — «Doin’ the Do» 1990 года.
Наконец, крайне примитивная игрушка The Power содержит версию хип-хоп трека с одним из самых знаменитых вокальных сэмплов в истории, всё той же группы SNAP! — «I’ve Got The Power». Даже если вы не знаете эту игру, эту группу и хип-хоп музыку, очень вероятно, что вы слышали эту распевку названия трека. Следуя традиции, игра позаимствовала своё название у звучащего в ней трека.
Но действительно самая узнаваемая видеоигровая песня 1990-х прозвучала в игре Cannon Fodder (1993) от Sensible Software, имеющей неопределённый жанр, схожий со стратегией реального времени, и посвящённой вооружённым столкновениям маленьких человечков. Это оригинальная композиция, на этот раз с классическим вокалом и текстом, описывающим происходящее в игре. Слова вы, конечно, знаете: «War never been so much fun».
И хотя эта игра имела большую популярность и получила порты на многие платформы, большинство из них используют синтезированные инструментальные версии этого легендарного трека. Как кричала толпа бородатых мужчин в рекламном ролике тех лет, «Only Amiga makes this possible!» (и ещё 3DO и Atari Jaguar).
Ну а компания Sensible Software решила закрепить успех, и в следующем году выпустила ещё одну игру с вокальным треком — футбольный симулятор Sensible World of Soccer (1994). Новый модный, практически танцевальный трек был более заводным, с ещё более профессиональным вокалом, из-за специфического жанра и увядающей популярности платформы уже не смог повторить успеха своего предшественника. Но олды помнят. Звучит-то круто!
Приставки
Домашние консоли описываемого исторического периода имели довольно скромные технические возможности, в основном ограничиваемые объёмом памяти.

Игры для приставок тех лет хранились на картриджах, которые сами по себе стоили приличных денег, и поначалу было нерационально тратить ценную память на второстепенные вещи. Тем не менее, закон Мура работал, память дешевела, и со временем здесь тоже были достигнуты некоторые результаты.
Первый случай, который с некоторой натяжкой можно считать моментом пришествия вокальных партий на игровые консоли, произошёл в игре Skate or Die 2: The Search For Double Trouble (1990, Electronics Arts) для 8-битной NES, она же Денди.
Данное творение довольно сложно назвать песней, но в этом треке есть и вокальный фрагмент, и сэмплированная ревущая электрогитара. Когда ещё услышишь такое на восьмибитке! К тому же это культурный шок: лицензионная игра на семейной платформе с играми про водопроводчиков, употребляющих разноцветные грибочки, вдруг начинает говорить игроку — «DIE DIE DIE DIE DIE!»
Но действительное раскрытие темы случилось с наступлением 16-битной эпохи. В деле вокальных треков особенно отличилась совершенная игровая система Super Nintendo. И первый крутой пример можно услышать в игре Clay Fighter (1993, Visual Concepts). Здесь есть всё: и реальный классический вокал со словами, и красивые вокализы, и въедливая аранжировка в духе песенок из телевизионной рекламы.
Конечно, SNES изначально оснащена возможностью воспроизведения сэмплов, причём исключительно сжатых в формате ADPCM. Но нужно помнить, что объём ОЗУ звука этой консоли составляет всего 64 килобайта, и туда помещается порядка 15 секунд звука в сомнительном качестве. Поэтому многие игры использовали короткие вокальные элементы или голосовые сэмплы для аранжировок в стиле хип-хопа. Подробно об особенностях звуковой системы и работы с ней я рассказывал в статье «Звуки музыки Super Nintendo».
Забавным примером экономного подхода является игра Ballz 3D (1994, PF Magic) — трёхмерный файтинг, в которой все персонажи состоят из шаров. То была эпоха хулиганства на грани дозволенного, и разработчики явно думали про другие шары, называя игру и делая музыку к ней. По вышеобозначенным техническим причинам версия игры для Super Nintendo использует меньше разных сэмплов, зато они носят довольно специфический характер, вероятно, выражающий восторг от совершенства игровой системы.
Версия игры также выходила и на Sega Genesis, где вокальные элементы в музыке были редким гостем из-за менее развитых возможностей в области воспроизведения цифрового звука. Зато сэмплам не требовалось помещаться в ограниченном звуковом ОЗУ, они могли занимать хоть весь картридж. Потому местная версия титульного трека Ballz содержит больше различных сэмплированных голосов. Правда, восторг из них куда-то улетучился и сменился на прагматически звучащие «ага» и «угу».
Подобного подхода придерживались и другие игры, постепенно применяя вокальные сэмплы более мелодичным образом. Например, в игре Earthworm Jim 2 (1995, Shiny Software) на титульном экране звучит вокальная композиция без текста. По сути это акапелла, почти без музыкальных инструментов. Версия для Super Nintendo отличается более богатой аранжировкой и чистым звучанием.
Но и на Sega Genesis этот трек был реализована также очень неплохо. Интересный пример, как более слабая в области одновременного воспроизведения нескольких каналов цифрового звука Сега уверенно компенсирует эту проблему FM-инструментами для обогащения аранжировки. Дело аркадного Psycho Soldier живёт.
Также ярким примером вокализов для Сеги является игра Ristar (1995, Sega). В игре есть несколько композиций, использующих несколько пропетых голосом слогов разной высоты, создающих характерную атмосферу. Главная их вариация звучит в треке «Du Di Da!!», название которого также содержит и полный текст песни.
Я не включил в обзор вокальные хоры и эмбиент, звучащие в некоторых действительно популярных играх для Super Nintendo, которым было показать что-то помимо вокала — Super Metroid и Donkey Kong Country, чтобы хоть как-то удержать под контролем объём статьи. Всё же хочется уделить основное внимание более полноценным песням.
И такие случались. Игра Radical Rex (1994, Beam Software) также выходила на двух основных 16-битных консолях, и в версии для Super Nintendo в ней звучит оригинальный заглавный трек, представляющий героя.
Содержательно это более простая работа с очередным налётом хип-хопа: всего одна фраза и вокализ. Но грамотная аранжировка и вокал создают очень хорошее впечатление. Как говорится, звучит на все деньги.
Наконец, лучшее достижение в области 16-битных картриджно-приставочных песнопений можно услышать в игре Tales of Phantasia (1995, Wolf Team) для Super Nintendo. Тут уже всё совершенно серьёзно: это полноценный анимешный опенинг с оригинальной красивой и довольно длинной песней на японском языке.
Такой объём данных никак не мог поместиться в звуковом ОЗУ. Поэтому в нём располагаются только музыкальные инструменты, а сэмплы голоса подкачиваются с картриджа на лету. Планка Psycho Soldier, на этот раз по длительности трека и серьёзности подхода, снова взята!
Закрывает эпоху игра Hong Kong 97 (1995). Эта шуточная любительская игра-поделка для Super Famicom, тем не менее содержит оцифрованный зацикленный фрагмент развесёлой песенки на китайском языке. Глупость или мемчик, но теперь это часть видеоигровой истории. Два миллиона просмотров на YouTube, знаете ли, требуют с собой считаться.
Хотя в следующем пятом поколении игровых консолей случился массовый переход на лазерные диски, позволяющие хранить любой аудиоконтент, некоторые платформы всё ещё рассчитывали на применение картриджей. И там тоже можно найти парочку интересных примеров музыки с вокальными партиями.
Так, в игре Tempo (1995, Sega), вышедшей эксклюзивно для Sega 32X, провального 32-битного адд-она к шестнадцатибитной Сеге, звучит хип-хоп трек с мелодичным вокалом. Конечно, эта платформа уже более способна к воспроизведению цифрового звука (два 11-битных ШИМ-канала), и проиграть подобный трек для неё не составляет большого труда. Однако, объём картриджа этой игры составляет скромные 3 мегабайта, так что некоторое техническое достижение имеет место быть.
Куда более мощная Nintendo 64, вооружённая мощью своих DSP-процессоров и готовая даже к декодированию настоящих MP3-файлов (правда, на тоненького), позволяла использовать картриджи куда большего объёма. Но так как помимо музыки в их памяти приходилось хранить значительно увеличившийся объём игровых данных, песни в играх для этой платформы были исчезающе редким явлением.
Игра Mystical Ninja Starring Goemon (1997, Konami) является редким исключением из этого правила и заодно примером успешного утрамбовывания аж трёх полноценных песен на японском языке в картриджную игру, причём в достойном качестве. При этом объём картриджа с игрой составляет довольно скромные 16 мегабайт.
Ну а завершающим аккордом нашей истории прозвучит заглавный трек игры Donkey Kong 64 (1999, Rare). Игры очень долго склонялись к жанру хип-хопа, но технические ограничения не позволяли им раскрыться полностью, ограничивая вокальное содержание всего несколькими фразами. Однако, под закат пятого поколения, а заодно тысячелетия и популярности хип-хопа, мы можем услышать действительно полноценную композицию с живой аранжировкой и длинным текстом про местных персонажей обезьяньей наружности.
Любительское
Дополнить историю хотелось бы рассказом о более современных любительских разработках в направлении синтеза вокальных партий. Конечно, это едва ли популярная точка приложения неудержимых творческих сил, но и такое тоже имеет место быть.
Для начала простое и понятное: в 2021 году энтузиаст заставил петь компьютер Texas Instruments TI-99/4, написав специальную программу TI Composer для управления синтезатором речи. Обычно применение старых речевых синтезаторов для пения сопряжено с большими трудностями в программировании партий, и TI Composer значительно облегчает решение этой задачи, позволяя задавать необходимые ноты для отдельных фрагментов голоса.
Довольно удивительной особенностью этого проекта является отсутствие аппаратного синтезатора речи: он реализован полностью программно на основе классических процедур преобразования текста в речь от Texas Instruments. Я был немало удивлён, что таковые существуют, учитывая, что эта компания была одним из пионеров в области разработки БИС для синтеза речи, и для TI-99/4 выпускался аппаратный синтезатор на базе их собственной микросхемы TMS5220.
Другой интересной темой является техника синтеза звуков, напоминающих человеческую речь, в чиптюн-музыке. Суть подхода заключается в очень тонком программировании инструментальных партий, воспроизводящих мелкие нюансы динамики изменений высоты и громкости, свойственные вокальным партиям, в результате чего кажется, что это не просто мелодия, а синтетический голос что-то поёт. Возможно даже что-то матерное.
Мода на этот весьма впечатляющий и сложный в реализации трюк возникла в конце 2000-х годов, когда несколько композиций с подобным эффектом поучаствовали в некогда ежегодном японском крупнокалиберном конкурсе чиптюн-музыки Famicompo Mini, ориентированном на Famicom (Денди) — в том числе это продемонстрированный выше трек 2009 года «A-nie Rabu Damon» заслуженног�� азиатско-американского артиста чиптюн-эстрады chibi-tech.
К слову, в Famicompo за годы поучаствовало огромное количество авторов и музыки, совершено множество экспериментов, и из звукового железа скромной Денди было выжато всё до последнего бита. Архивы конкурса крайне рекомендуются к ознакомлению всем любителям 8-битного чиптюна.
Там же можно найти и более классические треки с синтезированными вокальными партиями на основе DPCM-сэмплов, и многие другие экспериментальные работы как для стандартного звукового чипа 2A03, так и для любых исторических дополнений. Например, трек «SuperDuper Starship» в Famicompo Mini #5 (2008).
Заключение
Мы проследили, как видеоигровые песнопения проделали путь от первых несмелых попыток компьютера запеть человеческим голосом до уже вполне полноценных, хотя порой очень наивных, местами даже «кринжовых», выражаясь современным языком, песен.
Но на этом развитие не закончилось. Пришествие эпохи мультимедиа и носителей большого объёма в лице компакт-дисков сняло суровые технические ограничения прошлых лет и превратило игровые песни в один из мощнейших эмоциональных инструментов, существенно развивший потенциал игр как формы популярного искусства. Но об этом поговорим в другой раз.
© 2026 ООО «МТ ФИНАНС»

