я думаю для демонстрации возможностей человеческого мозга(нужно додуматься) и взгляда на вещи с другой стороны. Ведь я о таком никогда бы не подумал, но я могу таким же образом придумать что-то неоднозначное хотя и до боли знакомое.
Так же перегонял свою речь и музыку раньше из WAV в MIDI для своего старого сотового телефона, поддерживающего только этот музыкальный формат в качестве звонка :)
По-моему, программа называлась TS-Audio to Midi.
Ага, сходство с этим видео было. Так же можно было некоторые слова четво разобрать. Хотя мне больше нравилось таким образом, правда уже в другой программе (не вспомню названия) перегонять MOD/XM музыку в MIDI. Там был принцип перегона оцифрованных инструментов трекерного формата в похожие по звучанию midi-сэмплы. Хоть друзья и не узнавали, что играют за композиции, зато для меня это было просто нечто — трекерная музыка играет в телефоне!
Откровенно говоря, вот ТАК меня давно ничего не впечатляло. Бомбежка луны, миллиарды за YouTube, космические двигатели — сегодня все это для меня по сравнению с этим видео сущая фигня.
Во- недавно вышла новость habrahabr.ru/blogs/society_2/71786/
Но эт' ещё не всё- почитайте патенты лаборатории Касперского- вот это действительно смешно.
Все же не понятно, что там на деле. Процесс артикуляции, как известно, является результатом изменения формы резонаторов, чем может отличиться лишь, человеческий речевой аппарат. У рояля и пианино в качестве резонатора используется грубо говоря, доска.
Почему тогда наушник человеческую речь воспроизводит? Резонатор тут не причем, голос раскладывается в спектр, спектр привязывается к нотам, ноты играются. Из суммы нот получается спектр опять.
Для качество вместо синусоид голос нужно раскладывать что-то по форме волны похожее на пианино, по-моему это вейвлеты называется. Хотя и синус тоже даст результат, потому что первая гармоника самая громкая.
Посетила такая мысль два года тому назад, только при игре на гитаре (когда начинал играть): «ну ведь можно же звуками издаваемые гитарой имитировать голос и речь» — собственные попытки не увенчались успехом (смотря на технологию в видео, становится понятно почему).
Ээээээ. Не сочтите за глупость, но этот практический опыт напомнил мне эпизод из книги «Победитель невозможного» (об Электронике, третья книга). А конкретно, упоминаемый в ней «Концерт для вертолета с оркестром». Если кто читал, то там речь шла о том, что мальчик настолько быстро играл на рояля, что звуки стали нереальными. На рояле имитировались звуки города. Но то была фантастика, а это — реальность.
похоже на результат спора пьяных фокусников «сллааааабббо сделать чтоб таааарееелкаа летала, нетттт уж лучше пустттть пианино гососом заговорит». Голос жесть — девочка компьютер из резидента эвила курит в стороне!
Что здесь такого крутого нашли? Это сто лет в обед известно.
У меня тоже самое программно сделано. При более 200 полос воспроизводимая речь практически без искажений получается. А в этом рояле контролировать длительность ноты невозможно, что дает дополнительную неразборчивость.
Так ведь в том и вся соль. Механическое пианино — очень незамысловатый инструмент и когда оно «говорит» чужим голосом, впечатляет не программа или идея, а именно реализация: звук, движения механики и прочие аудио-визуальные элементы.
Начало «фильма» начинается с фразы «Это возможно».
Я к тому написал, что те, кто в теме, и так без этих товарищей знали что это возможно, только не нужно, воспроизведение будет ужасное — как у пианино :)
Вот физики «в теме» знают, что струнная теория теоретически возможна, потому строят коллайдер чтоб доказать это. Дураки?
Или, например, теоретически возможно расшифровывать и программировать коды ДНК на любую задачу, зачем генные инженеры реализуют это на практике с переменным успехом?
Или поближе пример: японцы постоянно делают роботы которые могут разве что, внимание, ходить как человек. Миллиарды тратят. Идиоты! Как они не понимают, что теоретически это возможно, а воспроизведение все равно будет ужасное — как у буратино?!
А я уже думал написать про самую короткую в мире песню (http://tr.im/AZL9), а тут такое! Чувак не то что пианино зажжёт, он вполне и мозг взорвать может. В том числе и себе ;)
Ну вот, теперь сделали и электромеханический вокодер. Такой эффект уже сто лет как в поп-музыке используется, только в качестве несущего сигнала там обычно органы берут (зажал аккорд — и говори, не надо на каждый слог его по новой нажимать), получается такой «роботовый» голос =)
Можно было бы алгоритм и поправить, чтобы учитывало не только несущую гармонику, но и другие. Нажимать 30-50 клавиш одновременно это конечно клёво, но можно сделать 10-12 имхо.
Воспроизведение речи на пианино