Супер, теперь если ещё немножечко разобрать физиологические особенности нашей нейронной сети, то процесс распознования речи станет буквально очевидным.
Я про голографическую модель, мозга. В отличии от софтовых аналогов, в оригинальной сети нейронов присутствует латентность вносимая каждым отдельно взятым её элементом, включая аксоны. Таким образом, данные приходящие от рецепторов, как бы развёртываются в мозге который упрощённо можно рассматривать в данном случае как среду распространения нервных импульсов.
Программно такой подход реализуется скармливанием традиционной нейросети обратного распространиня, не просто абстрагированных данных, а ещё и хисторю из буфера, которая к стати тоже может быть абстрагирована.
Я понимаю голографические задвиги выглядят бредом, во многом из-за того что на эту тему существует много изотерических спекуляций, но стоит взглянуть на карты фазовой корреляции отведений ЭЭГ (а это сейчас большинство клинических энцефалографов умеет делать), очаги активности вызванные единичным раздражителем (вспышкой или щелчком или пищалкой), как бы прокатываются по всему мозгу.
До этого момента в процессе раскроют столько еще всего интересного, что распознавание речи будут воспринимать как должное ) Вот только случится это, к сожалению, очень нескоро.
Да. К сожалению, без него никак.
Никто же не садиться заниматься анализом экономических трендов без фундаментальных знаний по экономике?
Все-таки, распознавание речи — это прикладное программирование, которое невозможно реализовать без знаний о предметной области.
Глеб, спасибо Вам за офигенно интересный цикл статей! Мне очень странно, что статьи с таким содержанием и оформлением проходят мимо большинства аудитории Хабра, судя по оценкам.
На самом деле, этот цикл действительно расчитан на тех людей, которые хотят занятся разработкой такой системы, или же им это ОЧЕНЬ интересно. Ну а хабр, на мой взгляд, самое правильное место, где таких увлеченных людей можно найти в такой высокой концентрации.
Но абсолютно понимаю реакцию 80% людей, которые видят это текст… Она примерно такая:
o_0
А начал я писать из-за оставшихся 20%, которым действительно будет интересно, в надежде, что это хоть как-то зацепит оставшиеся 80%. В рунете фиг найдешь эту информацию, хотя на ангийском языке — пруд пруди. А так, по крайней мере люди будут знать, в какю сторону рыть.
Если бы надо было — достигли.
Но, к сожалению, или же к счастью, такие скорости в природе никуда не сунешь: затрат энергии много, а толку мало.
А вот маневренность нужна, иначе воткнешься клювом в ближайшее дерево.
Попробуй на самолете в лесу полетать.
Другие цели — другие решения, ага.
Но насчет сверхзвука — вы думаете, без крыльев самолеты далеко-бы полетели?
Кстати, реактивная тяга — из природы взята, вы не думайте.
В принципе, я ни в коем случае не настаиваю на том, что мы слепо должны бежать и повторять за природой то, что она придумала. Свои мозги тоже на плечах должны быть. Иначе телевидения, скорее всего, до сих пор бы не придумали… И колесо. И цепи маркова — чисто математическая абстракция, в природе их не найти.
Но стоит ли того затыкать уши, и напролом идти в неизведанную область, когда уже есть готовое
решение? Может быть стоит оценить обстановку и начать не с пустого листа, а с определенным багажем знаний.
Если вы с этим не согласны, тогда я вообще не понимаю зачем вы это читаете: идите и творите! Без шуток.
Кстати, что касается колеса — некоторые букашки сворачиваются и катятся вполне показательно. Да и вообще, круглого и иногда катающегося в природе не так уж мало.
Но тем не менее, если вас попросят создать устройство для полета самостоятельно — это наверняка будет дельтаплан-крыло или параплан, который можно изготовить самому в любительских условиях. Так же и тут — если не требуется решать сверхзадачи, можно начинать с наиболее очевидного.
> Структура внутреннего уха устроена так, что при различных частотах начального сигнала, максимальная амплитуда изменения давления жидкости в улитке будет регистрироваться на определенном расстоянии от ее основания (смотрим на рисунок).
Хочу заметить, что вот как раз рисунок неправильно это отображает. Мембрана изогнётся и на ней будет только один максимум, на расстоянии от начала мембраны, соответствующем данной частоте входного сигнала.
Распознавание речи. Часть 3. Голосовой тракт, слуховой тракт