Как стать автором
Обновить

Как с помощью Python создать приложение для расшифровки речи в реальном времени

Время на прочтение6 мин
Количество просмотров17K
Всего голосов 12: ↑8 и ↓4+4
Комментарии15

Комментарии 15

Название статьи должно быт: "Как с помощью AssemblyAI создать приложение для расшифровки речи в реальном времени", так как питон тут вторичен.

"Как вызвать функцию из библиотеки веб-сервиса"...

НЛО прилетело и опубликовало эту надпись здесь

Я понимал, что подобная ситуация, к сожалению, может возникнуть сегодня даже на самом открытом сервисе, поэтому дописал об адаптации кода для российского бекенда

Огромное количество современных веб-приложений (и не только веб) сводится к тому, чтобы правильно, аккуратно и красиво вызвать по API уже существующую на бекенде функцию. Начиная, например, с навыков "Маруси" или "Алисы".

Здесь автор не просто "вызывает функцию", но и оборачивает её в лаконичный, открытый фронтенд, который любой разработчик сможет адаптировать под себя, работает с веб-сокетами, а значит, с asyncio, и PyAudio. Получается небольшой MVP. Он может быть полезен людям, которые пишут подобное приложение для своих задач.

Если вы посмотрите на оригинал статьи, то среди неравнодушных к материалу людей найдёте даже архитектора ПО

Здесь автор не просто "вызывает функцию", но и оборачивает её в лаконичный, открытый фронтенд, который любой разработчик сможет адаптировать под себя,

Возможно, туториал действительно полезен, но тем не менее, это уровень вызова функции из функции. Речь ведь не о реализации распознавалки речи, как можно было подумать по названию, и даже не использования готовой нейросети, а о подключении готового сервиса. Если AssemblyAI отключит этот сервис - от туториала ничего не останется.

Если вы посмотрите на оригинал статьи, то среди неравнодушных к материалу людей найдёте даже архитектора ПО

Странная аргументация; к тому же, я посмотрел и ничего такого не нашёл.

Список людей, которым понравилась статья, откроется по клику на число "хлопков" (не на ладонь для хлопка). Когда относительно простые статьи замечает человек с высокой квалификацией, как правило, это означает, что, кроме простоты, в ней есть что-то ещё. Здесь это, скорее всего, — доступность подачи.

А одна из наших задач — снимать страх перед технологиями. Поэтому мы с самого начала указываем на простоту реализации с поверхности и рассказываем именно о ней:

Но мы покажем, насколько простыми стали распознавание и транскрипция речи, по крайней мере, на поверхности.

Подзаголовок указывает, что используются сервисы, фреймворки и т. д., которые, так или иначе, сводят сложные задачи к вызовам единичных функций.

И всё же шаблонный код интерфейса от статьи останется, хотя и не весь. API работы с аудио естественным образом построены на одних и тех же понятиях, но вот этот пример скорее напугает новичка, он создан для специалиста.

Когда относительно простые статьи замечает человек с высокой
квалификацией, как правило, это означает, что, кроме простоты, в ней
есть что-то ещё.

Поверьте, лайк даже не означает, что статья прочитана. С остальным не спорю.

Если есть API, то вторичен любой язык, но автор использует Python, а примеры работы с API удобно делить по языкам

Очень интересно. Надо попробовать

Введение

Приложение расшифровки речи в режиме реального времени автоматически преобразует текст в речь. Этот текст почти мгновенно отображается на экране, ...

Перечитайте вдумчиво, логика первого предложения явно нарушена.

Поправили, большое спасибо!

Это ПОЛЕЗНО, но нифига не интересно. Я ожидал тут data science , а тут скачивается всё готовенькое. Это, в общем-то, не ПРОГРАММИРОВАНИЕ и не PYTHON даже, ненужны навыки в пайтонне чтобы скачать все необходимые программки и написать пару строчек кода ¯\_(ツ)_/¯.

Так что, по сути, название "создаём ******* с помощью Python" – кликбейт

Это как раз и есть программирование на Питоне.

Вот что на https://www.python.org написанно:

> You can learn to use Python and see almost immediate gains in productivity and lower maintenance costs.

Это типиичная ниша для языка, взять разные инструменты и собрать из них что то новое.

> Так что, по сути, название "создаём ******* с помощью Python" – кликбейт

Реклама, маркетинг, один раз без асбеста, всегда без асбеста.

Язык в общем-то тут действительно вторичен, но вот экосистема играет важную роль. Я не в курсе про аналоги streamlit на Java, C++ и других мейнстримных языках. Может что-то на javascrit совместимых языках есть.

Кликбейт, у меня всё

Зарегистрируйтесь на Хабре, чтобы оставить комментарий