Как стать автором
Обновить
Привет! Меня зовут Филипенко Владимир и я не писал эту статью. Я её надиктовал. Поправок в этом тексте потребовали только термины, с которыми SmartSpeech ожидаемо не знаком. В остальном оставляю всё как есть.

В материале мы познакомимся с передовым сервисом синтеза и распознавания речи SmartSpeech от Сбера, обсудим его внутренности и разберемся, как этот сервис может облегчить и даже украсить жизнь рядового хабраавтора.
Поехали!
Всего голосов 17: ↑11 и ↓6+20
Комментарии19

Комментарии 19

Никогда не пойму, почему не писать цены за свои услуги?

Почему нужно лазить по сайту и даже на нем тарифы закопаны где-то на портале для разработчиков... Насколько знаю, абсолютно всех бесят эти "цена по запросу", и при этом стоит сделать что-то свое - с радостью наступают на те же грабли...

Синтез речи: 18.6 коп. за 1000 символов
Распознавание речи: 60 коп. за 1 минуту.

Чтобы иметь 2 возможности: переобуваться в прыжке; устанавливать каждому клиенту свою цену, в зависимости от его платежестпособности.

Gogle Docs - диктовка бесплатно

Microsoft OneDrive Word - диктовка бесплатно. За деньги - расшифровка в текст аудиофайла.

P.S. Именно сегодня развлекался сравнивая диктовку Google и Microsoft на аудидиодорожке одной и той же видеозаписи. MS победил немного меньшим количиством ошибок и стабильностью - у Google постоянно приходилось перезапускать и работало только в Chrome.

Спасибо большое, только-только подбираю устройство, чтобы MS устойчиво с русским языком работал. Но, к сожалению, это все - короткие заметки.

К плюсам MS можно добавить, что он отмечает места, где есть сомнения в точности распознавания и к ним можно быстро вернуться для ручной коррекции. И также отображается точность распознавания в процентах - в моих пробах получалось 92-96%.

Windows 11 (win+H) - диктовка тоже бесплатно

@Javian, вы пишите:

|Microsoft OneDrive Word - диктовка бесплатно. За деньги - расшифровка в текст аудиофайла.

Не могу в своем платном OneDrive найти расшифровку аудиофайла в текст. Подскажите пожалуйста - где она находится.

Зачем писать статью, если можно не писать
(заголовок в рекомендациях в шапке)

Потому что при скорости печати слепым десятипальцевым набором свыше 900 символов в минуту можно набирать текст быстрее, чем его физически возможно проговаривать в комфортном режиме. И предел скорости набора текста можно повышать тренировками, а с проговариванием и последующим распознаванием так не получится.

Странное такое чувство, вы и думаете со скоростью свыше 900 символов в минуту (10% - пробелы, кстати). Можно и читать 5000 знаков в минуту, даже пересказывать прочитанное, но что-то мало кто этими режимами мозга пользуется. Нужен комфорт мозговой работы, для чего и нужны инструменты "речь-в-текст" и обратно.

Думаем мы гораздо быстрее ~900 символов в минуту, просто не осознаём это как правило. Всё от ситуации зависит, но ~900 эт уж слишком мало.

Кстати, кажется абсолютно не зря природа мозга так устроена, что, думая 40 000 мыслей в день, 20 000 исчезнут совсем без следа, еще сколько-то без записи на бумагу тоже пропадут, остается около 1000 идей, которые большие умы могут додумать до конца. Не зря же мужчина на русском языке может сказать 10000 слов в сутки, женщина - 15000. Порты ввода/вывода иначе погорят. А так достаточно ненапряжно: 8 часов по 60 минут воспроизводить то, что содержится в оперативной части мозга (а она невелика) + 600 печатных страниц из долговременной = около 480 000 знаков в день. Получаем 1 слово говорим, 10 думаем. Если у вас другие расчеты, подскажите, пожалуйста.

Как хабраавтору мне разумеется больше всего интересен последний пункт,

А мне (как граммар-наци) больше всего интересно, когда оно научится вводное слово "разумеется" запятыми обрамлять. Если, конечно, хабраавтору в этот момент не разумелось что-то древнерусское.

Под мобильные устройства планируется создавать?

Пропущенные запятые не вдохновляют.

Печать букв - это только малая часть работы над текстом. Ещё его надо как минимум структурировать и редактировать стилистически. К тому же, держать в голове всю необходимую информацию для работы над хорошей содержательной статьёй решительно невозможно, по любому нужны заготовки и копипаст.

В старые добрые времена было правило: не написано - значит не было. И как только человек садился писать, он начинал думать. Жалко жалко прощаться с этимими старыми добрыми временами.

В старые и добрые были секретари и писари (а затем машинистки). Есественно, у тех, кто мог за это платить. Писатели, видимо, по большей части не могли и вынуждены были корячиться сами с перьями, затем с кнопками и копирками, потом просто с кнопками. Ну а теперь, видимо, прогресс выходит на принципиально новый этап. Писари, считай, уже есть, осталось дождаться полноценных электронных секретарей-редакторов-корректоров

Тем более, что прощаться никто и не заставляет. Можно прекрасно, "как в старые добрые" творить любым из доступных ранее способов. Все они не только доступны, но многие стали даже более доступны, чем прежде. Например, бумага и чернила уж точно подешевели в сравнении с каким-нибудь там 17-м веком

Ну и где сейчас найти нормальную глину для табличек?!

Зарегистрируйтесь на Хабре, чтобы оставить комментарий