Search
Write a publication
Pull to refresh
16
0
Send message

На самом деле Whisper — офигенно полезная вещь даже для незрячих. Казалось бы, зачем переводить речь в текст, если сам текст не видишь? Но тут всё наоборот. Текст — это универсальный способ передавать информацию в скрипты, ассистенты, Telegram-ботов и другие инструменты.
Я как раз сейчас пробую встроить Whisper в своего Telegram-бота (про которого, кстати, у меня есть отдельная статья). Использую его для голосовых команд, чтобы бот понимал, что от него хотят, без клавиатуры. Также удобно расшифровывать голосовухи, вытаскивать текст из аудио, заметки надиктовывать и т.п.
После распознавания всё это спокойно озвучивается скринридером или сразу обрабатывается ботом. По сути, Whisper — это мост между голосом и автоматикой. И штука реально рабочая, особенно если нужна доступность или просто хочется меньше печатать.

как это знакомо, и с этим приходиться работать

спасибо , да на дисплеях брайля в реальном времени логи смотреть трудновато, тут на большой скорости даже на скринридерах быстрее иногда выходит, ну я написал с чем сам работаю

скоро еще статью напишу, более подробно расскажу про инструментарий, как можно работать без экрана, так же скоро еще обновление будет готово, исправляю ошибки, добавил новые функции, в данный момент дорабатываю новую версию.

доброго времени суток, помогали пока нейросети не были достаточно развиты, сейчас большинство в решении проблем берет на себя нейросети, в бытовых и в профессиональных задачах, например в быту прекрасно работает приложение Be My Eyes, это распозновалка по изображению с камеры, ее можно установить любому человеку, там можно связаться с волонтером по видеосвязи, есть вкладка с нейросетью, это только 1 пример.

доброго времени, да, когда прогонял статью в нейросети, предложила эмодзи расставить, я когда пишу , прогоняю через чат боты, потому что на хабре писать иногда скрин ридер не говорит где пробел и тд. скрин ридер- или просто читалка штука для взаимодействия с компьютером без экрана

доброго времени, если правильно ли я понял, видео обзор возможностей программы? спасибо за идею, так как в программе еще много недочетов которые надо исправлять, надо пока их исправить, как я сделаю онлайн загрузку плагинов, то думаю и обзорчик запилю, а установка плагинов онлай подрузамивает, что пользователю вообще не надо будет плагины искать, список плагинов для установки будет загружаться из облака, и по нажатию просто сам скачивается и устанавливается.

доброго времени, я вот тоже подумал, что большинству не понятно как могут незрячие использовать компьютер, а тем-более программировать, я думаю надо развить эту тему, рассказать как это действительно можно делать без использования монитора, спасибо за идею, я думаю напишу цикл статей и про это.

ну с nvda, gaws,можно нормально работать, для nvda можно дополнения найти для нормальной работы в консоле, я забыл как называется, vs cod порекомендовал поставить, я поставил и забыл, думаю цикл статей написать про работу незрячего сисадмина с спецификой в ситуации.

доброго времени суток, у меня в организации стоят сервера на windows 2022, поэтому в первую очередь для винды, но в данный момент изучаю варианты для линукса, так как зависемости в питоне некоторые несовместимы, думаю через некоторое время для линукса начну писать. во всяком случае сейчас проще, чат гпт в помощь.

Information

Rating
227-th
Registered
Activity