company_banner

Как слепой разработчик в одиночку создала синтезатор речи


    Мы все, так или иначе, сталкивались с пользователями, имеющими проблемы зрения. Отвечающие за UI, не важно сайта, мобильного приложения или любого другого софта, скорее всего, знают про необходимость учитывать потребности таких людей и поэтому делали режимы повышенной контрастности, увеличенные шрифты и так далее.

    А что, если пользователь совсем слепой и все эти режимы никак не упрощают его жизнь? Здесь на арену выходят программы для чтения экрана и синтезаторы звука, без которых им не обойтись. И вот про один из них я бы хотел вам сегодня рассказать.

    Называется от RhVoice и упоминался в нескольких публикациях на Хабре. Но знаете ли вы, что многие считают его лучшим бесплатным синтезатором русской (и не только) речи, а написан он в одиночку полностью слепым разработчиком — Ольгой Яковлевой?

    Сегодня восстанавливаем историческую справедливость и немного узнаем про сам синтезатор вообще, и Ольгу в частности.

    Сразу раскроем все карты: гитхаб синтезатора

    Код синтезатора распространяется бесплатно по GPL, а значит его может встроить в свой продукт любой желающий. Доступен на трех платформах: Windows, Linux и Android. Ведет разработку Ольга одна и работает в Linux. Лучшим (из опенсорсных) синтезатором русской речи, его считают сами пользователи и это не только люди с плохим зрением. В своей работе синтезатор использует статистический параметрический синтез и был основан на наработках уже существующих проектов, таких как HTS, и опубликованных научных исследованиях. Это гибридная глубокая нейронная сеть, работающая со скрытой марковской моделью. Задача таких сетей, это разгадка неизвестных параметров на основе наблюдаемых. Можно считать, что это простейшая Байесовская сеть. Сам HTS был основан на наработках другого проекта — HTK. Но нас тут больше всего интересует, что часть наработок была опубликована для свободного использования, включая описание алгоритмов и примененных техник.

    Сам синтезатор позиционируется как средство для ежедневной работы. Его можно использовать и в более творческих целях вроде озвучивания книг, но все же лучше, когда их озвучивают люди.

    Ольга начала свой проект почти 10 лет назад, когда стала изучать Linux и не нашла там удобного для себя синтезатора. Пишет весь код она сама, используя для этого специальный Брайлевский дисплей. Это специальное устройство предназначенное для отображения текстовой информации в виде шести точечных символов азбуки Брайля. Также в работе использует JAWS, программу для чтения с экрана, которая ведет свою историю со времен DOS и тоже созданную при активном участии слепого.

    А теперь, когда вводные даны, давайте немного углубимся в мир синтезаторов речи.

    Что же такое синтезатор речи и что в него входит?


    Традиционно принято считать, что любой синтезатор состоит из двух частей: языковой компонент и компонент генерации речевого сигнала. Языковой компонент анализирует текст, получаемый от чтеца экрана. Его задача разбить текст на предложения, предложения на фразы, слова и слоги. В конце строится транскрипция всех слов и по ней создается карта звуков (как всем известно, не всегда как пишется, так и говорится). Разбор этот можно делать с разной глубиной проработки. У RhVoice, например, нет ресурсов для сложных операций вроде определения роли в предложении или части речи. Но в любом случае в конце разбора у нас получается набор звуков, которые должен собрать компонент генерации речевого сигнала, используя базу пред записанных звуков. Немного позже мы подробнее остановимся на каждом из компонентов.


    Демонстрация работы с синтезатором

    История Ольги


    Ольга живет в Чебоксарах, закончила математический факультет Чувашского государственного университета и работает программистом. Как и все незрячие люди, она училась в специализированных школах. Сначала были 6 классов в школе Нижнего Новгорода, потому что на тот момент в Чебоксарах не было мест, куда бы принимали полностью слепых детей. Но спустя шесть лет все же получилось вернуться в родной город, и доучилась Ольга уже в Чебоксарах. Там же в школе, Ольга полюбила математику, что в дальнейшем позволило ей поступить на математический факультет. В какой-то момент она думала о поступлении на ИВТ, но тут свою роль сыграла неуверенность в собственных силах. Да и среди выпускников математического факультета было несколько незрячих, а на вступительном собеседовании декан сказал, что у них программистов готовят даже лучше, чем на ИВТ.

    Первый опыт работы с компьютерами Ольга получила не в школе, а в университете, в библиотеку которого закупили специальные компьютеры, оборудованные для использования слепыми, с установленной программой JAWS (программа для чтения с экрана, ведущая свою историю аж с 1989 года). Там она изучала знаменитый учебник по Windows 95 от Сары Морли. Скорее всего, вы сейчас удивитесь, ибо что за такой знаменитый учебник, про который вы и не слышали ни разу? Ответ кроется в его названии: «Windows 95 для незрячих и слабовидящих». Основное отличие подобных учебников от знакомых всем нам, это акцент на описании различных объектов и вариантах управления ими. Так как незрячему человеку инструкция вида «щелкните мышкой на ниспадающий список и выберите нужный пункт меню» несколько бесполезна. Они не видят ни экран, ни курсор мышки и даже больше — не знает, как выглядит окно и ниспадающий список. Кстати, из-за этого возникает еще один неочевидный нюанс — незрячие люди могут оказаться заложниками битности используемого синтезатора. Так, лет пять назад, при переходе на Windows 8 многие столкнулись с отсутствием поддержки 64 bit приложений со стороны синтезаторов речи и перешли на RhVoice, где эта поддержка уже была реализована.

    Но вернемся во времена, когда Ольга только начинала изучение новой для себя области. Синтезатором речи тогда выступала программа Digalo с голосом Nikolay. Это настолько каноничная связка, что результаты ее работы слышал абсолютно любой человек, выходивший в сеть. Его голос можно считать синонимом термина «робовойс», настолько плотно он вошел в интернет культуру и был использован в бесконечном количестве видео на ютубе. Вероятно, поэтому абсолютное большинств уверено, что Дигало это фамилия Николая. 


    Digalo Nikolay во всей красе

    Начало работы над собственным проектом


    Путешествие в мир синтезаторов началось для Ольги примерно в 2010 году с разработки драйвера NVDA (NonVisual Desktop Access) для синтезатора Festival. NVDA, это бесплатная программа экранного доступа, позволяющая слабовидящим и незрячим полноценно работать с компьютером. Подобный класс программ включает в себя синтезатор речи и возможность вывода на брайлевский дисплей.

    Благодаря Festival Ольга погрузилась в мир синтезаторов речи и открыла для себя, что возможность заставить компьютер говорить есть не только у коммерческих компаний, но и у любого желающего. На тот момент уже существовало несколько открытых синтезаторов речи, которые, в основном, распространялись учеными изучавшими технологии речевого синтеза.

    Поэтому первые свои эксперименты на основе трудов более опытных коллег, Ольга делала вокруг все того же Festival. Это академический синтезатор речи, созданный в 1995 году группой ученых во главе с Аланом Блэком. Они разрабатывали методы синтеза и на основе своих исследований сделали собственный синтезатор, который изначально был просто демонстрацией результатов их работы. Со временем к нему добавился не менее важный проект FestVox, позволяющие генерировать новые искусственные голоса, а сверху это было приправлено довольно неплохой документацией. В то время в Festival уже был русский голос Alexander с довольно неплохой речевой базой.

    Что такое речевая база: в случае RhVoice это более тысячи специальных предложений, начитанных диктором с четким и безэмоциональным произношением. Предложения эти должны быть подобраны таким образом, чтобы в них содержались все дифоны, то есть все комбинации из двух фонем. И хорошо бы, чтобы по несколько раз каждая для большей вариативности. По воспоминаниям в первых версиях использовалось около 600 фраз. В дальнейшем, синтезатор из этих фонем может сформировать любое слово. По-английски этот метод называется unit selection, а у нас он известен как метод выбора речевых единиц. Да, не самый модный и молодежный, однако работающий надежно как утюг. Каждое предложение заносится в базу и анализируется: определяются звуки, их позиции в слогах, в словах, в предложениях. Классифицируются отдельные фонемы, их расположение относительно друг друга и так далее. Во время обратной операции, то есть синтеза речи, для каждой фонемы, полученной из транскрипции, вы просто выбираете наиболее подходящий (читай: близкий) пример из базы. Иногда удается найти строгое соответствие, иногда приходится довольствоваться максимально похожим. В мире филологов это называется теоретической и практической фонетикой и придумано было далеко не вчера. Поэтому заниматься синтезаторами речи без чтения учебников по фонетике нельзя. К слову, особенно хорошие учебники выходили в свое время у МГУ.

    А где брать эти предложения? Можно написать самому, но это довольно тяжелая затея и есть два альтернативных пути. Можно взять заранее написанный кем-то текст, но это может нарушить авторские права или стоить отдельных денег. Поэтому авторы некоторых голосов используют тексты с википедии. Для больших языков вроде английского или русского, там можно легко найти необходимые примеры. Небольшим языкам в этом смысле не повезло. Например, с белорусской википедией такой трюк не прошел.

    А в чем разница между языком и голосом? Ведь лет семь назад еще не было ни украинского, ни татарского диктора. Как же они появляются в синтезаторах?

    Голоса в синтезаторах речи


    Начинается все с анализа языка, который заключается в создании базы данных, где формально описывается фонетическая система этого языка. Такие базы могут быть уже сделаны кем-то и продаваться на рынке (за весьма хорошие деньги). В противном же случае приходится заниматься этим самостоятельно. Для анализа каждого языка разрабатывается отдельная программа и это может занимать до полутора лет работы, в зависимости от сложности языка. Например, итальянский язык очень прост, с точки зрения синтеза речи, а такие языки, как арабский и китайский крайне сложны. Но в среднем анализатор языка создается за год. После его готовности пишется уже голос. На это уходит уже около трех месяцев. Непосредственно запись самого диктора и прочая работа в студии занимает две-три недели. Это связано с тем, что качественно и красиво диктор может говорить примерно четыре часа в день. Дальше он устает и уже не звучит достаточно чисто. Если вы думаете, что это пижонство, то нет — к качеству этих записей предъявляются очень серьезные требования. Коммерческие компании проводят целые кастинги, отбирая не только по субъективной красоте голоса, но и по возможности использовать конкретный голос для конкретного языка в своем синтезаторе.

    Затем запись сегментируется на фрагменты, согласно базе данных, а затем с помощью анализатора языка, эти фрагменты комбинируются вместе. То есть делается разбор, что вот это существительное, это глагол, это стоит рядом с этим, значит должно звучать вот так и подставляется максимально близкая фонема. Так что роль анализатора чрезвычайно важна: он должен учитывать не только расположение слогов в слове, но и расположение слов в предложении и знаки препинания. Все это влияет на произношение. В некоторых языках, одно и то же слово может произноситься по-разному, в зависимости от того что это — существительное или глагол.

    Но это больше путь для коммерческих продуктов, у создателей которых есть ресурсы для подобных углубленных исследований. Независимые разработчики используют варианты попроще: без полной классификации по частям речи, а, например, только на уровне самостоятельное слово/предлог/союз и т.д. Ольга пошла еще более своим путем и написала свой языковой модуль на основе учебников и статей по фонетике. Благо есть достаточное количество опубликованных исследований на эту тему.

    А вы не замечали, что у большинства синтезаторов сначала появляются женские голоса? Это не из-за предпочтений авторов, а из-за сложности разработки именно женского голоса. Женский голос более высокий по своей природе, а высокие частоты обрабатывать сложнее, чем низкие. И если удается создать женский голос, то мужской уж точно получится. А вот наоборот, не факт.

    Мотивация к созданию своего синтезатора речи


    В случае Ольги, это личная увлеченность темой и, даже, необходимость. А что в случае с коммерческими разработками? Как они решают, какой язык добавить, а какой нет? Ответ на все, деньги. Первый, очевидный, вариант, это анализ возможного рынка сбыта для новых голосов. Если по-простому: каков экономический уровень страны и есть ли у ее жителей деньги для покупки их продукта. Второй стимул уже более интересный. Это желание правительственных, или иных организаций, создать синтез речи для данного языка. Поэтому были сделаны синтезаторы речи для очень небольших языков, просто потому, что кто-то этим озаботился и выделил деньги на разработку. А, например, в скандинавских странах есть законы, что все письменные документы должны быть доступны незрячим и слабовидящим. Поэтому любая выходящая газета должна иметь свою аудиоверсию.

    И для понимания порядка цен: разработка нового голоса, у частных компаний стоит примерно от десяти до сорока тысяч евро, в зависимости от сложности языка. Разработка модуля анализатора стоит в разы больше. Касательно RhVoice, тут у Ольги позиция принципиальная — ее проект будет бесплатным всегда. Тогда откуда тогда берутся деньги на дикторов? На начальных этапах находились добровольцы, предложившие помощь. У них была своя студия и они предложили оплатить диктора, так что Ольге оставалось только прислать список предложений для озвучания. Так в RhVoice появилось несколько новых языков. Потом к ней уже стали обращаться с конкретными запросами.

    Но судьба дальнейшей разработки зависит от нахождения в свободном доступе необходимых ресурсов. Например, для украинского языка раньше не было открытого словаря ударений, а построить синтезатор не зная, как расставляются ударения невозможно. Сейчас он уже добавлен, но работа была проведена большая. Русскому языку в смысле доступности материалов повезло намного больше. А каноничный голос «Александр», так и вовсе был выложен в открытый доступ его создателем, благодаря чему Ольга смогла начать свои первые эксперименты по созданию синтезатора речи.

    А как можно создать синтезатор, если ты совсем не знаешь язык? Условно ты знаешь русский и английский, а просят разработать арабский? Технических ограничений нет, главное, найти в интернете какие-то статьи и материалы о языке, о его структурах или даже проконсультироваться с филологом. Этого может хватить для разработки первоначального синтезатора речи. Ведь по большому счету, объем стартовой информации стандартен: список фонем, правила транскрипции от буквенного представления к произношению, детали о вспомогательных частях речи и т.д. Главная проблема будет в том, что разработчику никак не проверить результаты своей работы без участия носителя языка. А носителю языка надо дать не просто отзыв понятно/непонятно говорит, но и объяснить все тонкости и нюансы мест, где что-то пошло не по плану. В случае с RhVoice таким сложным языком стал татарский. С ним Ольге очень помогли филологи, с которыми ее связали представители Казанской библиотеки для слепых и слабовидящих, которые и инициировали эти работы. В ходе работы над синтезатором был даже составлен отдельный словарь корректного произношения заимствованных из русского языка слов. Чтобы заимствования звучали именно по правилам татарского языка, а не русского. И это хорошо, что такой словарь был составлен профессиональными филологами. Вот, например, для Киргизского такой словарь отсутствует и там очень много проблемных мест, пути разрешения которых пока не найдены просто технически.

    Отдельная проблема — это расстановка ударений. В некоторых языках местоположение ударения можно предсказать, но в тех же русском и украинском без словаря никак не обойтись. Причем существуют алгоритмы предсказания ударений, на основе этих словарей. Но сделать такое, не обладая базовым словарем, невозможно.

    Что в будущем? Вернее — каких новых функций, или доработки имеющихся, чаще всего просят пользователи? Безусловный лидер здесь это запрос на добавление того, или иного языка. Работа над новыми языками ведется, но как было сказано выше, это все не очень быстро и зависит от помощи внешних специалистов. А также многие просят улучшить качество звучания, чтобы еще больше приблизить его к естественному. Однако с доступным Ольге инструментарием, каких-то драматических улучшений здесь не будет. Правда от версии к версии, изменения в звук все же вносятся.

    Сейчас Ольга надеется, что появятся готовые компоненты для нейронных сетей, написанные на низкоуровневых С-подобных языках, которые смогут обеспечить достаточное быстродействие на мобильных устройствах. А если заведется на мобилках, значит и на остальных платформах будет работать. Подобные проекты уже разрабатываются, и тогда она сможет переработать свой синтезатор. Другая важная проблема, которую предстоит решить — в RhVoice нет простого и понятного способа добавить свой язык и голос. Есть люди, которые готовы оплачивать эту работу, но проблема el classico: запросов много, Ольга одна, а как и в большинстве for fun проектов, кодовая база представляет собой настолько волшебный лес, что разобраться в ней кому-то, кроме создателя, задача гиблая. В большинстве подобных проектов разработчики предоставляют желающим набор инструментов и документацию, по которой, зная фонетику языка и обладая остальными знаниями, можно создавать свой модуль языка. Пока у Ольги нет ни того, ни другого. Но есть планы это сделать.

    В завершении хочется сказать, что вот так, благодаря одному увлеченному человеку много лет делается очень хорошее дело. Больше вам спасибо, Ольга.

    Если вам тоже хочется поблагодарить Ольгу за ее бескорыстный труд, а то и вовсе принять участие в развитии RhVoice, помочь проекту своими знаниями, наработками или спонсорством — то сделать это можно, связавшись с Ольгой через ее гитхаб.

    RUVDS.com
    RUVDS – хостинг VDS/VPS серверов

    Комментарии 36

      +16
      Как-то раз температурящий ребёнок попросил почитать на ночь. Сил не было, т.к. самого шатало. Поставил Балаболку и RhVoice — справились на отлично, семья спокойно уснула.

      Спасибо за статью и спасибо Ольге за отличный продукт и за принципиальную его бесплатность. Движок и словари очень лёгкие, в отличие от многих брендовых, голос Ирины по сравнению с голосом Николая — как велосипед по сравнению с ходулями.
        0
        Кажется это самый душевный отзыв на софт, который я читала.
          0
          Пишите ещё, отзовёмся!
        +2

        Спасибо! Синтезатор с весьма разборчивой речью.

          +7
          Пользуюсь этим синтезатором много лет, но не знал, что он создан в таких обстоятельствах. Синтезатор действительно отличный. Если я и до этого восхищался трудом Ольги, то теперь даже не знаю, что и сказать.

          Кстати, код у синтезатора написан вполне хорошо. Я немного заглядывал внутрь и мне понравилось, как там всё работает. Давно хочу попробовать там что-нибудь улучшить, но пока работа не даёт заняться этим достаточно плотно.
            +10
            Снимаю шляпу. «Расскажите ей о ваших проблемах с копи-пастом со stackoverflow....»
              0
              благодаря одному увлеченному человеку много лет делается очень хорошее дело. Больше вам спасибо, Ольга.
              поддерживаю
              • НЛО прилетело и опубликовало эту надпись здесь
                  +6
                  такие слова, как «программистка», «разработчица» звучат очень даже неплохо
                  А чего на них останавливаться? Давайте все слова переделаем, поварка, парикмахерка, авторка, редакторка, что там еще есть? Вот только SJW тут не хватало. И так уже даже в ЯП наименования начали менять на «корректные».
                  • НЛО прилетело и опубликовало эту надпись здесь
                      +5

                      пилотка

                        +1
                        Пилотесса скорее
                          +1
                          менеджерка или менеджересса?
                            0
                            менеджАра :-)
                            Ну или менеджерша. Ну это еще ладно, новые слова и к ним нетрудно написать женское, а вот скажем к «капитан», «генерал» сложно, потому что есть жена капитана и генерала и как из этого выкрутиться я плохо понимаю
                        • НЛО прилетело и опубликовало эту надпись здесь
                          0
                          Вы прямо современный украинский язык цитируете!
                          +2

                          Интересно, а если автор статьи просто писал про интересного человека, его судьбу и его проект, даже не задумываясь какого он пола?

                          • НЛО прилетело и опубликовало эту надпись здесь
                          +2
                          Женский голос более высокий по своей природе, а высокие частоты обрабатывать сложнее, чем низкие. И если удается создать женский голос, то мужской уж точно получится

                          Гм… а мне всегда казалось, что в женском голосе меньше шумов и больше обертонов, поэтому существенные признаки звуков там программно проще выделять.


                          ЗЫ: бывший разработчик Realspeak, ныне Nuance Vocalizer в студии.

                            +1
                            В авиации речевой информатор отродясь говорит приятным женским голосом. Тут, видимо, как в романе «Война и мир» — "чем меньше войны, тем больше Наташи", за счёт особенностей психологического восприятия выстраивается второй выделенный буфер для обработки важных сообщений, вместо постановки в уже имеющийся FIFO, где до их обработки может не успеть дойти очередь.

                            Кстати, заглянул, что думает о FIFO Гугл — «FIFO — способ организации и манипулирования данными», всё верно, но перед выдачей — реклама в рамке — «FIFO – правило ротации товара». Опять всё верно, у знаний нет денег на собственное продвижение, в отличие от.
                              +2

                              В авиации так сделано, чтобы речь информатора резко выделялась на фоне речи лётчиков. На железке тоже. И речь там не синтезируют, а записывают готовые фразы. Раньше на магнитный барабан, теперь в ПЗУ.

                                0

                                Да, женские голоса лучше продаются.

                                  +1
                                  EGPWS всегда вещает мужским голосом, я вообще не помню слышал ли когда-нибудь женский. А вот, например RAAS, чаще всего говорит женским голосом.
                                +1
                                Молодец.
                                Моя племянница слепая с рождения, уже 20 лет, не говорит, т.к. развитие мозга идёт в основном через зрение. Когда ещё можно было «оживить» глаза, спаленные передозировкой кислородом у новорождённой, ни у кого не было денег, так, на пару пару поездок в москву хватило, а надо было с десяток…
                                Тифлопедагог, потерявшая зрение полностью из-за травмы, прозанималась с ней около года — дальше её не устроило, сложный ребёнок, мало денег от минздрава, а брат доплачивать не мог. К тому же она была из соседнего городка — кататься за 70 км ей не интересно было.
                                Вопрос. Поможет ли данный переводчик, если мать с ней будет заниматься, по крайней мере по два часа за компом. Просто водить её рукой по тексту, что бы заработала хоть какая-нибудь обратная связь. Её мама постоянно разговаривает с ней, каждый свой жест комментирует, оставляет ей аудиокнижки на прослушку…
                                Что ещё можно сделать?
                                Основное в данном вопросе — мозг не развит, зрение медсестра сожгла ещё в роддоме, обнаружили не сразу, когда поняли долго искали где можно сетчатку поправить, когда нашли — небыло денег, сейчас, вроде всё есть — время упущено…
                                  0
                                  А в каком состоянии племянница сейчас? Т.е. какая есть обратная связь? Мне рассказывали, (правда про слепоглухонемых), что они очень долго (годы) учатся азам, а потом осваивают новые знания очень быстро (годам к 16-17). Также есть информация, что мозговые структуры в основном формируются до 13 лет.
                                    0
                                    19й год по возрасту. По квартире ходит самостоятельно. По городу только в сопровождении, в машине (возил недавно на обследование) ведёт по началу адекватно, где-то через час её навинает укачивать и она начинает психовать. Не разговаривает, в основном требовательный или недовольный крик. Еду за столом в тарелке ищет самостоятельно, ещё и выбирает на ощупь повкуснее, но ложкой/вилкой пользоваться не умеет. На голос матери реагирует более менее адекватно.

                                    В том-то и дело, что опасаюсь, что время уже упущено. Надо будет с ними поговорить на тему «диктора» в качестве «обучалки»…
                                      0
                                      Мне кажется Вам могут оказаться полезными работы Эвальда Ильенкова:
                                      например, вот обзорная статья по работе со слепоглухими детьми.
                                      Он, кстати, был участником Загорского эксперимента.
                                        0
                                        Спасибо
                                    +2
                                    Тут надо не с хабром консультироваться а с медицинскими специалистами в этой области, тем более если сейчас есть финансовые ресурсы.
                                      0
                                      Все спецы в один голос говорят — опоздали. Никто не берётся, ни в Уфе, ни в Москве. А когда надо было — этоого несчастного тифлопедагога через округ выбивали — еле получили, и то через год она отказалась работать.
                                      0
                                      Ищите варианты. Сейчас много нового появляется… Удачи вам и терпения!
                                        0
                                        Ищем — уже лет пять назад никто не брался, хоть и деньги уже более-менее были…
                                      0
                                      Синтезатор хороший, большое спасибо Ольге за работу. Очень нравится его скорость работы. Хорошо заметно на андроиде в сравнении с синтезатором google, который сильно притормаживает. Ну относительно RHVoice.
                                      Однако согласен с проблемами качества звука, которые некоторые высказывают. Это выражается, как мне кажется, в фоновом шуме и нечетком произношении отдельных частей или букв. Если при произношении фразы или слова целиком все довольно понятно и никаких трудностей не вызывает, то вот, например, при наборе текста на клавиатуре некоторые буквы произносятся нечетко, плюс фоновый шум, и многие буквы не понятно что набираешь. У синтезатора google с этим гораздо лучше, никакого фонового шума, каждая буква произносится четко и ясно.
                                      Очень жаль что нельзя улучшить качество. И конечно нельзя сравнивать возможности мировой корпорации и одной разработчицы. Так что уважение и восхищение ее работе.
                                        +1
                                        это акцент на описании различных объектов и вариантах управления ими. Так как незрячему человеку инструкция вида «щелкните мышкой на ниспадающий список и выберите нужный пункт меню» несколько бесполезна. Они не видят ни экран, ни курсор мышки и даже больше — не знает, как выглядит

                                        Эти утверждения были актуальны как раз во времена windows95, когда даже большинство зрячих были неграмотны даже в таких вещах, как простой пользовательский интерфейс. Сейчас же слепой может всегда спросить как выглядит тот или иной элемент. И в скринридерах теперь есть функция отслеживания мыши. Это когда ты ведёшь мышиный курсор, а скринридер тебе озвучивает элемент под курсором. С помощью этой функции можно всегда понимать, как зрячие видят расположение элементов на экране. И даже цвет элемента можно узнать. По этому я за обучение слепых пространственному мышлению!
                                          0
                                          Более того. Не все незрячие такими рождаются. Многие теряют зрение по различным причинам. Они вполне знакомы с интерфейсом, как он выглядит и что все это означает, и нет проблем с пространственным мышлением. Рожденных незрячими да, надо обучать. Согласен.
                                          0
                                          Не считал себя программистом, как собственно и не учился на него, а после этой статьи совсем перестал.
                                          И что-то, охватила меня такая тоска и грусть, да печаль от беЗцельно прожитых лет, которых не мало. Считал, что, что-то сделал, а сколько не сделал и сколько можно будет сделать, но понял что ни в прошлом, ни в настоящем и будущем со сложившимися стереотипами и таким подходом к жизни, считать свои копошения и топтания деятельностью???
                                          Не ценю каждый миг и имеющиеся возможности и только возможно у лишённого или ограниченного в чем то и есть выбор из двух: либо сдохнуть, либо сражаться и второе выбирают далеко не все.
                                          Мой код г@вно, а оптимизированные однобайтные хаки софта беЗполезны, потому что не создал ничего полезного для людей имея все пять чувств и даже более. Кивать на остальных беЗсмысленно т.к. начинать надо всегда с себя и с того, что у тебя есть и использовать это превосходя самого себя, двигая свою точку сборки от релиза к релизу.
                                          Низкий поклон и выражаю уважение Ольге Яковлевой за урок мужества. Ограниченная по зрению — Программист с большой буквы, а для всех остальных, в т.ч. для меня эта способность скорее недуг или неудобство, раз имея зрение пишем такой код, не ценим красоту.

                                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                          Самое читаемое