Comments 42
Спасибо за статью и спасибо Ольге за отличный продукт и за принципиальную его бесплатность. Движок и словари очень лёгкие, в отличие от многих брендовых, голос Ирины по сравнению с голосом Николая — как велосипед по сравнению с ходулями.
Спасибо! Синтезатор с весьма разборчивой речью.
Кстати, код у синтезатора написан вполне хорошо. Я немного заглядывал внутрь и мне понравилось, как там всё работает. Давно хочу попробовать там что-нибудь улучшить, но пока работа не даёт заняться этим достаточно плотно.
благодаря одному увлеченному человеку много лет делается очень хорошее дело. Больше вам спасибо, Ольга.поддерживаю
пилотка
Интересно, а если автор статьи просто писал про интересного человека, его судьбу и его проект, даже не задумываясь какого он пола?
Кстати, заглянул, что думает о FIFO Гугл — «FIFO — способ организации и манипулирования данными», всё верно, но перед выдачей — реклама в рамке — «FIFO – правило ротации товара». Опять всё верно, у знаний нет денег на собственное продвижение, в отличие от.
В авиации так сделано, чтобы речь информатора резко выделялась на фоне речи лётчиков. На железке тоже. И речь там не синтезируют, а записывают готовые фразы. Раньше на магнитный барабан, теперь в ПЗУ.
Моя племянница слепая с рождения, уже 20 лет, не говорит, т.к. развитие мозга идёт в основном через зрение. Когда ещё можно было «оживить» глаза, спаленные передозировкой кислородом у новорождённой, ни у кого не было денег, так, на пару пару поездок в москву хватило, а надо было с десяток…
Тифлопедагог, потерявшая зрение полностью из-за травмы, прозанималась с ней около года — дальше её не устроило, сложный ребёнок, мало денег от минздрава, а брат доплачивать не мог. К тому же она была из соседнего городка — кататься за 70 км ей не интересно было.
Вопрос. Поможет ли данный переводчик, если мать с ней будет заниматься, по крайней мере по два часа за компом. Просто водить её рукой по тексту, что бы заработала хоть какая-нибудь обратная связь. Её мама постоянно разговаривает с ней, каждый свой жест комментирует, оставляет ей аудиокнижки на прослушку…
Что ещё можно сделать?
Основное в данном вопросе — мозг не развит, зрение медсестра сожгла ещё в роддоме, обнаружили не сразу, когда поняли долго искали где можно сетчатку поправить, когда нашли — небыло денег, сейчас, вроде всё есть — время упущено…
В том-то и дело, что опасаюсь, что время уже упущено. Надо будет с ними поговорить на тему «диктора» в качестве «обучалки»…
например, вот обзорная статья по работе со слепоглухими детьми.
Он, кстати, был участником Загорского эксперимента.
Однако согласен с проблемами качества звука, которые некоторые высказывают. Это выражается, как мне кажется, в фоновом шуме и нечетком произношении отдельных частей или букв. Если при произношении фразы или слова целиком все довольно понятно и никаких трудностей не вызывает, то вот, например, при наборе текста на клавиатуре некоторые буквы произносятся нечетко, плюс фоновый шум, и многие буквы не понятно что набираешь. У синтезатора google с этим гораздо лучше, никакого фонового шума, каждая буква произносится четко и ясно.
Очень жаль что нельзя улучшить качество. И конечно нельзя сравнивать возможности мировой корпорации и одной разработчицы. Так что уважение и восхищение ее работе.
это акцент на описании различных объектов и вариантах управления ими. Так как незрячему человеку инструкция вида «щелкните мышкой на ниспадающий список и выберите нужный пункт меню» несколько бесполезна. Они не видят ни экран, ни курсор мышки и даже больше — не знает, как выглядит
Эти утверждения были актуальны как раз во времена windows95, когда даже большинство зрячих были неграмотны даже в таких вещах, как простой пользовательский интерфейс. Сейчас же слепой может всегда спросить как выглядит тот или иной элемент. И в скринридерах теперь есть функция отслеживания мыши. Это когда ты ведёшь мышиный курсор, а скринридер тебе озвучивает элемент под курсором. С помощью этой функции можно всегда понимать, как зрячие видят расположение элементов на экране. И даже цвет элемента можно узнать. По этому я за обучение слепых пространственному мышлению!
И что-то, охватила меня такая тоска и грусть, да печаль от беЗцельно прожитых лет, которых не мало. Считал, что, что-то сделал, а сколько не сделал и сколько можно будет сделать, но понял что ни в прошлом, ни в настоящем и будущем со сложившимися стереотипами и таким подходом к жизни, считать свои копошения и топтания деятельностью???
Не ценю каждый миг и имеющиеся возможности и только возможно у лишённого или ограниченного в чем то и есть выбор из двух: либо сдохнуть, либо сражаться и второе выбирают далеко не все.
Мой код г@вно, а оптимизированные однобайтные хаки софта беЗполезны, потому что не создал ничего полезного для людей имея все пять чувств и даже более. Кивать на остальных беЗсмысленно т.к. начинать надо всегда с себя и с того, что у тебя есть и использовать это превосходя самого себя, двигая свою точку сборки от релиза к релизу.
Низкий поклон и выражаю уважение Ольге Яковлевой за урок мужества. Ограниченная по зрению — Программист с большой буквы, а для всех остальных, в т.ч. для меня эта способность скорее недуг или неудобство, раз имея зрение пишем такой код, не ценим красоту.
Вопрос к комьюнити — а насколько важно качество голоса для подобного рода интерфейсов?
Я вот допустим с радостью смотрю ролики OgoMK, озвученные через Digalo с голосом Nikolay. Качество речи там не очень, но я привык и нормально, даже есть свой шарм (там немного своя атмосфера).
Вопрос как воспринимаются "говорилки", если их слушаешь постоянно?
Мне просто пришла идея написать текущим мейнтейнерам RhVoice и предложить им запилить наш открытый TTS туда (https://habr.com/ru/post/549480/)
Не знаю, тут скорее мы пока просто тыкнули в небо, я не особо понимаю как работает эта экосистема.
Пока я услышал, что людям очень важен latency — а у нас максимум 5 RTC на 2 ядрах, чего недостаточно для мгновенного чтения.
Если честно, я не особо имею представление о том, как там всем этим управлять из-под винды или апишек чтения в операционных системах, так что рассчитываю, что люди с опытом покрутят и что-то подскажут.
Но открытый релиз на то и открытый, чтобы народ в благих целях куда-то это прикрутил.
Как слепой разработчик в одиночку создала синтезатор речи