Pull to refresh
23
0
AigizK @AigizK

User

Send message

Вместо DVC просто git используете?

Не хватает примеров, для каких задач можно применять тот или иной график. Ценность бы выросла в разы.

по поводу универсальности сомневаюсь, что получится. те же stt лучше тренировать для своих данных, так как телефонная речь и с диктофона качество разное получается. далее может быть область, где есть ключевые слова, соответсвенно при распознавании надо "предупредить" вашу языковую модель, чтоб правильно расшифровала.

что касается анализа текста: для скорой медицинской помощи нужны одни данные, например уметь распознавать адрес, симптомы и тд, а для банка другие. получается слишком много нюансов.

Пока статья слишком вводная, но посмотрим что будет в следующий части.

По статье не очень понял, какую задачу решаете? Так как из аудио можно получить много информации(пол, возраст, эмоции и тд), а из текста, еще больше. И хотите сделать что то универсальное или решать узконаправленную задачу?

ну если запуск теста занимает минуты, то ты не будешь их запускать каждый раз, а сперва подумаешь, надо ли запускать. как результат, не будешь писать сперва тесты, а потом код. а скорее напишешь код и потом будешь его тестировать.

для сравнения в одной из компаний у нас была скорость 300-500 тестов/сек. Кол-во тестов было на тот момент где то 10-15k. и вот в таком случае даже лень фильтровать тесты, тупо запускаешь все

Прикольная идея. Наверное надо ещё добавить ограничения, типа, солнце должно попадать более Х часов, внутри помещения по расположениям комнат

Так то давно уже это есть у "частников". Странно, что у Яндекса это только сейчас появилась. Причем у Яндекса я так понимаю только для себя, а у @snakers4 это как отдельная библиотека

Мне кажется им вообще по барабану на в/на. Потому как на тюркских языках правила другие и там нет различия между в/на. Поэтому паттерн с детства такой не сформирован и когда говоришь по русски, можно спокойно допустить ошибку.

То же самое касается и родов(муж/жен/средн). Если для слов, которые часто используется еще в голове формируются правила, то в словах, которых очень редко используешь, на автомате можешь сказать используя мужской род(как единственный в таких языках).

Ну и раз сайт на АйТи тему, скажу с точки зрения оцифровки языка. Для того чтоб сделать модели распознавания речи данных надо намного меньше, чем для русского языка. То же самое касается и NLP задач. Корень слова не меняется, а добавляются суффиксы. Поэтому не существует проблем, типа почему слова "уйти" и "идти" однокоренные.

А вы всё распознаете или есть отдельная сетка, которая должна искать слово ИРИНА и потом запускать распознавание?

можете написать маленький питон скрипт, который запускает модель, а потом начинает мониторить stdin.

А ваш c# код запускает этот скрипт как субпроцесс и отправляет в его stdin и ждет ответ от stdout

это самый простой рабочий способ запустить питон

Я тут рассматриваю с точки зрения перевода мультиков. Как раз 2 проблемы там:

  1. В переводе голос чтоб был похож на оригинал

  2. Читать надо с интонацией

Второй пункт уже решен, достаточно самому прочитать с нужной интонацией и натравить синтезатор. Первый то же можно решить, нагенерив много голосов и подобрав похожий. Но можно ли сразу генерить, чтоб не перебирать варианты?

Круто, поздравляю! Перенос интонации вообще тема, особенно с рандомными голосами.

А можно ли в перспективе рандомный голос генерить, который похож на указанный? Причем, чтоб указанный голос был носителем другого языка?

Спасибо большое. А то @Christina29 и @snakers4 не делятся кодом, как именно надо тренировать 😊

И как распознаете длинные сообщения? Тех.детали можете написать?

Очень круто получилось.

По поводу

Бот способен расставлять знаки пунктуации и делить текст на предложения. Это довольно простая seq2seq-модель 4-классовой классификации (пустота, точка, запятая, знак вопроса), обученная на открытых данных общения из интернета. 

может отдельную статью с кодом сделаете? :)

Почему некоторые врачи боятся пломбировать зуб мудрости? Есть какие то особенности?

Одна из причин - человеческий фактор. Тот кто должен заменить, допустим забыл.

А можете подробнее еще и про детектор дефектов написать? Я так понимаю она у вас должна работать очень быстро, раз клиенту сообщаете, надо ли переснять.

А аналог патентной системы у вас нет?

В РФ например можно купить патент за 30-60k рублей+30k страховка+12k+ за обслуживание банка и это все твои расходы.

Information

Rating
5,092-nd
Date of birth
Registered
Activity