Как стать автором
Обновить
25
0
AigizK @AigizK

Пользователь

Отправить сообщение

там апи чуть другой. вот тут посмотрите: https://platform.openai.com/docs/api-reference/making-requests

  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
     "model": "gpt-3.5-turbo",
     "messages": [{"role": "user", "content": "Say this is a test!"}],
     "temperature": 0.7
   }'```

А как громкость влияет на распознавание звука? У Яндекса вроде на максималках микрофон просто перестает слышать. Как у вас с этим?

Как насчет других языков?

Круто, спасибо за код и датасет.
Ну из кейсов - каждый год проводят тотальный диктант. Можно там проверять автоматом, плюс договориться с ними, чтоб потом эти диктанты с вами расшарили :)
А так конечно хочется быстрее внедрить такие технологии в школах, чтоб учителя а) перестали тратить время на проверку тетрадок(это самая нелюбимая работа у них) б) автоматом собирать статистику по ребенку, классу, какие ошибки совершают. И далее как то все это еще анализировать и сделать выводы.

Почему в СССР была короткая продолжительность жизни? Потому что им всегда приходилось стоять в очереди, чтобы умереть.

Если заменить в ответе слово "короткая" на "длинная", шутка получается на удивление хорошей!

Мне кажется вы сами не уловили смысл шутки. Бот все правильно сказал, дедлайн даты смерти - это константа. Чтоб успеть на это время, чуток живешь и дальше становишься в длинную очередь :)

Если скрипты еще остались из этой статьи, сравни еще раз WER для русского, только уже с этими модельками: https://huggingface.co/spaces/autoevaluate/leaderboards?dataset=mozilla-foundation%2Fcommon_voice_11_0&only_verified=0&task=automatic-speech-recognition&config=ru&split=test&metric=wer

люди на твоем же датасете https://github.com/snakers4/open_stt дообучили.

сбер говорил, что у них пока нграммы работают лучше всего

Идея очень интересная, я аналогичные боты делаю для школы. Там то же много что можно упростить так. По поводу реализации, надеюсь не смотря на “джентльменские соглашения”, вы все равно как то обезопасили себя? например, запускаете код внутри докера?

о да. скучность прям убивает желание. я вот то же смотрю в сторону Whisper+nllb чтоб прикольные видео переводить. причем я бы совместил пользовательский словарь и перевод слов над оригиналом. если вы выучили это слово, не надо уже туда добавлять. а все слова, которые встречаются в видео, их надо добавлять автоматом в словарь, чтоб отдельно можно было повторять/учить.

В сторону LayoutLMv3 не смотрели?

Решил переместиться с 2022 в начало 2014, когда трава была зеленее?

Ваш продукт используют программисты со всего мира. Поэтому есть смысл написать такую статью на хакерньюс, реддит. Там охват будет больше и культура пожертвования развита лучше.

если выбрали автоопределение, то гугл на самом деле детектить это как татарский. и видно, что качество татарского там то же хромает.

Спасибо, пока хочется просто узнать, сколько памяти занимает. То же планирую использовать эту модельку

А сколько памяти требует? И как быстро парсит на твоем GPU?

За ссылки по диаризации и дообучения отдельное спасибо. Заценим.

Ну и добавим перевод от https://bashkortsoft.ru/

Вершина горы крутая. Вершина его была завалена камнями. Эти камни придают горе тревожный оттенок. Они напоминают диких зверей издалека. Правее камней - можжевельник. Дальше видны белые березы. Они имеют вид света, который светит гору. На левом конце горы выстроились сосны. Казалось, они показывали гору еще больше, реже. Подножие горы заполнено жёлтым душицем. Их так много. Как будто желтое море.

Как видно, ближе всего к вашему переводу этот результат. А построен он на этом коде: https://marian-nmt.github.io/ . Для обучения использовали больше 1M пар. Плюс сейчас то что мы собираем через телеграм бота, то же туда пойдет. Так что на вопрос, всегда ли только крупные корпорации могут сделать такое, ответ будет нет.

К слову перевод от NLLB передает смысл почти полностью и при этом он собирает несколько предложений в одно предложение. То же очень прикольно. Тут получается использовали в основном вики-ресурсы. Так что, если даже у вас нет программистов, кто может сделать переводчик, благодаря вики и таким гигантам, у вас может появится хороший переводчик.

Тот же Wav2Vec2.0 обученный на англ, можно дообучить на других языках. При этом достаточно 10+ часов. И времени не много требует, на том же Colabe можно сделать.

http://deeppavlov.ai/blog/tpost/iathe31d82-zavershenie-proekta-neirointellekt-ipavl

выглядит, что основатель пилит опенсорс. и когда говорят про миллион скачиваний, это не имеет ничего общего с iPavlov

Информация

В рейтинге
Не участвует
Дата рождения
Зарегистрирован
Активность