Pull to refresh
23
0
AigizK @AigizK

User

Send message

В каком объеме представлены другие языки?

Просто респект, ребята!

Спасибо большое. Надеюсь для других языков то же хорошо сработает.

вы наверное про новый ФГОС не слышали. Сейчас вообще все школы РФ выровнены. Нет тех возможностей у школ, что были в 1990-2005

Постарался написать кратко
очень кратко ))

Документы у нас не на английском. У LangChain все промпты на английском. И вот когда используешь дефолтный промпт по своим документам, то качество ответа иногда хуже, а иногда вообще ответ на английском языке.
Если перевести на свой язык, то эти проблемы исчезают, появляются другие: медленнее выдает ответ, цепочка вызовов может сломаться.

Пока langchain отложили в сторону. Так как

  • дебажить промты,

  • дебажить когда что вызывается,

  • переписывать ВСЕ промпты на другой язык, так как с английским промптом работал хуже

  • оптимизация запросов

оказалось что эти пункты занимают больше времени, чем реализовать пока свою.

говорят, что приложение можно собрать как один файл, и запускать где угодно. а не просить ставить везде нужную версию питона с зависимостями.

Круто, молодцы. Чем больше открытых моделей, тем трава зеленее 😄

там апи чуть другой. вот тут посмотрите: https://platform.openai.com/docs/api-reference/making-requests

  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $OPENAI_API_KEY" \
  -d '{
     "model": "gpt-3.5-turbo",
     "messages": [{"role": "user", "content": "Say this is a test!"}],
     "temperature": 0.7
   }'```

А как громкость влияет на распознавание звука? У Яндекса вроде на максималках микрофон просто перестает слышать. Как у вас с этим?

Как насчет других языков?

Круто, спасибо за код и датасет.
Ну из кейсов - каждый год проводят тотальный диктант. Можно там проверять автоматом, плюс договориться с ними, чтоб потом эти диктанты с вами расшарили :)
А так конечно хочется быстрее внедрить такие технологии в школах, чтоб учителя а) перестали тратить время на проверку тетрадок(это самая нелюбимая работа у них) б) автоматом собирать статистику по ребенку, классу, какие ошибки совершают. И далее как то все это еще анализировать и сделать выводы.

Почему в СССР была короткая продолжительность жизни? Потому что им всегда приходилось стоять в очереди, чтобы умереть.

Если заменить в ответе слово "короткая" на "длинная", шутка получается на удивление хорошей!

Мне кажется вы сами не уловили смысл шутки. Бот все правильно сказал, дедлайн даты смерти - это константа. Чтоб успеть на это время, чуток живешь и дальше становишься в длинную очередь :)

Если скрипты еще остались из этой статьи, сравни еще раз WER для русского, только уже с этими модельками: https://huggingface.co/spaces/autoevaluate/leaderboards?dataset=mozilla-foundation%2Fcommon_voice_11_0&only_verified=0&task=automatic-speech-recognition&config=ru&split=test&metric=wer

люди на твоем же датасете https://github.com/snakers4/open_stt дообучили.

сбер говорил, что у них пока нграммы работают лучше всего

Идея очень интересная, я аналогичные боты делаю для школы. Там то же много что можно упростить так. По поводу реализации, надеюсь не смотря на “джентльменские соглашения”, вы все равно как то обезопасили себя? например, запускаете код внутри докера?

Information

Rating
Does not participate
Date of birth
Registered
Activity