Обновить
8
0
Ваганов Алексей@peston

Программист 1С

Отправить сообщение

да, вы правы.

Изначально мы работали с разбивкой до слова. Мы тестировали разные способы определения мест куда надо вставлять срин экрана и в одной из версий мы парсили каждое слово и по ключевым словам пытались понять куда надо вставить картинку. По слову можно точно определить с какой секунды брать картинку.

Позже мы отказались от такого подхода и начали работать с абзацами. Иногда, конечно, мы можем потерять картинку, если человек в одном абзаце что-то рассказывал и несколько раз переключал экран. Но решили, что и такой "приблизительности" хватит.

Теперь нам хватает "segments", надо попробовать отказаться от тайминга до слов.

Спасибо.

ошибка в статье, не используем NLTK, режем по точке

был старый код и ошибочно описали. Сорри

Спасибо за обратную связь. По поводу памяти тоже были удивлены, у нас на сервере видокарта 16 Гб - вроде неплохо и должно все работать, но по факту получали периодически проблемы с памятью.

Как мы поняли, это связано с тем, что мы транскрибируем текст с дословным таймингом и это увеличивает потребление памяти. Если запускать без этой опции, то вроде как работает лучше.

Допускаем, что мы не смогли корректно настроить whisper (хотя по разному пытались), но вот нашли для себя только такое решение которое нам помогло.

Мы пробовали другие модели fast whisper, whisperx, но везде были какие-то нюансы и остановились на whisper.

По поводу NLTK отпишусь чуть позже, уточню у коллеги, который делал этот кусок.

зависит от того, что именно рассказывать, но можно сэкономить время на подготовку


Благодарим Вас за обратную связь!

Обязательно учтём при подготовке следующего обновления. У проекта есть репозиторий на GitHub, однако его код оставляет желать лучшего — причина проста: над ним трудились вместе с сыном и уровень качества кода - не очень .

Вся разработка ведётся на движке Unity, и уже в ней мы создали инструмент конструирования игровых уровней (в игре есть демо создания простых уровней).

Еще раз спасибо за обратную связь

спасибо! будем стараться!

я вот размышляю об особенностях пленочной фотографии (хотя думаю, что она уже больше мертва чем жива, хотя сам снимаю на пленку) и на мой взгляд есть три существенных отличия:

  • цвет

  • передача полутонов и линий

  • рисунок объектива (боке и прочее)

на слайдовой пленке практически отсутствует зерно.

Но если отступить немного в сторону, то по полутонам и рисунку объектива вполне себе цифра догнала пленку. А вот по цветам слайда, мне кажется еще нет. Вот смотришь на слайд и цвета сильно отличаются, возможно они отличаются в купе с другими факторами, а мне кажется, что это только цвета.

Можно провести такой эксперимент, взять и на цифровую фотографию наложить только цвета взятые с слайдового кадра. В чем останутся отличия. Проведу такой эксперимент на досуге )

да, действительно, есть общее )

Читала свои стихи ) Запамятовал её фамилию, но её представили как из Союза Писателей России )

Информация

В рейтинге
Не участвует
Откуда
Новороссийск, Краснодарский край, Россия
Дата рождения
Зарегистрирован
Активность

Специализация

Разработчик игр, Программист 1С
Старший
От 250 000 ₽
Python