Информация
- В рейтинге
- Не участвует
- Дата рождения
- Зарегистрирован
- Активность
Специализация
Технический директор, Machine Learning Engineer
Ведущий
Управление людьми
Управление компанией
Разработка под Android
Машинное обучение
PyTorch
TensorFlow
Компьютерное зрение
Обработка естественного языка
Deep Learning
Управление IT-услугами
Спасибо, а какое квантование используете на Gemma?
Спасибо за статью!
Подскажите, как делаете voice embedding, через какую модель? И как эти результаты в сравнении с pyannote?
Про ограниченный input контекст и разбиение для саммари на чанки: сейчас в моделях часто до 128к контекстное окно, неужели не хватает? Или есть какие-то иные причины, может быть не влазит в GPU?
И как оцениваете метрику rouge-n, в плане насколько она адекватно оценивает задачу саммаризации? Ведь по сути она не оценивает передаваемый смысл.
Спасибо за статью, очень интересно про такое читать!
А что означает "Глобальный batch размер: 768 батчей"? Тут не имеется в виду 768 последовательней в батче? Или речь про что-то другое?
Спасибо за статью! Сравнивали ли свои модели с тем, как отработают ллм-ки?
Спасибо за статью!
Как я понял, на втором шаге обучения использовались только датасеты с изображениями, без использования изначальных текстовых датасетов. Пара вопросов:
1. Не снижается ли от этого результаты работы модели на обычных текстовых бенчмарках, не начинает ли она забывать то, что выучила раньше?
2. И еще вопрос, размораживаете ли вы всю сеть разом или как-то по слоям?
Понимаем вашу обеспокоенность :)
Но цель нашего проекта - повышение безопасности на дорогах и снижение вероятности аварий. Тут только контроль рабочего процесса и соблюдения правил безопасности, подобно системам, следящим за тем, чтобы строитель надел каску. Программа не коим образом не следит за личной жизнью водителей. Так что права и свободы человека не нарушаются, а дороги становятся безопаснее ?
Тут одна из особенностей была в том, что камеры уже были установлены в транспорте. Заменять их на другие камеры или вешать по другому - это очень затратно, требовалось решение, которое будет работать с тем, что есть. И с того ракурса, который есть, уже не было возможности работать со взглядом водителя, к сожалению, - для этого нужна камера, установленная прямо перед ним.
Спасибо, что поделились своим практическим опытом! Pruning During Training на практике я не использовал, так что по нему подсказать не смогу, к сожалению.
Спасибо за идею, в Android-проектах мы его ещё не внедряли, но попробуем в будущем, и, возможно, напишем ещё одну статью о нашем опыте. При этом в нашем блоге Doubletapp вы уже можете прочитать о работе с fastlane применительно к iOS-проектам.
В целом целью данной статьи было показать процесс настройки CI с минимальным количеством автоматизаций/упрощений, чтобы читатель лучше разобрался как работает CI.