Обновить
16
0
Антон Рябых@lenant

CTO, Лид машинного обучения

Отправить сообщение

Спасибо, а какое квантование используете на Gemma?

Спасибо за статью!

Подскажите, как делаете voice embedding, через какую модель? И как эти результаты в сравнении с pyannote?

Про ограниченный input контекст и разбиение для саммари на чанки: сейчас в моделях часто до 128к контекстное окно, неужели не хватает? Или есть какие-то иные причины, может быть не влазит в GPU?

И как оцениваете метрику rouge-n, в плане насколько она адекватно оценивает задачу саммаризации? Ведь по сути она не оценивает передаваемый смысл.

Спасибо за статью, очень интересно про такое читать!

А что означает "Глобальный batch размер: 768 батчей"? Тут не имеется в виду 768 последовательней в батче? Или речь про что-то другое?

Спасибо за статью! Сравнивали ли свои модели с тем, как отработают ллм-ки?

Спасибо за статью!
Как я понял, на втором шаге обучения использовались только датасеты с изображениями, без использования изначальных текстовых датасетов. Пара вопросов:
1. Не снижается ли от этого результаты работы модели на обычных текстовых бенчмарках, не начинает ли она забывать то, что выучила раньше?
2. И еще вопрос, размораживаете ли вы всю сеть разом или как-то по слоям?

Понимаем вашу обеспокоенность :)

Но цель нашего проекта - повышение безопасности на дорогах и снижение вероятности аварий. Тут только контроль рабочего процесса и соблюдения правил безопасности, подобно системам, следящим за тем, чтобы строитель надел каску. Программа не коим образом не следит за личной жизнью водителей. Так что права и свободы человека не нарушаются, а дороги становятся безопаснее ?

Тут одна из особенностей была в том, что камеры уже были установлены в транспорте. Заменять их на другие камеры или вешать по другому - это очень затратно, требовалось решение, которое будет работать с тем, что есть. И с того ракурса, который есть, уже не было возможности работать со взглядом водителя, к сожалению, - для этого нужна камера, установленная прямо перед ним.

Спасибо, что поделились своим практическим опытом! Pruning During Training на практике я не использовал, так что по нему подсказать не смогу, к сожалению.

Спасибо за идею, в Android-проектах мы его ещё не внедряли, но попробуем в будущем, и, возможно, напишем ещё одну статью о нашем опыте. При этом в нашем блоге Doubletapp вы уже можете прочитать о работе с fastlane применительно к iOS-проектам.

В целом целью данной статьи было показать процесс настройки CI с минимальным количеством автоматизаций/упрощений, чтобы читатель лучше разобрался как работает CI.

Информация

В рейтинге
Не участвует
Дата рождения
Зарегистрирован
Активность

Специализация

Технический директор, Machine Learning Engineer
Ведущий
Управление людьми
Управление компанией
Разработка под Android
Машинное обучение
PyTorch
TensorFlow
Компьютерное зрение
Обработка естественного языка
Deep Learning
Управление IT-услугами