Статьи / Закладки / Профиль dark0n01 / Хабр

@dark0n01

Пользователь

Профиль Публикации Комментарии 14Закладки 6

YaphetS7 20 дек 2023 в 17:17

Как дообучать огромные модели с максимальным качеством и минимальными затратами? LoRA

Средний

8 мин

3.7K

Машинное обучение*Искусственный интеллект

Обзор

✏️ Технотекст 2023

paper link

hf implementation

Для ответа на вопрос в заголовке - погрузимся в статью.

Саммари статьи:

Обычно LLM-ку предобучают на огромном корпусе, потом адаптируют на down-stream tasks. Если LLM-ка была большая, то мы не всегда можем в full fine-tuning. Авторы статьи предлагают Low-Rank Adaptation (LoRA), который замораживает предобученные веса модели и встраивает "rank decomposition matrices" в каждый слой трансформера, очень сильно понижая кол-во обучаемых параметров для downstream tasks.

Compared to GPT-3 175B fine‑tuned with Adam, LoRA can reduce the number of trainable parameters by 10,000 times and the GPU memory requirement by 3 times. LoRA performs on‑par or better than finetuning in model quality on RoBERTa, DeBERTa, GPT-2, and GPT-3, despite having fewer trainable parameters, a higher training throughput, and, unlike adapters, no additional inference latency.

Многие NLP-приложения требуют решения разных задач, что зачастую достигается путем дообучения большой модели на несколько разных downstream tasks. Самая важная проблема в классическом fine-tuning'е - новая модель содержит столько же параметров, сколько начальная.

Есть работы, где авторы адаптируют только некоторые параметры или обучают внешний модуль для каждой новой задачи. Таким образом, нам необходимо для каждой новой задачи хранить лишь веса, связанные с этой задачей. Однако, имеющиеся методы страдают от:

Inference latency (paper 1 - Parameter-Efficient Transfer Learning for NLP).

Reduced model's usable sequence length (paper 2 - Prefix-Tuning: Optimizing Continuous Prompts for Generation).

Часто не достигают бейзлайнов, если сравнивать с "классическим" fine-tuning'ом

Saitcraft77 27 июл 2023 в 15:25

Запустили Директ и нет лидов? 7 шагов базовой оптимизации рекламы

Средний

8 мин

1.9K

Семантика*Контекстная реклама*Поисковая оптимизация*

Из песочницы

К нам в агентство часто обращаются клиенты с проблемой — запустили контекстную рекламу, а она не работает. Рекламные бюджеты сливаются, заявки отсутствуют (в некоторых случаях их мало и они дорогие). В общем, реклама не окупается, поставленные KPI не достигаются. Почему же контекст не работает? А главное — как это исправить, чтобы заявки наконец пошли?

-1

Pampam83 27 сен 2022 в 16:10

Как Осборн Рейнольдс пришёл к своему числу. Часть 4

11 мин

2.3K

Научно-популярноеФизика

Перевод

Перевод классической научной работы, вышедшей в 1883 году.

+10

mopkob 30 дек 2022 в 08:50

Надеть Telegram на OpenVPN и завернуть это в Docker

8 мин

16K

Настройка Linux*Системное администрирование*Сетевые технологии*DevOps*DIY или Сделай сам

Туториал

Победитель Технотекст 2022

Мигрируя в этом году свою инфраструктуру в новый датацентр, поймал себя на мысли о том, что возраст моей виртуальной частной сети (VPN) для доступа к серверам и устройствам перевалил за 10 лет.

Мой старый товарищ OpenVPN ни разу не подвел меня.

Подумав обо всех неудобствах и издержках я решил улучшить имеющийся механизм управления всем VPN-хозяйством.

Под катом вы найдете детали того, что получилось. Кратко, результат следующий: композиция из двух docker-контейнеров, которые превращаются в telegram-бота для управления VPN сервисом. И для этого нужно выполнить всего две команды в консоле.

Механизм управления VPN сервисом теперь не требует каких-либо навыков системного администрирования или доступа к Linux-консоли при выполнении рутинных операций. Например, чтобы сделать сертификаты новому пользователю вам достаточно иметь телефон с telegram-клиентом.

Для тех же, кому интересны технические детали реализации (помимо готового кода), в статье есть описание подходов, которые упрощают сопряжение систем в нескольких контейнерах. Раньше я "ходил более сложными тропами"...

Полезного чтения

+20

Gavr09 9 дек 2022 в 11:03

Технооптимизм. Разбираемся, как киберпреступники могут использовать машинное обучение

6 мин

3.1K

Информационная безопасность*Машинное обучение*Искусственный интеллект

Как правило, первое, с чем ассоциируется словосочетание «машинное обучение» (machine learning) — это цифровизация, наращивание темпов производства всего на свете, распознавание речи, умные помощники и прочее. Однако, как и у всех продвинутых технологий, у ML есть две стороны медали. С одной стороны, машинное обучение действительно позволяет (вкупе с развитием вычислительных технологий) шагнуть на новую ступень восприятия реальности. Но с другой стороны, применение этой технологии в информационных системах дает злоумышленникам дополнительный вектор атак, как показано ниже.

Как именно киберпреступники используют ML?

+13