Как стать автором
Обновить

В Apple разрабатывают способ запуска больших языковых моделей с использованием флеш-памяти мобильных устройств

Время на прочтение1 мин
Количество просмотров3K

Большие языковые модели очень требовательны к объёмам памяти и вычислительным ресурсам. Из-за этого их сложно локально запускать на мобильных устройствах. Инженеры Apple опубликовали исследование, в котором отмечают, что большие языковые модели эффективнее запускать с использованием флеш-памяти. Ожидается, что компания применит технологию для запуска собственной генеративной модели на iPhone.

В исследовании инженеры Apple рассказали, что использование флеш-памяти для запуска больших языковых моделей более выгодно на устройствах с ограниченным объёмом ресурсов. Также отмечается, что флеш-память в мобильных гаджетах используется заметно чаще. Вместе с этим исследователи вывели несколько правил, которые минимизируют лишние операции и помогают увеличить пропускную способность памяти:

  • модель не загружает каждый раз новые данные, а повторно использует уже обработанные ранее;

  • данные группируются таким образом, чтобы их можно было быстрее читать целыми фрагментами, ускоряя работу нейросети.

Согласно данным в исследовании, такой способ позволяет ИИ-моделям работать в 4–5 быстрее на CPU и в 20–25 раз на GPU. Это, по мнению экспертов, особенно полезно для запуска больших языковых моделей в условиях ограниченных ресурсов.

Известно, что Apple активно работает над собственной генеративной моделью под кодовым названием Ajax. Среди журналистов разработка получила название Apple GPT. Согласно некоторым данным, модель использует 200 млрд параметров. По оценкам это обеспечит высокий уровень понимания естественного языка. Пока нет информации о том, как Apple планирует использовать модель. Вероятно, что компания встроить её в голосового помощника Siri.

Теги:
Хабы:
Если эта публикация вас вдохновила и вы хотите поддержать автора — не стесняйтесь нажать на кнопку
Всего голосов 3: ↑2 и ↓1+3
Комментарии8

Другие новости

Истории

Работа

Swift разработчик
37 вакансий
Data Scientist
101 вакансия
iOS разработчик
27 вакансий

Ближайшие события

19 августа – 20 октября
RuCode.Финал. Чемпионат по алгоритмическому программированию и ИИ
МоскваНижний НовгородЕкатеринбургСтавропольНовосибрискКалининградПермьВладивостокЧитаКраснорскТомскИжевскПетрозаводскКазаньКурскТюменьВолгоградУфаМурманскБишкекСочиУльяновскСаратовИркутскДолгопрудныйОнлайн
24 – 25 октября
One Day Offer для AQA Engineer и Developers
Онлайн
25 октября
Конференция по росту продуктов EGC’24
МоскваОнлайн
26 октября
ProIT Network Fest
Санкт-Петербург
7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн
7 – 8 ноября
Конференция «Матемаркетинг»
МоскваОнлайн
15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань