Search
Write a publication
Pull to refresh
9
0
Марат Цконян @OrkBiotechnologist

Аналитик, техпис и немного биолог

Send message

Как AMD выкрутилась и научилась воспроизводить операции ядер CUDA на своих видеокартах. История ROCm

Level of difficultyMedium
Reading time8 min
Views49K

Как AMD смогла обойти монополию NVIDIA в мире ИИ? История о том, как команда AMD создала ROCm — технологию, позволяющую запускать CUDA-приложения на своих видеокартах. Как компании удалось совершить этот технологический прорыв? Разберём путь от первых экспериментов с HSA до современных версий ROCm, поддерживающих самые популярные фреймворки для машинного обучения. А главное — в конце расскажу, как установить ROCm на Windows и Linux, избежав всех подводных камней.
Читать дальше →

Квантизация позволяет запускать Llama 3.2 на мобилках

Reading time3 min
Views8.5K

Квантизация помогла портировать последнюю версию LLM Llama 3.2 на мобильные платформы - iOS и Android. Для этого разработчики выпустили квантованные версии Llama 3.2 1B и 3B, которые при тестах на ARM-процессорах показали высокую скорость инференса, по сравнению с несжатыми весами в формате BF16. 

Как вообще получилось, что Llama работает на мобильных процессорах, ведь для ее запуска нужен определенный программный стек, чаще всего библиотека Pytorch и CUDA на операционной системе Linux?

Дело в том, что Meta* (признана в России экстремистской организацией) используют ExecuTorch - это фреймворк, который является частью Pytorch-платформы и предназначен для запуска Pytorch-программ на мобильных девайсах. ExecuTorch поддерживается фреймворком Llama Stack для запуска моделей Llama, а именно легковесных Llama 3.2 1B и 3B, на iOS и Android. Для разработки мобильных приложений под эти платформы Llama Stack предоставляет клиентский SDK на Swift для iOS и Kotlin для Android, оба написаны под ExecuTorch бэкенд.

Какого именно уровня производительности удалось добиться новым квантованным моделям Llama?

В среднем это ускорение инференса от двух до четырех раз по сравнению с весами в формате BF16, при сохранении практически сопоставимого качества. Уменьшение размера модели на 56% - что важно для мобильного приложения, чтобы меньше места на телефоне занимало - и уменьшение объема потребляемой памяти на 41% процент. Все это согласно результатам бенчмарков, приведенных на сайте Llama.

Сразу стоит отметить важную деталь: речь идет не об обычной post-training квантизации, когда вы берете веса в FP16 и квантуете в GGUF или GPTQ. Хотя такие веса, безусловно, имеют практическое применение для множества задач, они страдают падением качества, это хорошо заметно на бенчмарках ниже. 

Читать далее

Записываем PNG без мам, пап и внешних библиотек

Reading time9 min
Views17K

Я решал очередную техническую задачу и столкнулся с проблемой: нужно сохранять изображения, а у меня нет сериализаторов и я не могу использовать готовые библиотеки. Ситуацию ухудшает, что из доступных форматов только PNG, JPEG и WebP. Выбор пал на PNG.

Формат изображения PNG известен с 1996 года, а на Хабре опубликовано несколько статей о декодировании этого формата. И ни одной — о кодировании. Я расскажу, как сохранить PNG своими руками на случай, если вам тоже придется это делать. Например, в академических целях.

Под катом вас ждет подробный разбор каждого байта на множестве иллюстраций.
Читать дальше →

Хватит называть контейнеризацию виртуализацией

Reading time5 min
Views22K

Привет, Хабр! Меня зовут Матвей Мочалов, я — компьютерный инженер и один из авторов корпоративного блога cdnnow! Как-то мы уже обсуждали особенности Docker на разных системах, а сегодня я хочу копнуть глубже — поговорить о том, как наша индустрия поймала саму себя в ловушку Джокера и умудрилась запутать всех, выдавая контейнеризацию за виртуализацию.

Продолжим об этом ниже в посте.

Читать далее

Мониторинг, который кричал «Волк»! Что мы придумали для корректного сбора метрик

Level of difficultyEasy
Reading time4 min
Views3.1K

Привет, Хабр! Меня зовут Станислав Савостин, в СберТехе я занимаюсь системой мониторинга «Маяк». Это наш внутренний сервис, который основан на Prometheus, но включает много доработок и «тюнинга» под наши условия и стандарты работы.

Основная задача мониторинга — быстро выявить проблему (до того, как что‑то упало) и отреагировать, чтобы пользователи не заметили. Из‑за высокого темпа уведомлений и реакций часто возникает риск пойти по неправильному сценарию. Например, перезагрузка брокера Kafka или Artemis занимает около 30 секунд, поэтому упустить такую ситуацию легко, хотя для нас это критически важная метрика. Ложная тревога или задержка передачи метрик — максимально неприятные события, так что мы постоянно дорабатываем систему и уже научились отслеживать перезагрузки сервисов.

Я расскажу, как мы дорабатывали мониторинг, как реагируем на действительно опасные ситуации и что помогает нам ловить дзен, когда все кричат: «Волк!»

Читать далее

Selectel School 2.0: как мы перезапустили курс для системных инженеров

Reading time5 min
Views4.2K

Все началось в конце декабря 2020 года. Тогда перед HR-департаментом поставили по-настоящему амбициозную задачу — нанять 50 сотрудников инженерно-технического отдела за три неполных месяца. Спойлер: у них получилось — да так, что в 2024 году вышло продолжение этой истории.

В статье мы расскажем, как запустили бесплатное обучение для инженеров дата-центров, какие выводы сделали по итогам первой итерации и каким стал Selectel School 2.0. Подробности под катом!
Читать дальше →

Linux On A Stick

Level of difficultyEasy
Reading time7 min
Views7.7K

Данная статья родилась в результате объединения идей из лабораторной работы в рамках подготовки для сдачи экзамена CCNA компании Cisco, и курса "Сетевые протоколы в Linux", который прочитал Георгий Владимирович Курячий весной 2024 года на кафедре Автоматизации Систем Вычислительных Комплексов МГУ им. М.В. Ломоносова.

Если сформулировать задачу одной фразой, то в схеме Router-On-A-Stick, заменить маршрутизатор (Router) на машину под управлением GNU/Linux. Данная задача по своей сути представляет модификацию лабораторной работы и скорее представляет академический интерес.

Читать далее

Рекрутеры — паразиты? Отказ на свою же должность в IT

Level of difficultyEasy
Reading time5 min
Views112K

Я провел эксперимент, в котором попросил айтишников попытаться устроиться на свою же должность в свою же компанию. Результаты можно посмотреть внутри, выявилась полная некомпетентность и лень рекрутеров. В текущем сломанном найме виноваты только они.

Читать далее

Как я перестал бояться и полюбил писать тексты, до которых никому нет дела

Level of difficultyEasy
Reading time3 min
Views3.8K

В честь Хэллоуина Хабр запустил челлендж, который призван помочь будущим авторам победить страх написать их первую статью. Я в челлендже не участвую, поскольку этот страх уже поборол, но решил поделиться своими мыслями о другом демотивирующем страхе, который беспокоил меня в начале моего пути работы с текстами — страхе, что мой текст никто не будет читать. Точнее даже не страхе, а чётком понимании. Но обо всём по порядку.

Читать далее

DIY-проекты на базе Raspberry Pi — что нового?

Reading time6 min
Views24K

Привет, Хабр! В мире DIY-проектов всегда есть место для творчества, особенно на Raspberry Pi. Энтузиасты и разработчики не перестают удивлять нас свежими идеями: от необычных игровых контроллеров до многофункциональных мини-компьютеров.

В подборке — последние новинки. Например, геймпад для ретро-игр из детской игрушки Paw Patrol, кибердек внушительного вида и камера с AI, которая обрабатывает снимки в режиме реального времени. Интересного много, так что прошу под кат.
Читать дальше →

CRISPR в генотерапии. История и право

Level of difficultyMedium
Reading time22 min
Views4.6K

CRISPR – это революционная технология генной инженерии, которая позволяет точно редактировать ДНК. Применение его в генотерапии может изменить жизнь миллионов людей с генетическими заболеваниями и миллиардов – с приобретенными. В этой статье я рассмотрю историю применения CRISPR в генотерапии, последние научные достижения и исследования, а также регуляторные и правовые аспекты, связанные с применением этой технологии.

А также выясним, от чего клиники генотерапии еще не начали открываться повсюду как стоматологии и какой потенциал есть у индустрии генотерапии в России.

Читать далее

Как базовые знания кодинга и нейросетей сэкономили нам больше 15 млн ₽ на Wildberries [скрины]

Level of difficultyEasy
Reading time4 min
Views15K

Это не о том, как генерировать изображения для маркетплейсов в Midjourney. Таких статей уже более чем достаточно. Хочу рассказать, как нам удалось полностью автоматизировать работу с карточками благодаря нейросетям, «Фотошопу», базовым навыкам программирования и липкой ленты. А товаров у нас… 10 000❗️ Скажу больше — каждые 5 кликов золотой антилопой мышью экономят нам в среднем 1500 ₽.

P.S. Ничего рекламировать не буду, поэтому ссылок на нашу витрину WB не даю. А вот скрины из личного кабинета — будут 🙃

Хаха 😆 Читаю дальше 👉🏻

Учимся делать игры без pygame: Введение в графический интерфейс на Python

Level of difficultyEasy
Reading time2 min
Views12K

Привет, Хабр! Сегодня мы научимся делать графический интерфейс на python, используя Tkinter. Эта статья очень короткая, так как мы только начинаем.

Tkinter — это стандартная библиотека для создания графических интерфейсов в Python. Она предоставляет простой и удобный способ создания оконных приложений с использованием виджетов, таких как кнопки, метки, поля ввода и многое другое. В этой статье мы рассмотрим основные концепции Tkinter и создадим простое приложение.

Читать далее

«Дикий робот»: почти как «Стальной гигант», но в дикой природе и с вайбом импрессионизма

Reading time5 min
Views3.1K

Привет, Хабр! Это Даша Фролова из команды спецпроектов в МТС Диджитал. На прошлых выходных мы с детьми устали читать книги о космосе и стали думать, чего бы такого новенького и интересного посмотреть всей семьей. И тут я вспомнила, что на днях мне попался трейлер нового анимационного фильма «Дикий робот». В повестке — технологии, режиссер — Крис Сандерс, «Как приручить дракона» — как раз его творение. Так что думать долго не стали и уселись за экран. Понравилось — и, судя по всему, не мне одной: теперь этот анимационный фильм — один из главных претендентов на «Оскар-2025». Чем он цепляет, расскажу под катом. Впереди — выходные и четырехдневная рабочая неделя, так что сохраняйте вариант для досуга, а потом делитесь в комментах, как оно вам.

Читать далее

Настраиваем работу конвейера CI/CD (почти) без рук. Опыт использования Orchestra R в энтерпрайзе

Level of difficultyMedium
Reading time10 min
Views2.5K

Компании, что используют Jenkins в качестве CI/CD‑инструмента, обычно делают несколько экземпляров, если в разработке участвует множество команд или приходится работать с большим количеством проектов. При этом оркестрация Jenkins»ов в командах — не самая простая работа, а во многом ещё и рутинная. С одной стороны, сложно соблюдать все требования сборки и тестирования и вовремя находить согласующих. С другой, одним скриптом невозможно решить всю задачу от получения доступов до вывода релизов в эксплуатацию.

Есть правило, что если система становится слишком сложной, то люди чаще ищут способы обойти алгоритмы, а не следовать им. Чтобы не усложнять систему, а разложить всё по ролям и этапам, мы пришли к созданию собственного инструмента — Orchestra R. С его помощью мы хотели не только автоматизировать работу конвейера CI/CD, но и упростить жизнь всех DevOps‑инженеров. В этом материале поделимся особенностями работы инструмента и опытом эксплуатации в СберТехе.

Читать далее

Немного про UEFI и GRUB

Level of difficultyHard
Reading time8 min
Views33K

В данной статье пойдёт речь об особенностях UEFI на примере переноса Debian Stretch с MBR на UEFI. Опишу так же разницу между MBR и UEFI, так как я её воспринимаю.

Кроме общей части, ключевая часть статьи про формирование GRUB EFI файла grubx64.efi во время grub-install и про то, что этот файл не так прост, как кажется на первый взгляд.

Читать далее

Умножение матриц и SMT – почему бы и нет?

Level of difficultyMedium
Reading time16 min
Views4K

Привет, Хабр! Меня зовут Евгений Буевич, я работаю в Рунити. Как-то раз у меня возникла непреодолимая потребность умножать матрицы определенного размера, смотреть, что получится и умножать опять до тех пор, пока что-нибудь не получится.

Остановился на BLIS, скомпилировал, подключил, и было мне счастье. Матрицы стали подрастать в числе и размере, скорость процесса, как ей и положено, падала в кубе от размера и кратно от числа. В конце концов стало ощущаться, что на ЦПУ 486,4 GFLOPS и ни флопсом больше, а замеры показывали, что на самом деле их около 350.

Читать далее

Краткий свод концепций Tensor Flow

Level of difficultyMedium
Reading time21 min
Views12K

TensorFlow — один из самых мощных и популярных фреймворков для машинного обучения, разработанный компанией Google Brain в 2015 году. 

Пока старички-студенты активно практикуются в самых сложных задачах машинного обучения, новички еще практикуются с освоением практики обучения на TF.

Поэтому мы подготовили гайд с основными концептами этого незаменимого для ML-инженера фреймворка.

Читать далее

Как я занял первое место в AI Journey Contest 2023 (трек Personal AI)

Level of difficultyMedium
Reading time7 min
Views1.9K

Несколько дней назад завершился AI Journey Contest — ежегодное соревнование по машинному обучению от Сбера. В этой статье я расскажу о своем опыте участия в этом соревновании в прошлом году, его особенностях, а также подробно разберу решение, которое привело меня к победе.

Читать далее

Как мы нарушили все гайдлайны Kubernetes, чтобы описывать инфраструктуру в разы быстрее

Reading time16 min
Views10K

Привет, меня зовут Всеволод, я разработчик в Yandex Infrastructure — команде, которая создаёт платформу для разработчиков Яндекса. Последние 12 лет я занимаюсь внутренним облаком и за это время писал самые разные его компоненты: от базовой инфраструктуры хостов и до Control Plane.

Сегодня расскажу про то, как мы организуем для наших пользователей единое управление всей инфраструктурой и как добились на этом пути надёжности, скорости разработки, простоты поддержки и масштабируемости — хоть и нарушили при этом некоторые руководства и лучшие практики Kubernetes.

Читать далее

Information

Rating
7,052-nd
Location
Alicante/Alacant, Испания
Works in
Date of birth
Registered
Activity

Specialization

Business Analyst, Technical Writer
Middle
Python
C++
Linux
English
Docker
Journalism
Technical director
Interview
Support projects
CIO