Articles / Bookmarks / Profile of Quarc / Habr

@Quarc

User

ProfileArticlesPostsNewsComments455

dimanosov007 Dec 1 2022 at 08:16

Сравнение производительности моделей обнаружения объектов YOLO v5, v6 и v7

11 min

12K

Python*Data Mining*Machine learning*Artificial Intelligence

Translation

Если вы выполняете проект по обнаружению объектов, высока вероятность того, что вы выберете одну из многих моделей YOLO. Учитывая количество моделей обнаружения объектов YOLO, сделать выбор в пользу лучшей из них непросто.

ret77876 Jun 19 2024 at 10:22

Анализ производительности моделей YOLOv8

Hard

21 min

8.7K

Python*Machine learning*Artificial IntelligenceRobotics

Analytics

В данной статье речь пойдёт о замерах производительности и точности работы моделей YOLOv8 на разных устройствах с различными оптимизациями и без них. Большое внимание будет уделено работе Yolo на “слабых устройствах”, таких как Raspberry PI, Orange PI, Jetson Nano, мини ПК.

Современные задачи робототехники требуют вычислений "на борту", что особенно актуально для автономных систем. Важность данного исследования заключается в том, что оно направлено на решение задачи детекции в режиме реального времени на маломощных устройствах, что открывает новые возможности для использования компьютерного зрения в мобильных и автономных роботах. Будем считать, что FPS обработки изображений >= 10 пригоден для некоторых задач детекции в реальном времени, но далеко не для всех.

Читать подробнее

snakers4 Aug 20 2024 at 16:44

Особенности фонетики якутского языка для синтеза речи

Medium

6 min

7.1K

Voice user interfaces*Natural Language Processing*Learning languagesArtificial IntelligenceMachine learning*

Case

Недавно мы закончили проект по синтезу якутского языка. Хотя наши договорённости не позволяют выложить нам модели в общий доступ, какими-то соображениями на тему того, как можно делать синтез якутского языка мы поделиться можем.

Под ~~котом~~ катом вы узнаете:

Как звучит синтез на якутском языке;
Чем отличается якутский алфавит от русского и какие "дополнительные" звуки там есть;
Как работать с ударениями на якутском языке, с учетом полного отсутствия каких-либо корпусов или словарей;
И, в качестве бонуса, как якутский синтез речи говорит на русском с якутским акцентом;

+45

tataranovich Aug 19 2024 at 09:27

Как подключить мультиметр к компьютеру

Medium

5 min

18K

Open source*Programming microcontrollers*Manufacture and development of electronics*DIYElectronics for beginners

Периодически возникает задача снимать показания мультиметра через определённые интервалы времени и записывать их в файл. Например график напряжения при разряде или заряде аккумулятора. Вообще для этого есть мультиметры с функцией регистрации данных, но ни один, из имеющихся у меня, не обладает таким функционалом.

В бюджетных мультиметрах ZT102 и ZT301, которые построены на чипе DTM0660, можно реализовать подключение к компьютеру, но для этого придётся редактировать EEPROM и вносить изменения на печатную плату. Это несложно и Kerry Wong описывал как это сделать на примере мультиметра ennoLogic eM860T.

В тоже время у моего настольного мультиметра Agilent U3402A на задней панели уже есть порт RS232, но на нём указано "используется только для калибровки". Аналогичное предупреждение есть и в инструкции пользователя на русском и английских языках.

+55

izard Jul 25 2024 at 20:30

Ускорение генерации токена LLM в два раза для больших контекстов

Medium

3 min

3.5K

Programming*Artificial IntelligenceHigh performance*GPGPU*

Case

Помимо ChatGPT и многочисленных конкурентов в облаке с веб-мордами и/или API, существует огромная экосистема для запуска LLM на собственном железе. На Huggingface на любой бюджет найдется модель для скачивания, которая влезет в видеопамять (или в RAM, можно и на CPU запускать, если пользователь терпеливый). Вчера здесь на Хабре была очень неплохая обзорная статья.

Самые популярные open source тулы для локального запуска LLM — llama.cpp и vllm (и их многочисленные обертки). У них немного разные ниши, и дальше я буду писать о llama.cpp. Она поддерживает все возможные комбинации железа и ОС — Linux, MacOS, Windows; x86 CPU, Arm, Apple Silicon CPU & GPU, Nvidia, AMD,… Но автор и мейнтейнер — Георгий Герганов использует для разработки Mac Studio. Почему такой выбор железа?

Производительность генерации каждого токена LLM в одном потоке ограничена вычислительной мощностью в процессе построения KV-кэша (анализ промпта до генерации первого токена), и пропускной способностью памяти при генерации последующих токенов. При этом в обоих случаях очень полезно уметь быстро загружать веса из видеопамяти в ALU видеокарты (или CPU).

Читать дальше →

+17

belch84 Jul 25 2024 at 12:24

Задача трёх тел (не китайская нефантастика)

Medium

21 min

52K

Mathematics*Data visualization*AstronauticsPhysics

Case

Однажды, выполнив в Гугле запрос "Three body problem" ("Задача трёх тел"), я был просто поражен - первая страница результатов состояла только из ссылок на роман китайского писателя-фантаста Лю Цысиня с соответствующим названием, а также на телесериал, снятый по этому роману, т.е. ссылок на собственно задачу трёх тел не было вообще! Мне это показалось удивительным и несправедливым, поскольку сама по себе задача трёх тел тоже может выглядеть увлекательной в популярном изложении. В этой публикации я постарался привести некоторые доказательства этого утверждения.

+234

150

PatientZero Jul 17 2024 at 20:39

Насколько быстр Javascript? Симулируем 20 миллионов частиц

Easy

23 min

25K

JavaScript*Client optimization*Game development*

Tutorial

Translation

Я бросил себе вызов: симулировать 1000000 (миллион) частиц на чистом Javascript на телефоне, используя только CPU и добившись 60 FPS.

Поехали.

Задача не особо сложна, если выполнять всю работу на GPU, но правило гласит, что нужно пользоваться только CPU, при этом работая на JS, так что никакого WASM.

+133

Booka_Ltd Sep 14 2021 at 06:00

HTTP/3 от А до Я: основные концепции. Часть 1

20 min

96K

Слёрм corporate blogDevOps*High performance*Website development*Server Administration*

Translation

Фото Florencia Viadana, Unsplash.com

После почти пятилетних разработок протокол HTTP/3 наконец приближается к окончательному выпуску. Предыдущие итерации уже доступны как экспериментальная функция, но в 2021 году мы ждём широкого распространения протокола. Что такое HTTP/3? Зачем выпускать его так рано после HTTP/2? Как его можно или нужно использовать? Как он влияет на производительность?

Читать дальше →

+95

apoluekt Jun 17 2021 at 23:05

OpenRPNCalc: делаем бескомпромиссный калькулятор

12 min

24K

RUVDS.com corporate blogProgramming microcontrollers*3D printersDIYElectronics for beginners

Вообще-то в блогах я обычно выступаю в роли фриковатого научного сотрудника, занудным голосом вещающего про какое-нибудь измерение параметров Стандартной Модели. Но сейчас я попробую совсем другой жанр. Короче говоря, в один прекрасный день я понял, что мне не хватает «железного» научного калькулятора. Пришлось делать самому.

Но зачем?

+145

117

ZhksB Sep 4 2023 at 11:00

Собираем и запускаем калькулятор из Windows XP в среде Windows 10 c помощью GCC x64

Hard

63 min

13K

C++*C*Development for Windows*

Tutorial

Привет всем.

В данной статье мы немного проанализируем код Windows XP, a также соберем калькулятор c использованием GCC x64 в среде Windows 10. Будут показаны ошибки, с которыми я столкнулся в процессе сборки и подробно расписаны способы их решения. В конце будет продемонстрирован рабочий билд приложения calc.exe.

Всем приятного прочтения!

+95

snakers4 Jun 27 2024 at 20:51

Наш публичный детектор голоса стал быстрее в 3 раза (*), качественнее, устойчивее и теперь работает на 6 000 языках

Easy

1 min

4.5K

Python*Open source*Voice user interfaces*Artificial IntelligenceMachine learning*

Review

Мы уже рассказывали про наш детектор голоса на Хабре тут, тут и тут. Кратко опишу, что стало лучше в этот раз:

Поддержка 6 000+ языков;

Общий рост качества на 5-7%;

Существенно повышена устойчивость на шумных данных;

TorchScript (*) стал в 3 раза быстрее, а ONNX - на 10% (теперь они примерно равны по скорости, обработка 1 кусочка аудио занимает 325 и 189 μs соответственно);

+24

piton_nsk Jun 25 2024 at 05:56

Анимация доски Гальтона на Python и manim

9 min

5.1K

Python*Computer Animation*Working with video*

Многие видели математические видео с канала 3blue1brown. Оригинальный стиль, отличные визуализации самых разных математических понятий. Как они были сделаны? Грант Сандерсон, автор канала 3blue1brown, написал специальную библиотеку на питоне, manim, для создания своих видео. Библиотека оказалась популярной, был сделан форк и сложилось сообщество для ее дальнейшего развития. Мне стало интересно и я захотел научиться делать похожие видео, для примера будет анимация доски Гальтона. Математика присутствует, анимация интересная, что из этого вышло - написано в статье.

+16

Ermak_Marina Jun 19 2024 at 13:28

SARIMAX vs Экспоненциальное сглаживание: Когда простота побеждает

10 min

7.1K

Python*Algorithms*Mathematics*Machine learning*Statistics in IT

Review

Продолжаю рассказывать про первые шаги в моделировании временных рядов. В этой статье разбираю модели SARIMAX и Экспоненциальное сглаживание, с примерами картинок и кода.

+13

alec_kalinin Jul 1 2015 at 09:04

Краткое введение в тензоры

3 min

174K

Mathematics*

В заметке Магия тензорной алгебры было дано очень неплохое введение в математику тензоров. Но, как мне кажется, этот текст все-равно несколько сложен для понимания. В нем не до конца понятно, что же это такое тензор и зачем он вообще нужен.

Сейчас я попытаюсь дать совсем простое введение в тензоры. Я не претендую на математическую строгость, поэтому некоторые термины могут употребляться не совсем корректно.

Читать дальше →

+29

Ermak_Marina Jun 12 2024 at 08:26

Временные ряды и ARIMA: Как предсказывать будущее без хрустального шара

Easy

4 min

16K

Python*

From sandbox

Что такое временной ряд, модель ARIMA и как к ней подбирать параметры.

Простым словами, временной ряд — это просто последовательность событий, которая как-то зависит от времени. Мы для начала будем считать, что ряд самый простецкий и нас просто есть скачущие туда-сюда точки, которые распределены по временной шкале.

dfreev Jun 12 2024 at 16:35

Ковариантность и контравариантность в тензорном исчислении

Medium

57 min

15K

Mathematics*Physics

Записки «чайника», травмированного тензорным исчислением

Тема, заявленная в названии, пожалуй, самая запутанная в тензорном исчислении. Высокоучёные авторы мудрых книг в большинстве случаев ограничиваются только формальными определениями понятий ко- и контравариантности, не опускаясь до подробного пояснения их геометрической и физической сути. Похоже, в этом вопросе они сознательно или бессознательно воспроизводят ситуацию, характерную для квантовой физики: «Не старайтесь понять, просто считайте!». Но если в квантовой физике подобный подход безальтернативен, то в данном случае – вряд ли.

Подзаголовок даже комплиментарен для меня, поскольку в своём восприятии математики я даже не «чайник», а, скорее, «валенок». По этой причине мне очень хорошо понятны проблемы «чайников», с которыми они сталкиваются в попытках постичь математические абстракции. Поэтому материал предназначен не для «продвинутых», они и без меня разберутся, а для… В общем, для таких же, как я, «задвинутых» в математике (только в ней!). При этом предполагается хотя бы «шапочное» знакомство с тензорным исчислением.

Математика остаётся непонятной для многих потому, что нам её объясняют люди, которые понимают её на интуитивном уровне, или, выражаясь более изящно, «на уровне интуитивных образов» [1-7 ≡ Л.1, с. 7]. Нам же, нематематикам, для того, чтобы что-то понять, надо это «что-то» увидеть не в абстрактном («интуитивном»), а в реальном, физически представимом пространстве (по-научному это – «визуализация») или, ещё лучше, поковырять его пальцем (научный термин пока еще не придумали. Открыт приём предложений).

+63

vaiti_media Jun 11 2024 at 17:12

Собираем компьютер для работы с большими языковыми моделями

9 min

24K

beeline cloud corporate blogMachine learning*Computer hardwareVideo cards

Opinion

Привет, Хабр! Меня зовут Артем Чебыкин, я ML-инженер и автор медиа вАЙТИ. В этой статье я расскажу о том, какой тип компьютера: стационарный, ноутбук или макбук — больше всего подходит для машинного обучения и почему. Также рассмотрим начальный и продвинутый вариант сборки для машинного обучения больших языковых моделей (LLM).

+12

Aliaksei_Rudak Jun 12 2024 at 06:19

Большое тестирование видеокарт для машинного обучения

Easy

8 min

12K

Machine learning*Cloud computing*Computer hardwareVideo cardsArtificial Intelligence

Analytics

Всем привет! Меня зовут Алексей Рудак и я основатель компании Lingvanex, которая занимается решениями в области машинного перевода и транскрипции речи. Для нашей работы мы постоянно тренируем языковые модели. Наша команда использует десятки разных видеокарт, выбранных под разные задачи: где-то нужна мощная станция DGX, а где-то достаточно старой игровой карты типа RTX 2080Ti. Выбор оптимальной конфигурации GPU сэкономит вам не только время на тренировку, но и деньги.

Интересно то, что в интернете довольно мало статей с тестами GPU именно для скорости тренировки языковых моделей. В основном встречаются только тесты inference. Когда вышел новый чип H100, в отчете NVidia было указано, что при тренировке он быстрее A100 до девяти раз, но для наших задач новая карта оказалась всего на 90% быстрее старой. Для сравнения: у наших облачных провайдеров разница в цене между этими GPU составляла 2 раза, поэтому переходить на новый H100 для экономии денег смысла не было.

В дополнение к этому мы брали на тест станцию DGX, которая состоит из 8 видеокарт A100 80GB и стоит 10 тысяч долларов в месяц. После теста стало ясно что соотношение цена / производительность этой станции нас полностью не устраивает и за эти деньги мы можем взять 66 x RTX 3090, которые в сумме принесут гораздо больше пользы.

Наши языковые модели для перевода имеют до 500 миллионов параметров (в среднем от 100 млн до 300 млн). Возможно, если значительно увеличить кол-во параметров, то соотношение цена / производительность от DGX станет лучше. На данный момент мы не тренируем большие языковые модели, которые могут переводить сразу между всеми языками во всех вариациях, а применяем отдельные языковые модели под каждую языковую пару, например англо-немецкую. Каждая из таких моделей занимает от 120 до 300 Mb.

mr-pickles Jun 10 2024 at 12:33

Простые способы ускорения обучения PyTorch-моделей

Medium

13 min

9.3K

Wunder Fund corporate blogArtificial IntelligenceMachine learning*Algorithms*Python*

Tutorial

Translation

Не знаю — нужно ли вступление к статье, посвящённой ускорению машинного обучения (Machine Learning, ML)?

Ускорение обучения моделей — это именно то, в чём нуждаются все ML‑инженеры. Более быстрое обучение модели означает ускорение экспериментов, что, в свою очередь, ведёт к ускорению выпуска новых версий программных продуктов. Кроме того — чем выше скорость обучения — тем меньше ресурсов нужно на каждую итерацию обучения модели. Поэтому предлагаю перейти сразу к делу.

+25

Kosenkov77 Jun 6 2024 at 01:57

Установка MS SQL Server на Linux

Easy

8 min

23K

Microsoft SQL Server*Configuring Linux*SQL*

From sandbox

В этой статье я научу вас устанавливать Microsoft SQL Server 2022 на Linux и мы развернем тестовую базу данных от Microsoft в операционной системе Linux.

Мы будем использовать пакетным менеджером Yum для Linux дистрибутивов: RedHat (RHEL), CentOS, Scientific Linux и DPKG (Debian Package) – система управления пакетами в Debian и дистрибутивах на его основе, например Ubuntu и набирающем популярность Astra Linux, в связи с импортозамещением. Поэтому команды я приведу для обоих пакетных менеджеров. Так же рассмотрим универсальный способ запуска через Docker.

Microsoft SQL Server — система управления реляционными базами данных (СУБД), разработанная корпорацией Microsoft. Основной используемый язык запросов (диалект SQL) — Transact-SQL (T-SQL).

Для взаимодействия с СУБД MS SQL Server используются 2 основных способа:
1. Служебная программа sqlcmd
2. Microsoft SQL Server Management Studio (SSMS)

Конечно вы можете использовать привычный для вас DBeaver или DataGrip или любой другой инструмент администрирования базы данных.

+14

1 2 3

5 6 ...

53 54

Сравнение производительности моделей обнаружения объектов YOLO v5, v6 и v7

Анализ производительности моделей YOLOv8

Особенности фонетики якутского языка для синтеза речи

Как подключить мультиметр к компьютеру

Ускорение генерации токена LLM в два раза для больших контекстов

Задача трёх тел (не китайская нефантастика)

Насколько быстр Javascript? Симулируем 20 миллионов частиц

HTTP/3 от А до Я: основные концепции. Часть 1

OpenRPNCalc: делаем бескомпромиссный калькулятор

Собираем и запускаем калькулятор из Windows XP в среде Windows 10 c помощью GCC x64

Наш публичный детектор голоса стал быстрее в 3 раза (*), качественнее, устойчивее и теперь работает на 6 000 языках

Анимация доски Гальтона на Python и manim

SARIMAX vs Экспоненциальное сглаживание: Когда простота побеждает

Краткое введение в тензоры

Временные ряды и ARIMA: Как предсказывать будущее без хрустального шара

Ковариантность и контравариантность в тензорном исчислении

Собираем компьютер для работы с большими языковыми моделями

Большое тестирование видеокарт для машинного обучения

Простые способы ускорения обучения PyTorch-моделей

Установка MS SQL Server на Linux

Information

Specialization