Comments / Profile of EasyLy / Habr

Павел Локтев@EasyLy

TinyML, исполнение нейросетей на микроконтроллерах

342

Subscribers

ProfileArticles135PostsNews1Comments437

Гайд от диагноза «Как выйти на Ozon» до роли эксперта в кабинетах «Озон Селлер»

EasyLy Aug 4 2025 at 09:22

Тоже думал, что это происходит при обновлении содержимого карточки автоматом..

Рассматриваем циклы процессора в контроллере CH32x035

EasyLy Jul 24 2025 at 20:05

Мне было лень в текстовом виде делать, так что я видео на эту тему отснял (да и эмоции передать можно только через видео). Правда, с тех пор с github удалили английскую документацию, но говорят, что зная дату съёмки видео, можно узнать, какая версия на нём тогда лежала, а зная версию - можно и найти файлы якобы удалённые. Если что - найдём, как переслать два PDFа.

Всё собрано в этом плейлисте (я тренировался, чтобы студентам про этот проц рассказывать) https://www.youtube.com/watch?v=Ny5z1lfVVm4&list=PLcXpxQEvs8cMKvvf24F94gnU0Mps0D_3k

Понимающий робот: голосовой интерфейс на ESP32 и OpenAI

EasyLy May 20 2025 at 10:24

Классная штука! Уже видел вашу разработку в комментариях к каким-то статьям. Отличие решения с OpenAI в том, что "большая" нейросетка поймет как четкую команду "Включи свет", так и размытую формулировку, например включить свет по запросу "Стало темно" или "Не вижу ничего". В конкретном решении для велосипеда - это избыточно конечно, но в других кейсах может пригодиться.

Понимающий робот: голосовой интерфейс на ESP32 и OpenAI

EasyLy May 20 2025 at 06:22

Спасибо большое! Поправил

Понимающий робот: голосовой интерфейс на ESP32 и OpenAI

EasyLy May 19 2025 at 10:35

В каком-то смысле - да, по нашей просьбе управляет OpenAI. Т.е. "переводит" команду, которую мы озвучиваем естественным языком, в команду "понятную" конкретному изделию (роботу, лампочке, кондиционеру и т.п.). Наверное можно представить себе ситуацию, что вместо команды "вперед" намеренно пришлёт команду "назад". Для игрушки - нестрашно, для управления критическими системами - не нужно этот подход использовать.

А по второму вопросу - он очень интересный. Есть несколько решений с работой нейросетей на микроконтроллере для распознавания речи, в том числе и мы делаем. Но там ограничения по числу команд - обработка естественного языка просто не поместиться. Поэтому приходится выбирать.

Понимающий робот: голосовой интерфейс на ESP32 и OpenAI

EasyLy May 19 2025 at 10:30

Интересно, странно, что не видел до этого. А какие там требования к железу? Боюсь, что для микроконтроллеров не пойдет...

Понимающий робот: голосовой интерфейс на ESP32 и OpenAI

EasyLy May 19 2025 at 10:27

В текущей версии реализовал отправку команды по кнопочке - т.е. нужно размьютить микрофон, сказать команду, замьютить.
Но вообще да, согласен - те же смартфоны, Алиса в каждой комнате, которая слушает на постоянной основе - это всё уже с нами (со многими по крайней мере).

Анализируем протокол управления блоком питания Fnirsi DPS 150

EasyLy Jan 29 2025 at 07:20

Давайте я угадаю, что статью Вы читали по диагонали. Иначе бы увидели фразу

Детализация протокола будет произведена в следующей части статьи.

А так... Это статья, а не репозиторий на Гитхаб. Я рад, что она помогла Вам сделать свою программу. Хоть и задумываюсь, а надо ли делиться результатами находок, когда вместо благодарности ещё и недовольства высказываются.

Ода структурам на примере работы с блоком питания Fnirsi DPS 150

EasyLy Jan 29 2025 at 07:16

Где разбор кодов ответа?

Давайте я угадаю, что Вы читали статью по диагонали. Потому что там дословно сказано:

Всё работает! Но статья снова получилась огромной, поэтому дописывать код для передачи данных и делать анализатор ответов мы будем уже в следующей части. Если, конечно, интерес к теме ещё не угаснет.

Мне он на F1-A1-FF-01-00-00 такую партянку выдает, что я даже не знаю что там что

Давайте я угадаю, что статьи по ссылкам Вы тоже читали по диагонали. Иначе во второй статье нашли бы раздел Все данные из устройства одновременно. Там проведён разбор этой команды.

Ода структурам на примере работы с блоком питания Fnirsi DPS 150

EasyLy Jan 24 2025 at 23:15

И кстати, о чтении по диагонали из-за объёма... А Вы точно видели эту фразу?

Также стоит помнить, что у нас длина готовой структуры будет не кратна 32 битам, так что стоит установить упаковку данных с точностью до байта, чтобы не происходило автоматических выравниваний.

Так что тема-то затронута. Ровно настолько, насколько это нужно для статьи.

Ода структурам на примере работы с блоком питания Fnirsi DPS 150

EasyLy Jan 24 2025 at 22:19

Статья и так огромная. Про выравнивание же надо отдельную статью делать, тут парой абзацев не обойтись. Мои статьи и так по диагонали многие читают из-за объёма (что подтверждается комментариями к предыдущим нескольким текстам). Так что уминаю материал, как могу.

Здесь мы считаем, что про структуры все всё знают. Что поля для работы с железом спроектированы кем-то так, что выравнивание точно сработает. Мы просто хотим с этим железом начать работу. И я показал, как это делать эффективнее, даже на Питоне.

Кое-что про выравнивание я рассказываю тут https://dzen.ru/video/watch/6754880c482719149667f86c?collection=author%3Ac5409e49-c49c-4110-9806-7549a80fa046&order=reverse

А теперь представим, что всё это помещено в данную статью... Нет, её точно мало кто до конца тогда прочтёт...

И таки да. Вот такая интересная тема тоже в статье не поднимается по той же причине (это статья,, а не толстый учебник, у статьи есть конкретная тема). https://www.youtube.com/watch?v=ANrFEu9IatQ&list=PLcXpxQEvs8cPCuSy7hliyFXI1l829u7RZ&index=28

Рассматриваем циклы процессора в контроллере CH32x035

EasyLy Jan 17 2025 at 21:10

Ага, нашёл детали про этот стек. Вот описание бита HWSTKOVEN:

Note: HPE depth is 3. When the configuration nesting level is greater than 3, if the bit is set to 1, the low priority three interrupts need to be configured as HPE and the high priority as SPE.

Судя по всему, там не автоматика перейдёт на другой метод сохранения, а надо на аппаратный режим только три самых высокоприоритетных уровня посадить. Либо сбросить HWSTKOVEN. Тогда прерывания будут заблокированы, пока место в стеке не появится.

Мне проще. У моего процессора глубина стека два, и уровней приоритетов - тоже два.

Вот чего не могу найти - как они с порчей mepc борются при входе во вложенное прерывание. На рисунке он не сохраняется в аппаратном стеке. И про штатную идею "При входе в обработчик, новые прерывания запрещены, сначала сохраните mepc и mstatus, а уже потом разрешайте прерывания" у них написано:

MIE is the global interrupt enable bit, and when entering the exception or interrupt, the value of MPIE is updated to the value of MIE, and it should be noted that in the QingKe V4 series microprocessors, MIE will not be updated to 0 before the last level of nested interrupts to ensure that the interrupt nesting in machine mode continues to be executed.

Что-то тут не так, но что? Надеюсь, рисунок. Как доберусь до железа - проверю.

Рассматриваем циклы процессора в контроллере CH32x035

EasyLy Jan 16 2025 at 14:38

Я так понял, эта парочка как раз связана между собой. Но они используются для того, чтобы четыре вектора можно было вызывать вообще не обращаясь к ОЗУ (не тратя такты на чтение).

А тот самый знаменитый стек для сохранения регистров, к ним никак не привязан. Он работает и для тех, кто через неё вызван, и для обычных. Мой тест показал, что для тех, кто вызван через основную таблицу, стек работает.

Всё это не противоречит рисунку из раздела Vector Table Free (VTF) . Эта парочка - просто ещё один элемент ускорения.

Рассматриваем циклы процессора в контроллере CH32x035

EasyLy Jan 16 2025 at 10:56

а V3, V4 - куда-то в недра, такое ощущение что вообще без возможности ручного доступа.

Для V4 они обещают сохранять 3 элемента именно в секретные недра, но зато за один такт все регистры. Когда эти недра будут переполнены - четвёртое сохранение уже пойдёт в ОЗУ. Будет ли пятое - они не говорят. Припрёт - буду проверять. Для учебных целей и одного достаточно :-).

Рассматриваем циклы процессора в контроллере CH32x035

EasyLy Jan 16 2025 at 10:51

Кстати, я проверил. Один там аппаратный стек у ch32. Это есть ещё вектора, которые можно брать, не тратя такты на память. А стек - он ко всему FPIC относится. И у одного стека три элемента. При переполнении, сохранение начнёт идти в ОЗУ, то есть, медленнее.

Методика проверки:

Заводим обработчик прерывания:

void SysTick_Handler(void) __attribute__((interrupt("WCH-Interrupt-fast")));
volatile uint32_t tickCnt = 0;
void SysTick_Handler(void)
{
    SysTick->SR = 0;
    tickCnt += 1;
}

Инициализацию копируем штатную, никаких спецвекторов, всё через общую таблицу:

void SYSTICK_Init_Config(u64 ticks)
{
    SysTick->SR = 0;
    SysTick->CNT = 0;
    SysTick->CMP = ticks;
    SysTick->CTLR =0xF;

    NVIC_SetPriority(SysTicK_IRQn, 15);
    NVIC_EnableIRQ(SysTicK_IRQn);
}

Ну, и в функцию main() вставляем:

    SYSTICK_Init_Config(SystemCoreClock/1000-1);

    while(1)
    {
        __NOP();
    }

Смотрим, во что превратился обработчик прерываний:

0000067c <SysTick_Handler>:
     67c:	e000f7b7          	lui	a5,0xe000f
     680:	0007a223          	sw	zero,4(a5) # e000f004 <_eusrstack+0xc000a004>
     684:	82818793          	addi	a5,gp,-2008 # 200000a8 <_edata>
     688:	4398                	lw	a4,0(a5)
     68a:	0705                	addi	a4,a4,1
     68c:	c398                	sw	a4,0(a5)
     68e:	30200073          	mret

Запускаем. Периодически ставим точку останова на nop. Убеждаемся, что tickCnt увеличивается, а регистр a5 не изменяется. Ради интереса я во время одной из остановок туда вообще 0x12345678 вписал. И он таким и остался. Значит, при входе в обработчик прерывания через общую таблицу, всё сохраняется в спецстеке. Что соответствует рисунку из описания ядра, просто хотелось в этом убедиться.

Рассматриваем циклы процессора в контроллере CH32x035

EasyLy Jan 16 2025 at 10:12

Я про Амур. Что в CH32 всё есть - это даже не обсуждается. В ветке шла речь про то, что АМУРа с его невекторизированными прерываниями любой китаец уделает.

Есть ли соответствующий функционал в Амуре? Учитывая вот этот текст из документации:

4) встроенный интегрированный программируемый контроллер прерываний отключен;

и полное отсутствие слова cause как в документе, так и в исходниках HAL

Но как это делается в правильных системах - спасибо за информацию. Намотал на ус. Правда, решение от ch32 с их аппаратным стеком, переходящим при острой необходимости в аппаратное сохранение в ОЗУ - ещё правильнее для контроллеров.

Рассматриваем циклы процессора в контроллере CH32x035

EasyLy Jan 16 2025 at 08:50

О да, на целых полтора такта больше (ручной переход по таблице по номеру из mcause.

А он там есть? Из документации не ясно, исходники HAL я скачал, по слову cause в них ничего не ищется. И в документации сказано, что контроллер прерываний отключён.

Не то, чтобы я утверждаю, что его нет... Просто искал - не нашёл. Зато нашёл вот такое... О чём я и говорил... Причём когда говорил - я не знал, что оно найдётся

    #define EPIC_CHECK_TIMER32_0()             (EPIC->RAW_STATUS & (1 << EPIC_TIMER32_0_INDEX))                     
    #define EPIC_CHECK_UART_0()                (EPIC->RAW_STATUS & (1 << EPIC_UART_0_INDEX))                
    #define EPIC_CHECK_UART_1()                (EPIC->RAW_STATUS & (1 << EPIC_UART_1_INDEX))                
    #define EPIC_CHECK_SPI_0()                 (EPIC->RAW_STATUS & (1 << EPIC_SPI_0_INDEX))            
    #define EPIC_CHECK_SPI_1()                 (EPIC->RAW_STATUS & (1 << EPIC_SPI_1_INDEX))            
    #define EPIC_CHECK_GPIO_IRQ()              (EPIC->RAW_STATUS & (1 << EPIC_GPIO_IRQ_INDEX))                
    #define EPIC_CHECK_I2C_0()                 (EPIC->RAW_STATUS & (1 << EPIC_I2C_0_INDEX))            
    #define EPIC_CHECK_I2C_1()                 (EPIC->RAW_STATUS & (1 << EPIC_I2C_1_INDEX))            
    #define EPIC_CHECK_WDT()                   (EPIC->STATUS & (1 << EPIC_WDT_INDEX))            
    #define EPIC_CHECK_TIMER16_0()             (EPIC->RAW_STATUS & (1 << EPIC_TIMER16_0_INDEX))                
    #define EPIC_CHECK_TIMER16_1()             (EPIC->RAW_STATUS & (1 << EPIC_TIMER16_1_INDEX))                
    #define EPIC_CHECK_TIMER16_2()             (EPIC->RAW_STATUS & (1 << EPIC_TIMER16_2_INDEX))

Рассматриваем циклы процессора в контроллере CH32x035

EasyLy Jan 15 2025 at 23:14

По той же причине, почему не все регистры сохраняет NVIC. Есть Call Convention, которая прописывает, какие регистры функция может портить, а какие должна сохранить. У них же даже псевдонимы начинаются на a, t, s (Argument, Temporary, Saved). Вот которые функция в любом случае обязана сама сохранять - зачем париться? Она их сохранит даже при обычном вызове. Так положено!

У NVIC всё то же самое. Всё завязано на Call Convention. Так договорились, дальше даже аппаратура блюдёт эти договорённости. Но там до префиксов в псевдонимах не дошли. Тут - дошли.

Рассматриваем циклы процессора в контроллере CH32x035

EasyLy Jan 15 2025 at 22:55

Я же сказал, качайте описание ядра.

https://www.wch-ic.com/downloads/QingKeV4_Processor_Manual_PDF.html

Там, правда, сказано:

The V4 series microprocessors support hardware single cycle automatic saving of 16 of the shaped Caller Saved registers to an internal stack area that is not visible to the user. When an exception or interrupt returns, the hardware single cycle automatically restores data from the internal stack area to the 16 shaped registers. The hardware stack supports nesting with a maximum nesting depth of 3 levels. After a hardware stack overflow, if a higher priority interrupt is still allowed to execute, the "field" is saved to the user stack area.

То есть, куда-то во внутреннюю сущность, не в память. А куда - не скажут... Если внутренняя сущность переполнена - вроде, начнут в ОЗУ сохранять.

Рассматриваем циклы процессора в контроллере CH32x035

EasyLy Jan 15 2025 at 22:27

А кто сказал, что прогресс на этом MIK32 должен остановиться ?

Вы сказали :-) Вот:

Так, что рекомендую привыкать к минимализму во всём и к тому что есть.

И баннер "Приходите и покупайте АМУР" мне свалился весной 22-го. Когда его стало возможно купить? Новых баннеров мне пока не сваливалось.

Но я буду рад. Но если мне будут текущий АМУР ставить в пример - буду доказывать, что это компромиссное решение, от безысходности... А не потому, что он хорош. Не надо его в пример ставить. Не может он полноценным контроллером называться. Копеечные китайские намного дальше. При пробуксовке, они ещё посоревнуются с АМУРом, имеющим кэш, А уж на обработке прерываний, уделают его.

2 3 ...

21 22