Комментарии / Профиль ilye / Хабр

Для того что бы описать настолько подробно, надо слишком много действий делать.
У меня был проектик - портировал на эту железяку freegate - это видеосервер с распознаванием.
Сейчас freegate уже вроде и сам умеет на orange pi работать, тогда не умел.
Так вот, 8 камер 5fps он совершенно нормально держал, и вроде как это был не предел. В качестве распознавалки была какая-то yola вроде бы 640.
Это все, что я помню.
PS Интернет говорит что 120 fps там на йоле
PSS Ну а библиотека конечно их проприетарная rknpu, другие npu не умели использовать.
Но там как то несложно было конвертнуть сетку из оникса в их формат

ilye 10 ноя 2025 в 19:05

Пользуюсь orange pi 5 с момента выпуска. Йола с самого начала работала нормально на ней.

Цифровая радиотехника, первые шаги. Repka Pi + SDR = Сканируем Радиоэфир

ilye 30 сен 2025 в 13:38

Насколько точно можно получить несущую? Видно, интересно, доплеровское смещение при давлении антенны? А сигналы старлинка можно получить?

Что то у меня самого вряд-ли руки до СДР дойдут, но вообще, если получить частоты от старлинка с какой-то вменяемой точностью, то можно свои координаты и скорость узнать.

Утечка данных о зарплате в Microsoft показала, сколько зарабатывают сотрудники отделов ИИ, Azure и Xbox

ilye 30 авг 2025 в 20:29

Что то это гон. Дом в Подмосковье стоит столько же сколько квартира в Москве? Или вы что то другое имели ввиду?

Прямо сейчас родственники в поиске. Были варианты трёх спального нормально дома за десятку. В получасе езды. А ипотека тут причем? Яндекс даёт нехилый беспроцентный кредит, только на него можно дом купить.

Утечка данных о зарплате в Microsoft показала, сколько зарабатывают сотрудники отделов ИИ, Azure и Xbox

ilye 30 авг 2025 в 11:35

Дом в Подмосковье за 15 миллионов программист Яндекса вполне потянет

Часть 4. Алгоритмы: как превратить сырые данные в координаты

ilye 22 авг 2025 в 21:53

3.

Где там красные линии то все же? Что за странные М в качестве единиц для осей? Километры что ли?
А почему они разные на двух картинках, они же только фильтрацией отличаются?
И что то мутное-цветное смещающееся внутри черной линии это предсказанная траектория?

На мой взгляд вы решаете нерешаемую задачу.
Ориентацию с точностью до одного градуса можно получить, но скорость - вряд ли
Будет гравитация у вас не 9.81 а 9.79 (локальная аномалия или просто высота большая)
И получите вы за 8 минут скорость большую на 8 метров в секунду
Позиция будет в километровой погрешности за 2 минуты

Вам надо либо знать скорость (Доплер, по поверхности или как то так) либо какие то визуальные ориентиры иметь, тогда можно что то сделать.

Не знаю, насколько хорош Калман - по моему опыту не слишком, но может я его просто готовить не умею. Возможно. Даже наверняка, учитывая что обычный ahrs у меня давал результаты лучше, чем Калман с кватернионами. Но у меня просто не real time задача, я занимаюсь постобработкой, так что мне проще - с калманом я повозился чуть, при прыжках GPS он совсем что то у меня глючил. Ведь с gps оно как - долгое время он может нормально соответствовать траектории. Ну да, ошибка 20 метров, но со всеми инерциальными датчиками согласован, фильтр считает его достаточно надежным... А потом как появился еще один спутник, так куда нибудь упрыгает - и все ориентации и скорости с ума сходят. Калман же рассчитан на случайное блуждание, а в случае gps это не так. Но тут явно есть большие специалисты чем я в этой теме. Не про это хотел написать.

Так вот, точнее всего у меня предсказывались биасы при попытке согласовать датчики с физикой с помощью поиска траектории, которая минимизирует ошибки датчиков - просто с помощью градиентного спуска по ошибке. Но и тут не без сюрприза - процесс может сходится к разным траекториям. И в какой то момент, уменьшение ошибки дает ухудшение траектории. Что как бы говорит о том что только по данным иму посчитать ничего не получится

Решаем проблему «деградации» YouTube с помощью NoDPI

ilye 28 июн 2025 в 14:32

Да, я видел код, думал раз вы разбирались с этим handshake то может знаете как это определить
Вообще похоже что у заблокированных по dpi доменов просто нулевой трафик в ConnectionInfo
Но надо еще посмотреть

Ко всем доменам плохо
Кое что перестает работать

Решаем проблему «деградации» YouTube с помощью NoDPI

ilye 28 июн 2025 в 11:23

А как то можно выяснить, чем закончился tls handshake?
У меня сейчас вот www.google.com блокируется по dpi
Каждый раз выяснять что именно в этот раз пришло в голову ростелекому заблокировать не хочется, хорошо бы автоматом получать список адресов.
А там где не сработала фрагментация, можно было бы и на роутер маршрут автоматом прописывать

Mem-векторы: как сохранить 1500 токенов в одном векторе и зачем это нужно

ilye 7 мая 2025 в 07:31

Трансформеры это как минимум не свертка
В случае свертки использовать dilation может и не имеет смысла, по крайней мере на задачах классификации, там уменьшение разрешения вполне естественная операция - которая кстати ведет ровно к тому же, на каждом уровне берется окно в два раза шире
В случае же трансформера использование только части токенов на порядки повышает скорость обучения при небольшой (на самом деле не знаю какой и есть ли вообще) деградации качества.

И что же, вы считаете, если на 100млн параметров трансформер нормально сходится, то на миллиард перестанет сходится? Это вряд ли.
Кстати для изображений это даже более важно чем для текста, если рассматривать изображение как последовательность токенов, то никакой разумный трансформер не будет в состоянии учесть все предыдущие токены. Отсюда опять все эти костыли, когда за токен принимается кусок 16х16 или сначала используется сверточная нейросеть. Ну костыль же?

Но это же так естественно использовать в качестве соседей не все токены, а лишь какую то выборку - точки на расстоянии 1,3,7 и тд, тогда получается относительно небольшое количество соседей по которым идет обогащение, при этом уже на 8 уровнях пиксель получает полную информацию для генерации. На картинке пример - слева там начальная последовательность-изображение, справа реальное, по центру то что предсказала нейросеть-трансофрмер. Ну круто же! Это не мутный автоэнкодер или вае, реальная же цифра получилась. При этом такая генерация работает сильно быстрее чем всякие диффузеры, так что готовьтесь, скоро картинка как последовательность станет трендом. Главное от обогащения по всем токенам уйти

Mem-векторы: как сохранить 1500 токенов в одном векторе и зачем это нужно

ilye 3 мая 2025 в 19:31

Люди склонны выдумывать себе проблемы, а потом героически их решать.
Какой вообще смысл грузить все эти 10000 векторов контекста в модель?
Смысл нулевой абсолютно, там соседние вектора почти не отличаются друг от друга, и каждый из них несет вполне себе понимание контекста.
Достаточно использовать весьма ограниченное количество токенов, на первом уровне трансформера ближайшие, на втором - каждый второй, на третьем - каждый четвертый
На шестнадцатом - каждый 32000ый
При нормальном обучении и достаточной емкости вектора эмбединга эти вектора сами по себе впитают весь контекст своего уровня, без необходимости что то создавать дополнительное
Я пробовал использовать 32 токена - такую модель довольно просто обучить на обычной видеокарте, результаты вполне сравнимы с тем что получается у авторов из Language Modeling Is Compression
(для их игрушечных моделек, для миллиардных ресурсов нет)
Кстати, если вы посмотрите на результаты работы, то там есть еще один интересный вывод - модель с токенезацией работает хуже чем модель работающая напрямую с байтами

Телеграм бот для быстрого распознавания текста на фото с помощью Mistral OCR

ilye 25 мар 2025 в 19:48

Я не сравнивал, не знаю про разноцветный и на боку, но локальная Florence круто текст распознает. На выходе правда не структура, а строки и координаты

Что, если не трансформеры: какие альтернативы главной архитектуре нейросетей у нас есть в 2024 году

ilye 19 ноя 2024 в 13:25

Это где это в дифузере трансформер? Нет его там

Введение в Weight & Biases

ilye 28 авг 2024 в 20:14

Wandb уже все? Какие есть альтернативы?

NewBee путь к написанию торгового бота

ilye 23 июл 2024 в 07:09

Так не работает. Сетка говорит, что если купить акцию сейчас по такой цене, то даже с учетом комиссии, ее можно будет продать позже дороже. Это все что знает сеть.
Если купить акцию позже или по другой цене - не факт, что получится какая то прибыль. При этом это же участки с движением, то есть если не смог купить акцию в эту минуту, то через минуту уж точно не сможешь

NewBee путь к написанию торгового бота

ilye 23 июл 2024 в 05:12

Странно, у меня на акциях прекрасно все сходится. Проблема начинается дальше, данные свечи != цене акции, купить (или продать) по такой цене в половине случаев нереально, даже если сместить цену на десятую часть процента.

Как обучают GPT

ilye 18 апр 2024 в 11:27

Запустил ваш "туториал"

Как и предполагалось, такая модель не может ничего путного выдать.

После 1000 эпох аккуратность 45%

Строка на входе

From fairest creatures we desire increase,
That thereby beauty's rose might never die,
But as th

Строка на выходе
oeueaonne ehaee nhre eai a ene andee ne
aahenhahe e e ae nrh seaeue aeneehad e ea n
aaurhaneahe