Comments / Profile of ilye / Habr

Илья@ilye

User

Почему большинство ритейл-алготрейдеров теряет деньги. Я полез разбираться

Если ставить лимитные заявки, вы свободны от проскальзывания и спред играет вам на руку.

Ну и наш рынок сильно проще чем, например, американский

А делать бэктест на тренировочных данных это вообще нонсенс. Если бэктест сильный и честный это должно вам дать нормальную прибыль в проде

И вроде в Тинькофф 0.0004 включая биржу

Как я внедрил пилотный проект системы компьютерного зрения на производстве, пока станки простаивали, при 7000 в неделю

ilye Nov 12 2025 at 08:54

Для того что бы описать настолько подробно, надо слишком много действий делать.
У меня был проектик - портировал на эту железяку freegate - это видеосервер с распознаванием.
Сейчас freegate уже вроде и сам умеет на orange pi работать, тогда не умел.
Так вот, 8 камер 5fps он совершенно нормально держал, и вроде как это был не предел. В качестве распознавалки была какая-то yola вроде бы 640.
Это все, что я помню.
PS Интернет говорит что 120 fps там на йоле
PSS Ну а библиотека конечно их проприетарная rknpu, другие npu не умели использовать.
Но там как то несложно было конвертнуть сетку из оникса в их формат

ilye Nov 10 2025 at 19:05

Пользуюсь orange pi 5 с момента выпуска. Йола с самого начала работала нормально на ней.

Цифровая радиотехника, первые шаги. Repka Pi + SDR = Сканируем Радиоэфир

ilye Sep 30 2025 at 13:38

Насколько точно можно получить несущую? Видно, интересно, доплеровское смещение при давлении антенны? А сигналы старлинка можно получить?

Что то у меня самого вряд-ли руки до СДР дойдут, но вообще, если получить частоты от старлинка с какой-то вменяемой точностью, то можно свои координаты и скорость узнать.

Утечка данных о зарплате в Microsoft показала, сколько зарабатывают сотрудники отделов ИИ, Azure и Xbox

ilye Aug 30 2025 at 20:29

Что то это гон. Дом в Подмосковье стоит столько же сколько квартира в Москве? Или вы что то другое имели ввиду?

Прямо сейчас родственники в поиске. Были варианты трёх спального нормально дома за десятку. В получасе езды. А ипотека тут причем? Яндекс даёт нехилый беспроцентный кредит, только на него можно дом купить.

Утечка данных о зарплате в Microsoft показала, сколько зарабатывают сотрудники отделов ИИ, Azure и Xbox

ilye Aug 30 2025 at 11:35

Дом в Подмосковье за 15 миллионов программист Яндекса вполне потянет

Часть 4. Алгоритмы: как превратить сырые данные в координаты

ilye Aug 22 2025 at 21:53

3.

Где там красные линии то все же? Что за странные М в качестве единиц для осей? Километры что ли?
А почему они разные на двух картинках, они же только фильтрацией отличаются?
И что то мутное-цветное смещающееся внутри черной линии это предсказанная траектория?

На мой взгляд вы решаете нерешаемую задачу.
Ориентацию с точностью до одного градуса можно получить, но скорость - вряд ли
Будет гравитация у вас не 9.81 а 9.79 (локальная аномалия или просто высота большая)
И получите вы за 8 минут скорость большую на 8 метров в секунду
Позиция будет в километровой погрешности за 2 минуты

Вам надо либо знать скорость (Доплер, по поверхности или как то так) либо какие то визуальные ориентиры иметь, тогда можно что то сделать.

Не знаю, насколько хорош Калман - по моему опыту не слишком, но может я его просто готовить не умею. Возможно. Даже наверняка, учитывая что обычный ahrs у меня давал результаты лучше, чем Калман с кватернионами. Но у меня просто не real time задача, я занимаюсь постобработкой, так что мне проще - с калманом я повозился чуть, при прыжках GPS он совсем что то у меня глючил. Ведь с gps оно как - долгое время он может нормально соответствовать траектории. Ну да, ошибка 20 метров, но со всеми инерциальными датчиками согласован, фильтр считает его достаточно надежным... А потом как появился еще один спутник, так куда нибудь упрыгает - и все ориентации и скорости с ума сходят. Калман же рассчитан на случайное блуждание, а в случае gps это не так. Но тут явно есть большие специалисты чем я в этой теме. Не про это хотел написать.

Так вот, точнее всего у меня предсказывались биасы при попытке согласовать датчики с физикой с помощью поиска траектории, которая минимизирует ошибки датчиков - просто с помощью градиентного спуска по ошибке. Но и тут не без сюрприза - процесс может сходится к разным траекториям. И в какой то момент, уменьшение ошибки дает ухудшение траектории. Что как бы говорит о том что только по данным иму посчитать ничего не получится

Решаем проблему «деградации» YouTube с помощью NoDPI

ilye Jun 28 2025 at 14:32

Да, я видел код, думал раз вы разбирались с этим handshake то может знаете как это определить
Вообще похоже что у заблокированных по dpi доменов просто нулевой трафик в ConnectionInfo
Но надо еще посмотреть

Ко всем доменам плохо
Кое что перестает работать

Решаем проблему «деградации» YouTube с помощью NoDPI

ilye Jun 28 2025 at 11:23

А как то можно выяснить, чем закончился tls handshake?
У меня сейчас вот www.google.com блокируется по dpi
Каждый раз выяснять что именно в этот раз пришло в голову ростелекому заблокировать не хочется, хорошо бы автоматом получать список адресов.
А там где не сработала фрагментация, можно было бы и на роутер маршрут автоматом прописывать

Mem-векторы: как сохранить 1500 токенов в одном векторе и зачем это нужно

ilye May 7 2025 at 07:31

Трансформеры это как минимум не свертка
В случае свертки использовать dilation может и не имеет смысла, по крайней мере на задачах классификации, там уменьшение разрешения вполне естественная операция - которая кстати ведет ровно к тому же, на каждом уровне берется окно в два раза шире
В случае же трансформера использование только части токенов на порядки повышает скорость обучения при небольшой (на самом деле не знаю какой и есть ли вообще) деградации качества.

И что же, вы считаете, если на 100млн параметров трансформер нормально сходится, то на миллиард перестанет сходится? Это вряд ли.
Кстати для изображений это даже более важно чем для текста, если рассматривать изображение как последовательность токенов, то никакой разумный трансформер не будет в состоянии учесть все предыдущие токены. Отсюда опять все эти костыли, когда за токен принимается кусок 16х16 или сначала используется сверточная нейросеть. Ну костыль же?

Но это же так естественно использовать в качестве соседей не все токены, а лишь какую то выборку - точки на расстоянии 1,3,7 и тд, тогда получается относительно небольшое количество соседей по которым идет обогащение, при этом уже на 8 уровнях пиксель получает полную информацию для генерации. На картинке пример - слева там начальная последовательность-изображение, справа реальное, по центру то что предсказала нейросеть-трансофрмер. Ну круто же! Это не мутный автоэнкодер или вае, реальная же цифра получилась. При этом такая генерация работает сильно быстрее чем всякие диффузеры, так что готовьтесь, скоро картинка как последовательность станет трендом. Главное от обогащения по всем токенам уйти

Mem-векторы: как сохранить 1500 токенов в одном векторе и зачем это нужно

ilye May 3 2025 at 19:31

Люди склонны выдумывать себе проблемы, а потом героически их решать.
Какой вообще смысл грузить все эти 10000 векторов контекста в модель?
Смысл нулевой абсолютно, там соседние вектора почти не отличаются друг от друга, и каждый из них несет вполне себе понимание контекста.
Достаточно использовать весьма ограниченное количество токенов, на первом уровне трансформера ближайшие, на втором - каждый второй, на третьем - каждый четвертый
На шестнадцатом - каждый 32000ый
При нормальном обучении и достаточной емкости вектора эмбединга эти вектора сами по себе впитают весь контекст своего уровня, без необходимости что то создавать дополнительное
Я пробовал использовать 32 токена - такую модель довольно просто обучить на обычной видеокарте, результаты вполне сравнимы с тем что получается у авторов из Language Modeling Is Compression
(для их игрушечных моделек, для миллиардных ресурсов нет)
Кстати, если вы посмотрите на результаты работы, то там есть еще один интересный вывод - модель с токенезацией работает хуже чем модель работающая напрямую с байтами

Телеграм бот для быстрого распознавания текста на фото с помощью Mistral OCR

ilye Mar 25 2025 at 19:48

Я не сравнивал, не знаю про разноцветный и на боку, но локальная Florence круто текст распознает. На выходе правда не структура, а строки и координаты

Что, если не трансформеры: какие альтернативы главной архитектуре нейросетей у нас есть в 2024 году

ilye Nov 19 2024 at 13:25

Это где это в дифузере трансформер? Нет его там

Введение в Weight & Biases

ilye Aug 28 2024 at 20:14

Wandb уже все? Какие есть альтернативы?

NewBee путь к написанию торгового бота

ilye Jul 23 2024 at 07:09

Так не работает. Сетка говорит, что если купить акцию сейчас по такой цене, то даже с учетом комиссии, ее можно будет продать позже дороже. Это все что знает сеть.
Если купить акцию позже или по другой цене - не факт, что получится какая то прибыль. При этом это же участки с движением, то есть если не смог купить акцию в эту минуту, то через минуту уж точно не сможешь

NewBee путь к написанию торгового бота

ilye Jul 23 2024 at 05:12

Странно, у меня на акциях прекрасно все сходится. Проблема начинается дальше, данные свечи != цене акции, купить (или продать) по такой цене в половине случаев нереально, даже если сместить цену на десятую часть процента.

Как обучают GPT

ilye Apr 18 2024 at 11:27

Запустил ваш "туториал"

Как и предполагалось, такая модель не может ничего путного выдать.

После 1000 эпох аккуратность 45%

Строка на входе

From fairest creatures we desire increase,
That thereby beauty's rose might never die,
But as th

Строка на выходе
oeueaonne ehaee nhre eai a ene andee ne
aahenhahe e e ae nrh seaeue aeneehad e ea n
aaurhaneahe

Как обучают GPT

ilye Apr 17 2024 at 14:08

А пример будет, что такая модель может написать? Бессмысленный набор символов? Или несвязанные слова?

YOLO-World: распознавание произвольного числа объектов с высокой точностью и скоростью

ilye Feb 8 2024 at 05:49

Чуда ожидать не стоит, но все же...

Вас же не удивляет, что всякие диффузеры генерят осмысленную картинку? Значит в целом нейросети уже научились определять, что именно на картинке изображено. В случае stable diffusion этим занимается сетка clip - она по картинке делает эмбеддинг, и по фразе делает эмбеддинг и сличает, насколько эти эмбединги похожи. При генерации меняет картинку так, что бы ее эмбединг был сильнее похож на текстовый.

Тут собственно почти тоже самое, что мешает натренировать сеть искать кусок изображения, который при свертке clip даст эмбеддинг максимально похожий на текстовый?

Clip при этом тренировалась не на классах, а на картинках с описанием. Конечно, если нигде в этом наборе объект который вы ищете не встречался, то clip и yola из статьи не сработает. И сейчас все сетки с открытым множеством находят много лишнего, но думаю еще не много и это доделают.

Вот тут еще пример такой сетки
https://ashkamath.github.io/mdetr_page/

Python, Go или… готовим сырой видеопоток с полсотни камер

ilye Oct 9 2023 at 05:36

Для декорирования видео у карты какой то свой отдельный блок, его загрузка рисуется в Taskmanager Windows. Не знаю уж, что вы оптимизировали в языках, но если натравить на ртсп ffmpeg и брать кадры через пайп то уже 60 камер по 1280х720 полностью загружают современные видеокарты. Именно карту, все остальное свободно. Cuda при этом не используется, только блок декодирования. И неважно, кто запускает ffmpeg, у меня есть проект с с++ и python, от языка это не зависит, ведь вся нагрузка в другом процессе. Вытащить из пайп кадры может любой калека

В общем как-то совсем ваша информация с моим опытом не стыкуется. 40 fullhd просто кладут карту на лопатки, даже при дешифровки пяти кадров в секунду.