Comments / Profile of erley / Habr

Alex Erley@erley

Principal ML/BigData DevOps

Subscribers

Джон Кармак: мы все могли бы работать на старом компьютерном оборудовании, если бы оптимизация ПО была приоритетом

erley May 14 2025 at 05:24

В моём случае это было устройство типа чипа на кредитке - там класс защиты от физического проникновения довольно высокий, поэтому размер кристалла уменьшен до предела (около 1х1 мм) и отсюда такие скромные ресурсы у MCU.

Во Франции есть ST Microelectronics (STM* микроконтроллеры довольно популярны), есть Gemalto (они занимаются банковскими картами с большой долей рынка в мире). Но в целом таких компаний мало конечно, тут вы правы.

erley May 13 2025 at 22:44

В embedded programming часто код оптимизируется по максимуму.

Помнится был у меня проект когда в 16 Кб оперативки уживались OS+USB и сетевой стек+простой веб сервер+движок базы данных (правда поддерживающий предопределённые SELECT, но с JOIN-ами). Причём в процессе работы над проектом мне даже удалось оптимизировать код и освободить около 1 Кб памяти.

Но это был так скажем специфический случай...

Вспомнилась история одного фидошника, вот кажется нашёл - https://habr.com/ru/articles/27055/ :-)

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса

erley May 5 2025 at 13:56

Да, но не только трансформерами - мир гораздо сложнее и настоящий исследователь подвергает сомнению истины и смотрит гораздо шире на вещи.

Вы почитайте работы Джефри Хинтона, например его идеи по введению функций вместо весов связей. Или вот KAN-сети - это тоже иной взгляд на работу НС.

Можно и не на таком детальном уровне даже посмотреть, например то что сейчас делают со смешиванием разных подходов к обучению. Много чего нового по работе с контекстным окном, но это уже конечно совсем высокоуровневые улучшения.

Как я понял, Ян не то что против LLM, он призывает не зацикливаться, не попасть в ловушку кажущейся простоты. Как исследователя я его понимаю, пока есть такой интерес (и инвестиции) к ИИ, он хотел бы продвинуться в исследованиях дальше простых чатботов, ведь эта ниша быстро прогрессирует и без новых идей может скоро дойти до своих пределов.

Это всё не моё личное мнение по этой теме, просто была возможность поговорить и узнать как это видит такой весьма умный и талантливый человек как Ян Ле Кун.

Ян Лекун, создатель LeNet, формата DjVu и адвокат опенсорса

erley May 5 2025 at 10:36

Кстати, я с ним общался на конференции и попросил разъяснить этот тезис.
Если кратко, то это скорее хайп с его стороны (ф Ян знатный шоумен) чтобы привлечь внимание к тому что нынешние студенты должны смотреть дальше за горизонт, а не пытаться здесь и сейчас повторить/соорудить что-то вокруг существующих моделей. Прямо сейчас на его взгляд идёт конкуренция между большими компаниями, но они больше заняты экстенсивным развитием. А думать нужно о базовых концепциях, модернизировать их, придумывать новые подходы.
Показателен пример с DeepSeek, мы все помним как все вздрогнули когда кто-то придумал что-то новое...

Как умерла OS/2 в неравной схватке с Windows — история легендарной операционной системы

erley May 5 2025 at 10:18

Полуось была моей первой основной операционкой на первом купленном компе в те далёкие 90-е года. Помню её удивительную стабильность, виндовые программы запускал в виндоэмуляторе, который воспринимался как прослойка, это избавляло от перезагрузки от постоянно падающих виндовых программ.

Даже что-то там кодил на SOM кажется под полуосью в WatcomC...

Когда вышла NT4, то перешёл на неё уже - софта больше, стабильность примерно такая же. Потом на работе была NT2k, которые постепенно заместились линуксом и фряхой.

Всякие дос надстройки типа win3.x/win95/win98/winMe только тыкал палочкой и отодвигал подальше :-)

Стало интересно - поднимется полуось на старом железе сейчас?

Для защиты своего сервера я использую zip-бомбы

erley Apr 30 2025 at 22:55

Оставляя за скобками способ выявления хакера/бота, если он попался, то самое полезное - это максимально замедлить его работу.
Именно не просто сломать (он просто перезагрузится и пойдёт к кому-то другому), а именно blackhole ему сделать. Сколько там таймаут по сокету? вот один chunk на несколько байт ему из /dev/zero отдавать чтобы только коннект не обрывался. Или TCP ACK замедлить или ещё что-то.
Многие файрволы именно так и делают - кидаем IP этого buddy в определённую таблицу и пусть он повисит помучается.
Да и вам по трафику легче будет.
У меня так было настроено - сидит демон и логи грепает от разных сервисов которые наружу выставлены, как только обнаружит такого бота - добавляет его в таблицу и всё.

Больше 5090 — больше проблем? Тестируем связку из двух GPU NVIDIA

erley Apr 22 2025 at 12:49

Реклама прямо в тексте раздражает, но если уж без этого никак то раскройте нам почему там первая ваша платформа "не тянет"? Просто интересно, разобрались или нет...

Эра мультиагентов? Как LangChain, только на стероидах: протокол Agent2Agent (A2A) от Google + MCP

erley Apr 20 2025 at 10:36

Не знаю как вам, но мне было не жалко потратить 10 минут времени и прочитать статью целиком. Думаю оно того стОит, спасибо автору!

-1

HIGGS: Новый алгоритм квантования нейросетей

erley Apr 14 2025 at 18:17

Спасибо, полезно как вводная статья в тему квантования и perplexity в целом

Тупиковый синьёр или при чем тут эрудиция?

erley Apr 11 2025 at 16:38

Чуть не запалили :-)

Тупиковый синьёр или при чем тут эрудиция?

erley Apr 11 2025 at 16:24

Прикольная дока! От души :)

Тупиковый синьёр или при чем тут эрудиция?

erley Apr 11 2025 at 16:05

Мне так первый раз в руки попала Роза Мира, в рулоне :-)

KRR — ваш личный советник по ресурсам в Kubernetes

erley Mar 31 2025 at 11:38

Очень полезная методика, хочется попробовать.

PS Помнится N лет назад @Tzimie написал утилиту которая анализировала то как используется БД и предлагала оптимальные индексы для улучшения производительности.

Фотохостинг со сквозным шифрованием

erley Feb 17 2025 at 09:30

Широко известное решение которое позволяет искать по содержимому - это например Immich. Прекрасно работает у меня "на стареньком core2duo" с базой около 70 тыс фото+видео. Поиск моментальный.
Там возможностей побольше чем в этом Google Photo, советую & рекомендую...

Microsoft и OpenAI расследуют, обучался ли DeepSeek на украденных данных американских компаний в сфере ИИ

erley Jan 29 2025 at 12:39

В официальном уставе OpenAI (вот сейчас специально сходил и проверил) указано что если другой проект/компания будет догонять/обгонять их в гонке AGI, то они не будут с ними конкурировать, а станут им помогать.

Так что как-то противоречиво выглядит их позиция, хотя это очень по-американски :)

Как установить и использовать ИИ модель DeepSeek R-1 на вашем компьютере

erley Jan 29 2025 at 11:31

Пишут что можно: https://github.com/sgl-project/sglang/tree/main/benchmark/deepseek_v3#example-serving-with-2-h208

WAF — своими руками

erley Jan 25 2025 at 22:02

У меня почему-то когнитивный диссонанс - решение на mod_security нельзя назвать удобным и мощным (на мой взгляд).

То есть там где дело доходит до того что люди себе ставят задачу развернуть-таки WAF (то есть у них и правда что-то критичное есть что защищать нужно) - там уж как-то не мелочатся, а разворачивают решение с наглядной визуализацией что происходит, кучей метрик и эвристик. У вас не будет времени залезать в текстовые конфиги и править правила когда что-то действительно будет атаковано. А "выдернуть сетевой кабель" не всегда возможно физически и/или функционально.

Решение на апаче с этим модулем требует ещё много всего чтобы им можно было пользоваться на таких критичных проектах.

Однако тема интересная, очень любопытно будет почитать про snort и другие open source решения, буду ждать!

PS У нас используется Imperva и кое-где Palo Alto (у этих правда какие-то косяки в последнее время).

Торвальдс выбрал не одного, а пятерых разработчиков ядра Linux, которым подарит гитарные педали собственной сборки

erley Jan 20 2025 at 10:39

Будет (было бы) забавно если бы хоть один из выигравших публично отказался принимать подарок от Линуса ввиду его национальности или ещё чего-то :-)

Релиз Open Source-платформы Cozystack 0.22 (и немного 0.23): телеметрия, пропатченный Talos, Workload и WorkloadMonitor

erley Jan 18 2025 at 18:49

Ребята, аплодирую стоя! Молодцы!

CES 2025: Nvidia представила видеокарты поколения RTX 50, продажи начнутся в январе по цене от $550 до $2000

erley Jan 7 2025 at 13:24

Вот теперь можно будет 4090 по нормальной цене брать :-)

3 4 ...

17 18

Information

Specialization