Комментарии / Профиль virrus / Хабр

Пользователь

Как одна буква в ассемблере стоит 3× производительности

Там вообще было интересно, мы переходили на x64 и как раз менялись поколения Xeon’ов и замеры показывали, как на старой платформе x86 код выполнялся быстрее x64 кода на этой же платформе, а на новой уже наоборот - x64 был быстрее x86 (бинарники, естественно, одни и те же для старой и новой). Наверное Интел слегка подзабила на оптимизацию x86 стека.

Как одна буква в ассемблере стоит 3× производительности

virrus 25 апр в 07:44

Отвечу я - иногда компилятору не хватает знаний о решаемой задаче и возможных значениях переменных. У меня был случай году в 2018, когда пришлось несколько раз править кусок кода на C пока компилятор (последний msvc) не смог сгенерировать хороший ассемблерный код. Там приходилось прибегать к развороту цикла, подбору битности и знаковости переменных, даже создавать промежуточные переменные, чтобы результаты операций правильно и эффективно считались. Но, конечно, это все точечные истории, и остальная кодовая база на 2.5 млн строк собиралась без такого фанатизма.

Свой ИИ без облаков: практический гайд по llama.cpp + Qwen

virrus 5 апр в 07:10

Профессиональные железки по большому счету нужны только для дообучения, инференс вполне хорошо работает на бытовых картах. Но надо уметь делать “RAIG” массивы, чтобы переживать выпадание уработавшейся карты.

Электромобиль Атом: реальный опыт эксплуатации — от столичных пробок до суровых морозов

virrus 23 мар в 17:56

А вот это интересно, спасибо.

Электромобиль Атом: реальный опыт эксплуатации — от столичных пробок до суровых морозов

virrus 22 мар в 05:32

Есть у меня знакомый, с которым мы как-то разговорились на тему электромобилей. Я - владелец одного из них, он - скептик. Один из его аргументов был тоже про зарядку, что где ты её найдешь.

Поболтали и разошлись, а вечером он мне прислал фото зарядной станции, которая стоит в его дворе и мимо которой он постоянно ходит. Пока она ему была не нужна - он не замечал её и не знал, что она настолько близко :)

Если интересно посмотреть, то в приложении 2chargers для мобильного есть оочень подробная карта зарядок, вплоть до розеток, вывешенных хозяевами частных домов на улицу. К сожалению, онлайн версии нет, только приложение (

После заявления Max, что ссылки на фото нельзя подобрать или сгенерировать, в сети нашли контент из мессенджера

virrus 7 мар в 08:59

Ну я-то картинку удалил, а сервер Макса продолжает распространять. А повлиять на это я никак больше не могу.

virrus 7 мар в 08:08

То есть можно понаотправлять разных картинок, потом удалить их, а потом пожаловаться в РКН на распространение Максом всякого запрещённого?

Dreame L40s Pro Ultra: робот-пылесос, позволяющий забыть об уборке. Личный опыт

virrus 12 фев в 19:52

Стояла "стандартная", попробуем "турбо", спасибо. Возможно, "проблема" в четырех детях и трёх котах)

Dreame L40s Pro Ultra: робот-пылесос, позволяющий забыть об уборке. Личный опыт

virrus 12 фев в 18:24

Увы, нет. Может и сильно меньше, но всё равно наматывает.

Пять лет спустя: почему мы всё переписали с нуля

virrus 7 ноя 2025 в 05:34

Ну вообще на рынке всегда продают "лекарства от боли". И новые успешные продукты обычно именно решают чью-то "боль". И у инвесторов тоже довольно часто возникает вопрос "а чью боль это решает и сколько у него денег"?

И это мы ещё не пошли в медицину, где денег на боль дают и очень даже много.

После релиза GPT-5 Сэм Альтман назвал AGI «не очень полезным термином»

virrus 14 авг 2025 в 14:38

Вопрос не в том, кто быстрее, а кто смог или не смог решить задачу. Вы превзойдете калькулятор в сложении больших чисел, он не превзойдет вас ни в чём.

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

virrus 8 авг 2025 в 19:57

Если F1 считается по точному совпадению с эталонной разметкой (тексту того, что надо выделить), то на каше будет нулевая оценка. В этом плане попугаи этой меры вполне понятны. Да, обычно извлекаются какие-то уникальные для документа поля, поэтому знание о мире тут не помогает LLM'ке выдумать правильный ответ.

Для оценки качества извлечения используются значение поля, извлечённого LLM, и эталонное значение поля, написанное вручную. При этом ручная разметка делается с исправлением OCR-артефактов, так что текст эталона может отличаться от текста поля из документа,идущего в LLM. Я не понимаю, к чему тут расстояния между текстами по математике и договорами, можете, пожалуйста, другими словами это пояснить? Имеется в виду какой-то вариант автоматической оценки качества без написания эталонов полей?

Считать эф-меру по порогу косинусного расстояния действительно не показательно, но так и не делают для простых полей. А для сложных типа "условия поставки" можно использовать другую LLM с вопросом "соответствует ли найденное эталону".

Контексты извлеченных полей в рамках работы с реальными документами оказываются не нужны. Клиенту без разницы, с какой именно страницы будет извлечена дата договора (если она находится в хедере каждой страницы), равно как и без разницы, откуда возьмутся стороны договора - из преамбулы или реквизитов. Вопрос про контексты был в другом Вашем комментарии, я объединил ответы.

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

virrus 6 авг 2025 в 20:44

Если сеть сгаллюцинировала ответ, то отличаться будут сильно.
А сопоставлять эталон и извлечённые поля можно и посимвольно, сеть же попросили в именительном падеже вернуть ответ.

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

virrus 6 авг 2025 в 20:42

F1 метрика это про другое.

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

virrus 6 авг 2025 в 12:43

А где в тексте проверка точности по косинусному расстоянию? Несколько раз перечитал, не увидел.

После 13 лет разработки ReFS так и не готова заменить NTFS

virrus 1 июл 2025 в 19:30

Обычно "посчитать на пальцах" означает "записать в унарной системе счисления с помощью пальцев". А мой комментарий к тому, что на любого зануду найдется зануда покрупнее.

После 13 лет разработки ReFS так и не готова заменить NTFS

virrus 1 июл 2025 в 10:52

Накладывает. Число атомов во Вселенной нельзя посчитать на пальцах рук.

Сервер за копейки

virrus 25 июн 2025 в 11:24

А как вы оцениваете это время? У меня, например, фиксированная зарплата, и если я на несколько часов задержусь на работе - получу ноль дополнительных рублей. Я не подрабатываю на шабашках, не таксую, не хожу на сторону фриланса. Даже если бы ходил, то с огромной долей вероятности стоимость часа была бы на порядок меньше текущей. Таким образом моё нерабочее время стоит ровно ноль рублей в час.

А как у вас? Как именно вы его считаете?

Операции машинного обучения (MLOps) для начинающих: полное внедрение проекта

virrus 1 ноя 2024 в 04:08

Git сохраняет новые версии бинарных файлов как отдельные копии, не показывая подробные различия между ними, что затрудняет отслеживание изменений с течением времени.

А DVC разве умеет показывать diff для хранимых в нём файлов?

Какую видеокарту купить: б/у RTX 3090 или новую RTX 4070 Super

virrus 23 окт 2024 в 07:31

И да, и нет. Если бы было по-вашему, то пакетизация (batch) запросов не имела бы смысла, но она довольно часто полезна. Зависит всё от модельки и соотношения flops/bandwidth. При инференсе надо многократно прогонять всю модельку от GPU RAM до вычислительных ядер и, если их в избытке, память становится бутылочным горлышком. Но я встречал и случаи, batch size = 1 работал так же хорошо. Вот есть неплохая статья на эту тему https://www.artfintel.com/p/how-does-batching-work-on-modern

2 3 ...

6 7