Comments / Profile of virrus / Habr

User

Свой ИИ без облаков: практический гайд по llama.cpp + Qwen

Профессиональные железки по большому счету нужны только для дообучения, инференс вполне хорошо работает на бытовых картах. Но надо уметь делать “RAIG” массивы, чтобы переживать выпадание уработавшейся карты.

Электромобиль Атом: реальный опыт эксплуатации — от столичных пробок до суровых морозов

virrus Mar 23 at 17:56

А вот это интересно, спасибо.

Электромобиль Атом: реальный опыт эксплуатации — от столичных пробок до суровых морозов

virrus Mar 22 at 05:32

Есть у меня знакомый, с которым мы как-то разговорились на тему электромобилей. Я - владелец одного из них, он - скептик. Один из его аргументов был тоже про зарядку, что где ты её найдешь.

Поболтали и разошлись, а вечером он мне прислал фото зарядной станции, которая стоит в его дворе и мимо которой он постоянно ходит. Пока она ему была не нужна - он не замечал её и не знал, что она настолько близко :)

Если интересно посмотреть, то в приложении 2chargers для мобильного есть оочень подробная карта зарядок, вплоть до розеток, вывешенных хозяевами частных домов на улицу. К сожалению, онлайн версии нет, только приложение (

После заявления Max, что ссылки на фото нельзя подобрать или сгенерировать, в сети нашли контент из мессенджера

virrus Mar 7 at 08:59

Ну я-то картинку удалил, а сервер Макса продолжает распространять. А повлиять на это я никак больше не могу.

virrus Mar 7 at 08:08

То есть можно понаотправлять разных картинок, потом удалить их, а потом пожаловаться в РКН на распространение Максом всякого запрещённого?

Dreame L40s Pro Ultra: робот-пылесос, позволяющий забыть об уборке. Личный опыт

virrus Feb 12 at 19:52

Стояла "стандартная", попробуем "турбо", спасибо. Возможно, "проблема" в четырех детях и трёх котах)

Dreame L40s Pro Ultra: робот-пылесос, позволяющий забыть об уборке. Личный опыт

virrus Feb 12 at 18:24

Увы, нет. Может и сильно меньше, но всё равно наматывает.

Пять лет спустя: почему мы всё переписали с нуля

virrus Nov 7 2025 at 05:34

Ну вообще на рынке всегда продают "лекарства от боли". И новые успешные продукты обычно именно решают чью-то "боль". И у инвесторов тоже довольно часто возникает вопрос "а чью боль это решает и сколько у него денег"?

И это мы ещё не пошли в медицину, где денег на боль дают и очень даже много.

После релиза GPT-5 Сэм Альтман назвал AGI «не очень полезным термином»

virrus Aug 14 2025 at 14:38

Вопрос не в том, кто быстрее, а кто смог или не смог решить задачу. Вы превзойдете калькулятор в сложении больших чисел, он не превзойдет вас ни в чём.

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

virrus Aug 8 2025 at 19:57

Если F1 считается по точному совпадению с эталонной разметкой (тексту того, что надо выделить), то на каше будет нулевая оценка. В этом плане попугаи этой меры вполне понятны. Да, обычно извлекаются какие-то уникальные для документа поля, поэтому знание о мире тут не помогает LLM'ке выдумать правильный ответ.

Для оценки качества извлечения используются значение поля, извлечённого LLM, и эталонное значение поля, написанное вручную. При этом ручная разметка делается с исправлением OCR-артефактов, так что текст эталона может отличаться от текста поля из документа,идущего в LLM. Я не понимаю, к чему тут расстояния между текстами по математике и договорами, можете, пожалуйста, другими словами это пояснить? Имеется в виду какой-то вариант автоматической оценки качества без написания эталонов полей?

Считать эф-меру по порогу косинусного расстояния действительно не показательно, но так и не делают для простых полей. А для сложных типа "условия поставки" можно использовать другую LLM с вопросом "соответствует ли найденное эталону".

Контексты извлеченных полей в рамках работы с реальными документами оказываются не нужны. Клиенту без разницы, с какой именно страницы будет извлечена дата договора (если она находится в хедере каждой страницы), равно как и без разницы, откуда возьмутся стороны договора - из преамбулы или реквизитов. Вопрос про контексты был в другом Вашем комментарии, я объединил ответы.

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

virrus Aug 6 2025 at 20:44

Если сеть сгаллюцинировала ответ, то отличаться будут сильно.
А сопоставлять эталон и извлечённые поля можно и посимвольно, сеть же попросили в именительном падеже вернуть ответ.

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

virrus Aug 6 2025 at 20:42

F1 метрика это про другое.

Как мы заставили LLM понимать юридические документы лучше юристов: история создания универсального промта

virrus Aug 6 2025 at 12:43

А где в тексте проверка точности по косинусному расстоянию? Несколько раз перечитал, не увидел.

После 13 лет разработки ReFS так и не готова заменить NTFS

virrus Jul 1 2025 at 19:30

Обычно "посчитать на пальцах" означает "записать в унарной системе счисления с помощью пальцев". А мой комментарий к тому, что на любого зануду найдется зануда покрупнее.

После 13 лет разработки ReFS так и не готова заменить NTFS

virrus Jul 1 2025 at 10:52

Накладывает. Число атомов во Вселенной нельзя посчитать на пальцах рук.

Сервер за копейки

virrus Jun 25 2025 at 11:24

А как вы оцениваете это время? У меня, например, фиксированная зарплата, и если я на несколько часов задержусь на работе - получу ноль дополнительных рублей. Я не подрабатываю на шабашках, не таксую, не хожу на сторону фриланса. Даже если бы ходил, то с огромной долей вероятности стоимость часа была бы на порядок меньше текущей. Таким образом моё нерабочее время стоит ровно ноль рублей в час.

А как у вас? Как именно вы его считаете?

Операции машинного обучения (MLOps) для начинающих: полное внедрение проекта

virrus Nov 1 2024 at 04:08

Git сохраняет новые версии бинарных файлов как отдельные копии, не показывая подробные различия между ними, что затрудняет отслеживание изменений с течением времени.

А DVC разве умеет показывать diff для хранимых в нём файлов?

Какую видеокарту купить: б/у RTX 3090 или новую RTX 4070 Super

virrus Oct 23 2024 at 07:31

И да, и нет. Если бы было по-вашему, то пакетизация (batch) запросов не имела бы смысла, но она довольно часто полезна. Зависит всё от модельки и соотношения flops/bandwidth. При инференсе надо многократно прогонять всю модельку от GPU RAM до вычислительных ядер и, если их в избытке, память становится бутылочным горлышком. Но я встречал и случаи, batch size = 1 работал так же хорошо. Вот есть неплохая статья на эту тему https://www.artfintel.com/p/how-does-batching-work-on-modern

Какую видеокарту купить: б/у RTX 3090 или новую RTX 4070 Super

virrus Oct 11 2024 at 20:19

В последнем случае не столько объем памяти сыграл, наверное, сколько её скорость (разрядность шины). В 5080 обещают больше памяти, чем в 5090, но медленнее, и там придется подумать.

Больше не нужны: ChatGPT заменяет программиста

virrus Sep 20 2024 at 09:32

Ну так-то да, блоки разного размера, каждый под свою задачу. Например, извлечь список сторон контракта из документа, написанного в произвольной форме, Питоном достаточно сложно, а вот с помощью LLM справится даже ребенок. Или вот задача от Базелевса, про которую еще лет десять назад написали - по сценарию фильма нарисовать примерную раскадровку, чтобы съемочной группе упростить задачу (не помню уже, в чем, но нужна вот такая серия картинок или мультиков). На питоне её решить очень сложно, мультимодальной сетью - уже реально.

Моя мысль в том, что кирпичи надо выбирать под задачу. Пока во всех этих тестах из железобетонных плит пытаются сложить печку - получается довольно странно. Хотя в целом это вполне себе способ и порой это может оказаться дешевле, чем позвать мастера-печника.

2 3 ...

6 7