Комментарии / Профиль LittleMeN / Хабр

Максим Савин@LittleMeN

Пользователь

Почему разработчики перестали читать документацию и что с этим делать

Вы очень четко описали документацию, которую я читать не буду! Организация в режиме вики лично для меня категорически не удобная. Особенно если знакомишься с новым продуктом, особенно если нету последовательного повествования, с погружением в специфику продукта. Какие-то артефакты, которые разработчик продукта посчитал важными он описал, а последовательное пояснение с чего начать, как установить, как использовать и т.п. как правило хрен найдёшь в это вашей вики. Оговорюсь, в том случае если мы говорим про документацию, а не базу знаний. И даже в случае базы знаний, я не буду читать статью/артефакт, потом прыгать за другим артефактом по ссылке, потом за другим и так далее.

Применение локальных LLM для OCR

LittleMeN 7 дек 2025 в 12:07

При всём уважении к автору и проделанной работе! Но данные модели сомнительный выбор для задачи OCR. Текущие модели в первую очередь llm и они лучше будут отвечать на вопросы что на изображении. Ну то есть, на вопрос "Какая фамилия автора?" — они все ответят прилично.

Рекомендую присмотреться:

Nanotes ocr
Deepseek ocr
Paddle ocr

Последний особенно четко распознает сложные структуры сканов/публикаций.

Интеллектуальный поиск: почему RAG уже недостаточно и как мы его превзошли

LittleMeN 9 ноя 2025 в 17:05

Поддержу предыдущих комментаторов, и задам вопрос более развернуто:

Подскажите пожалуйста, как вы боритесь с LLM выдумыванием? В своих наработках столкнулся с ситуацией когда сотрудники не перепроверяют документ, а получив ответ от бота верят ему. И даже если в найденном документе написано не то что бот суммаризировал в качестве ответа, сотрудники в большинстве случаев не перепроверяют...

В Вашей схеме красным "ответ найден?" — это фидбек от человека? или LLM-судъя? или иной механизм оценки?

Читал про ре-ранкер, и про жесткость промпта — в моем случае работает слабо, у меня документы на 3х языках, потому и уточняю данный технический вопрос...

Как мы в Авито обучили ML-модель находить «договорённости» без данных о сделках

LittleMeN 2 ноя 2025 в 19:35

Понимаю негодование комментаторов выше, однако минусую пост за отсутствие конкретики! Сама задача интересная, и осветить инструментарий, инструкции, техники обучения модели — это ценно! А вот это вот всё пространно описательное тратит время читателя в пустую. GPT так же может на пальцах раскидать любую задачку, и довольно неплохо помогает найти стандартные и не очень решения. Кроме конкретики! Какие инструменты использовать, какой формат данных выбрать, как готовить датасет, каким пайпланом дообучать и пр.

Вообще даже близко не формат Хабра! А какой-то отчет о проделанной работе для руководителя, а не специалистов которые тут читают и делятся опытом...

Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла

LittleMeN 31 окт 2025 в 16:34

Подскажите пожалуйста, а квантилизацию можно сделать в клон базы, в дополнение к чистым векторам чтобы получить скорость от квантилизации, но по необходимости иметь возможность в точность? Если так можно выразиться, как отдельный индекс?

В смысле я понимаю, что базу можно клонировать, и один клон квантилизировать, на другой нет. Мой вопрос скорее про такую возможность из коробки?

Из базы FAISS я именно так и делал, но там один файл и пара сотен тысяч векторов...

Делаем свой ChatGPT за 10$ в месяц: разворачиваем LLM на облаке. Подробный гайд на VPS + API-обертка

LittleMeN 27 окт 2025 в 19:51

После фразы:

Вообще я немного слукавил в заголовке

Можно не читать. Как чисто технически разворачивать ollama, openwebui — наверное многим может быть интересно/полезно. Однако поддержу комментарии выше!

Ожидал увидеть GPU решение, что кто-то нашел способ уложиться в 10$/мес, но увы слукавил. Инференс на CPU для сценария чат с моделью — это полный бред.

Предложенное решение может вменяемо обрабатывать какую-то малую задачу, с очередью сообщений, для которой не требуется минимальная задержка.

По итогу что? Кликбейтный заголовок для рекламы хостинга?

Разработка MCP-сервера на примере CRUD операций

LittleMeN 20 окт 2025 в 14:25

Подскажите пожалуйста, почему Вы выбрали вариант Hermes и Deepseek в качестве парсеров?

Разве модель qwen3-14b не умеет сразу в strict json — т.е. сразу генерировать tool call формат?

Как локально и бесплатно распознать текст лекции или совещания и делать это регулярно

LittleMeN 2 сен 2025 в 03:59

Кстати в whisper.cpp можно задать инициирующий промпт с терминологией:

./main -m models/ggml-large-v3.bin -f lecture.wav --language en --temperature 0 --beam-size 5 --initial-prompt "Today we discuss cardiology: myocarditis, troponin, echocardiography, ACE inhibitors, beta-blockers, atrial fibrillation, heparin, warfarin, NOACs..."

Как локально и бесплатно распознать текст лекции или совещания и делать это регулярно

LittleMeN 2 сен 2025 в 02:52

Попробуйте постобработкой с локальной llm. В промпт зашиваете специфические термины, и просьбу исправить после whisper который ошибся при распознавании.

Если все равно плохо выходит — увы только дообучать whisper под свою терминологию

Инструмент для маппинга: Решение проблемы для системного аналитика

LittleMeN 24 июн 2025 в 03:31

Чудесная статья, только о чем она? О разработке? О программе?

Некая нонейм программа и в ней удобно маппить — ценность статьи нулевая, имхо.

Готов поделиться — делись! — GitHub например🤷🏻‍♂️

Не готов — зачем публикация?

JSON vs бинарные форматы: почему Kafka выбирает скорость?

LittleMeN 22 мая 2025 в 11:37

🤔 у json как бы тоже есть возможность типизации, и последующей валидации например через json schema

PTTJS — формат текстового хранения комплексных таблиц

LittleMeN 12 мая 2025 в 04:00

Вы затронули LLM в статье, но из личного опыта могу сказать, что csv для моделей почему-то сложно 🤷🏻‍♂️ строки путают данные перемешивают и т.п. В тоже время json почти любая модель понимает от 7b и довольно внятно данными из json оперирует. А как Вы планируете «научить» LLM в свой формат?

GraphRAG: Повышение точности и полноты GenAI

LittleMeN 31 дек 2024 в 14:45

При всём уважении, но тема не раскрыта!

Что из себя представляет Граф-знаний? И в каком формате передаётся в LLM? А главное какие LLM вообще воспринимают Графы-знаний?

Как предсказать будущее с помощью ML?

LittleMeN 28 дек 2024 в 00:39

Это скорее отчет о проделанной работе, нежели внятная статья.

Взяли, добавили, учли, потом ещё добавили, потом изменили и т.п.

Создание блога на FastAPI с нуля: JWT, Markdown и современный веб-дизайн

LittleMeN 3 дек 2024 в 14:33

Из серии: мы взяли буханку хлеба, и нехитрыми манипуляциями получили троллейбус 😅

Создание блога на FastAPI с нуля: JWT, Markdown и современный веб-дизайн

LittleMeN 3 дек 2024 в 14:32

Одного меня смущает, что FastAPI спроектирован для программирования API. И «прикручивание» фронтенда — рендеринга страниц, это бред!? Почему бы сразу не взять Flask например?

Tencent представила Hunyuan-Large — крупнейшую открытую модель с 389 миллиардами параметров

LittleMeN 7 ноя 2024 в 03:12

Планирую прикупить себе +/- похожую конфигурацию на 4ре 4070ti 16g. Подкиньте пожалуйста пару ссылок по настройке, я дилетант в этом вопросе...

CSS-классы вредны

LittleMeN 20 июл 2024 в 10:22