Комментарии / Профиль Mortello / Хабр

Пользователь

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

Ps напиши этот пост llm - он бы стал прекрасным примером галлюцинации: нейронка не имея достаточных знаний о предметной области пытается проводить аналогии основываясь на выученных закономерностях (не обязательно релевантных) и выводит из них ответ.

Все встреченные мною галлюцинации были логичными, компании в которой я работаю oss-20b приписала офисы в Лондоне и Берлине, и это блин логично (в отличии от дрянной реальности которая нифига не логична)

Pps прошу прощения если ps оказался токсичным

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

Mortello 1 апр в 16:45

Объяснил как смог, неправильно но зато понятными словами.

Если миссия была сделать понятным - она выполнена

OpenCode — open-source coding agent с 126k звездами. Что это, и почему все обсуждают

Mortello 23 мар в 09:28

Opencode нормально работает с подпиской chatgpt plus, ключ не нужен

Три аккаунта ChatGPT и один прокси: как перестать следить за лимитами

Mortello 24 фев в 12:58

Не понял где вы берете apikey для авторизации запросов от своего прокси. Его вроде не выпустить для расходования лимитов подписки (буду рад ошибиться)

ChatGPT может получить подписку за $100

Mortello 22 фев в 12:38

И добавляет промежуточный тариф, ирод какой

Инженеры ИИ бьют тревогу, а мы продолжаем жить в 2024-м. Происходит нечто большее

Mortello 17 фев в 21:41

Люди с ботхаба, напрягите своих агентов и сделайте ручку на сайте, с которой можно получать цены на токены

Ну пожалуйста..

Бенчмарк DGX Spark с LLM Qwen3: кому подойдет, почему 128 ГБ не серебряная пуля и о чем умолчал маркетинг NVIDIA

Mortello 17 фев в 19:53

Ура, обошлось без ollama )
Насчет NVFP4, вдруг есть возможность сделать апдейт или вторую часть?
Спасибо за обзор!

Mortello 16 фев в 21:21

Пора сборник промптов выпускать.

Не задумывались?

Доматчинг товаров с использованием LLM: от промптов до квантизации

Mortello 31 янв в 23:22

Странно что мимо геммы 3 прошли, гугл даже QAT версию подготовил

В тексте иногда vLLM вместо VLM, по контексту не подходит

ИИ-агенты: как мы сделали DeepResearch по корпоративным данным и кодовой базе

Mortello 22 янв в 12:19

Один из шаблонов dify про дип рисерч, редактируется под свои хотелки за пару часов. В моем случае использует mcp по яндекс трекеру и конфлюенсу

Как заставить LLM сортировать данные: от наивного подхода до TrueSkill

Mortello 21 янв в 20:08

Как будто репостам не хватает нормировки по просмотрам, это важно

Данные реальных логов за 7 месяцев на 527 человек — что люди делают с LLM на работе и что с ними не так

Mortello 19 янв в 11:05

Litellm oss много дашбордов не отдает, за декабрь четверть запросов была у sonnet 4.5, ~85% всех расходов через openwebui

Данных пока мало, с ноября собираем

Данные реальных логов за 7 месяцев на 527 человек — что люди делают с LLM на работе и что с ними не так

Mortello 19 янв в 09:42

Openwebui + litellm, внешний провайдер + vllm с oss-120b в контуре (для внутренних данных)

Модели дороже 50$ за миллион исходящих отключены, как и генерация картинок

Пока самая большая проблема - длинные чаты, несмотря на объяснения почему большая накопленная история - плохо и как перенести контекст в новый чат - регулярно вижу в litellm запросы по 80-120к токенов, без прилепленных файлов

Роскомнадзор опроверг введение новых мер по блокировке Telegram в России

Mortello 16 янв в 23:04

Отрицание не равно опровержению, сколько можно уже..

Гайд по обходу «белых списков» и настройке цепочки рабочие варианты, почему ваш VPN может не работать

Mortello 16 янв в 11:38

Последняя миля относительно просто и дёшево решается с помощью радиомоста

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее

Mortello 9 янв в 08:39

Перплексия это не про качество абсолютно, это про "уверенность" при выборе следующего токена.

Прунинг делается под конкретную задачу, с контрольным датасетом и нормальными метриками

Если вы удаляли первый слой то просто обязаны были попробовать удалить и последний )) Но ни слова об этом вроде не сказано

Переводим проекты с Python на Node.js: на что способна локальная LLM на самом деле

Mortello 25 дек 2025 в 15:24

Я бы начал с проверки теоретической возможности переноса и демонстрации на левом проекте и внешнем провайдере нормальных токенов а потом уже попробовал бы выбить под задачу бюджет на связку из пары серьезных но всё ещё бытовых gpu.

Ps То что ваши коллеги получили bad experience на кванте изначально слабой модели - логично

Выбор LLM и фреймворка для ИИ-агентов

Mortello 24 дек 2025 в 17:07

Sglang хорош на time to first token а вот при высокой конкурентности vllm в топе

Как развернуть полноценный n8n AI-стек за 15 минут, а не за целый день

Mortello 6 дек 2025 в 13:18

Можно подробнее почему n8n орекстратор над flowise? Пока не щупал ни тот ни другой но планирую, рассматривал их в режиме vs а не coop

Паника Сэма Альтмана: Почему пользователи бегут из ChatGPT, а Google празднует победу

Mortello 6 дек 2025 в 11:37

А корпоративный сектор и энтузиасты приватности все чаще выбирают Open Source решения от Meta*

Нельзя было этот маркер "экспертизы" в самом начале проговорить? Столько времени можно было бы сэкономить..

2 3 4 5