Комментарии / Профиль Mortello / Хабр

Ps напиши этот пост llm - он бы стал прекрасным примером галлюцинации: нейронка не имея достаточных знаний о предметной области пытается проводить аналогии основываясь на выученных закономерностях (не обязательно релевантных) и выводит из них ответ.

Все встреченные мною галлюцинации были логичными, компании в которой я работаю oss-20b приписала офисы в Лондоне и Берлине, и это блин логично (в отличии от дрянной реальности которая нифига не логична)

Pps прошу прощения если ps оказался токсичным

Галлюцинации LLM — это артефакты сжатия. И это объясняет вообще всё

Mortello 1 апр в 16:45

Объяснил как смог, неправильно но зато понятными словами.

Если миссия была сделать понятным - она выполнена

OpenCode — open-source coding agent с 126k звездами. Что это, и почему все обсуждают

Mortello 23 мар в 09:28

Opencode нормально работает с подпиской chatgpt plus, ключ не нужен

Три аккаунта ChatGPT и один прокси: как перестать следить за лимитами

Mortello 24 фев в 12:58

Не понял где вы берете apikey для авторизации запросов от своего прокси. Его вроде не выпустить для расходования лимитов подписки (буду рад ошибиться)

ChatGPT может получить подписку за $100

Mortello 22 фев в 12:38

И добавляет промежуточный тариф, ирод какой

Инженеры ИИ бьют тревогу, а мы продолжаем жить в 2024-м. Происходит нечто большее

Mortello 17 фев в 21:41

Люди с ботхаба, напрягите своих агентов и сделайте ручку на сайте, с которой можно получать цены на токены

Ну пожалуйста..

Бенчмарк DGX Spark с LLM Qwen3: кому подойдет, почему 128 ГБ не серебряная пуля и о чем умолчал маркетинг NVIDIA

Mortello 17 фев в 19:53

Ура, обошлось без ollama )
Насчет NVFP4, вдруг есть возможность сделать апдейт или вторую часть?
Спасибо за обзор!

Mortello 16 фев в 21:21

Пора сборник промптов выпускать.

Не задумывались?

Доматчинг товаров с использованием LLM: от промптов до квантизации

Mortello 31 янв в 23:22

Странно что мимо геммы 3 прошли, гугл даже QAT версию подготовил

В тексте иногда vLLM вместо VLM, по контексту не подходит

ИИ-агенты: как мы сделали DeepResearch по корпоративным данным и кодовой базе

Mortello 22 янв в 12:19

Один из шаблонов dify про дип рисерч, редактируется под свои хотелки за пару часов. В моем случае использует mcp по яндекс трекеру и конфлюенсу

Как заставить LLM сортировать данные: от наивного подхода до TrueSkill

Mortello 21 янв в 20:08

Как будто репостам не хватает нормировки по просмотрам, это важно

Данные реальных логов за 7 месяцев на 527 человек — что люди делают с LLM на работе и что с ними не так

Mortello 19 янв в 11:05

Litellm oss много дашбордов не отдает, за декабрь четверть запросов была у sonnet 4.5, ~85% всех расходов через openwebui

Данных пока мало, с ноября собираем

Данные реальных логов за 7 месяцев на 527 человек — что люди делают с LLM на работе и что с ними не так

Mortello 19 янв в 09:42

Openwebui + litellm, внешний провайдер + vllm с oss-120b в контуре (для внутренних данных)

Модели дороже 50$ за миллион исходящих отключены, как и генерация картинок

Пока самая большая проблема - длинные чаты, несмотря на объяснения почему большая накопленная история - плохо и как перенести контекст в новый чат - регулярно вижу в litellm запросы по 80-120к токенов, без прилепленных файлов

Роскомнадзор опроверг введение новых мер по блокировке Telegram в России

Mortello 16 янв в 23:04

Отрицание не равно опровержению, сколько можно уже..

Гайд по обходу «белых списков» и настройке цепочки рабочие варианты, почему ваш VPN может не работать

Mortello 16 янв в 11:38

Последняя миля относительно просто и дёшево решается с помощью радиомоста

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее

Mortello 9 янв в 08:39

Перплексия это не про качество абсолютно, это про "уверенность" при выборе следующего токена.

Прунинг делается под конкретную задачу, с контрольным датасетом и нормальными метриками

Если вы удаляли первый слой то просто обязаны были попробовать удалить и последний )) Но ни слова об этом вроде не сказано

2 3 4 5