Comments / Profile of APKAH9 / Habr

Back to the roots

Любить или отменить: как IT-специалисты относятся к ИИ в работе

Для меня ИИ в конечном итоге его эволюции должен освободить людей от компьютеров и телефонов.

ИИ - это очень широкое понятие и гибкий инструмент для создания собственного уникального сервиса по автоматизации задач и работа с большими данными. Применить можно везде, но нужно нехило шарить в этой теме, чтобы не использовать чужие платные сервисы со стандартными шаблонами использования.

Для обучения и написания кода ии уже подтвердил свою компетентность, куда сложнее применять ии в исследованиях.

И помните о нотации: "всегда проверяйте любую полученную информацию на достоверность" - токены имеют свойство плавать.

Техрепорт Alice AI: как мы создавали новое поколение моделей для самого популярного ИИ-ассистента в России

APKAH9 Jan 21 at 17:34

Очень много инфы, но самое важное в этой строчке для себя увидел: "Ребята в текстовой Алисе проделали большую работу по подбору удачного сетапа RL".

Яндекс оптимизирует UX и управляемость ответов, а не интеллект модели. RL используется как механизм форматирования ответа, а не как инструмент развития reasoning. Для корпоративных внедрений это упирается в потолок "search + summary".

Если есть цель двигать саму модель, логичный шаг - выпустить открытую или полуоткрытую LLM для сообщества. Без этого нет масштабного ни фидбека, ни реальных экспериментов с RL, ни роста reasoning, ни полезных уникальных нод под РФ. Иначе весь прогресс так и останется на уровне аккуратного UX поверх retrieval, а не эволюции LLM.
Даёшь кодерскую модель и аналог Copilot

GPT-5.2 набирает обороты, а Google отменяет бесплатный доступ к Gemini: как заканчивается эпоха бесплатного ИИ

APKAH9 Dec 29 2025 at 16:14

Grok сейчас действительно один из самых щедрых бесплатных вариантов: без жёстких лимитов на инструменты и запросы, с автоматическим веб-поиском, когда нужно, и заметным прогрессом и уникальными фишками - ещё пару месяцев назад он был ощутимо слабее. Раньше я тоже считал GPT-4o/5 Plus + copy-paste в IDE абсолютной имбой и исправно платил подписку. А потом попробовал Cursor + Claude Opus за 20 $/мес - и понял, что это новый стандарт для разработки. Мир ускоряется, и это круто. Кто ещё недавно был на вершине - DeepMind в 2023-м, Gemini в начале 2024-го… Я вот всё жду, когда Алиса внезапно выстрелит и всех удивит, став AGI-предводительницей :) Звучит как шутка, но в нашей сфере возможно всё.

RAG-технология в действии: как создать интеллектуальную систему поиска по нормативным документам

APKAH9 Dec 17 2025 at 21:30

Попробуйте мой Hybrid RAG. Чистый Torch. Релевантные ответы по регуляторке 100/100. Справился лучше, чем gpt5plus + docs connector + deep research. Акцент на понимание и рефразер промта, а не на красивую структуру ответа.
kam1k88/GOST1k: Локальный AI-ассистент, который помогает находить и делать структурированные ответы по запросу на основании детерминированной загруженной информации в документах.

Мальчики, которые чинят компьютеры: что на самом деле делают инженеры сопровождения

APKAH9 Dec 17 2025 at 19:15

Классная статья. Читал её до того, как начал работать в сопровождении. Сейчас уже не работаею, перечитываю статью - как всё до боли знакомо, особенно отсутствие нормального тестирования))) Всё через боль, локальные выезды, anydesk и вечные гипотезы с догадками.
Про smoke-тесты ты лихо написал, у кого-то про них и не слышали даже)

Могу лишь дополнить как далеки разработчики между своими диагностиками по логам и тому, что реально происходит у клиента. Код рефакторится, проблема не решается. Проще самому разработчиком стать и написать правильный код, чем донести кодеру паттерны проявления багов и их причинно-следственную связь дабы не допустить повторяющихся проблем в будущих фичах и доработках :)
В целом, работа не пыльная, местами скучноватая, местами интересная.

Паттерны ООП в 10 минутах от вас… Поведенческие шаблоны с примерами на Java

APKAH9 Dec 5 2025 at 17:20

блин, ява такая сложная, но кажется такой супер-универсальной...
Автору 22 года, а темы актуальные в статьях, мейнстримовые, откуда столько сил учиться и держать темп?) Я имею ввиду, что темы, как по мне, очень актуальные и нужные, не какое-то там решение годовалой давности, которое есть у всех, а именно то, чего не хватает всем в данный момент, по крайней мере у нас в РФ.

подписался на гитхаб :)

HR на вилы, или почему они уничтожают рынок труда?

APKAH9 Nov 11 2025 at 14:36

Мощная статья о наболевшем. Заставила пересобрать резюме и пересмотреть подачу компетенций.

HR-сферу пора перезапускать с нуля. Сам подумывал протестировать новые подходы подбора, не опираясь на устаревшие шаблоны.

LinkedIn давно стал платформой сертификаций и точечных профессий, формирующих целостный профиль.

HH пошел в SMM и PR через "Сетку" и tenchat, но не решает главного - отсутствует верификация навыков и актуальная классификация.

Результат - 1000 откликов на вакансию и ноль смысла.

Трейсинг в hh.ru: как мы выросли от 1 тысячи до 1 миллиона событий в секунду без семплирования

APKAH9 Nov 2 2025 at 15:02

Я как дилетант, не видившего prod в масштабе: почему не LanceDB? Почему clickhouse? 1k cores AI triggers о_0

Спасибо за наглядный опыт. Как делать не надо - я понял 😁

DRAGON: динамический бенчмарк для оценки RAG-систем на русском языке

APKAH9 Nov 2 2025 at 08:36

Все, что тут написано, про LLM бэкграунд больше.

RAG ≠ RAG+LLM

RAG = NLP+VectorsDB(dataset)

субъект–отношение–объект - это делают семантические энкодеры внутри эбеддинговых NLP. (sbert.net).

Reasoning - это про LLM и к их pretraining(instructions)+finetuning

Извлечение графа знаний - А если у меня RAG без Графов?

А в чем проблема сгенерировать вопросы в другой LLM?)

Вопросы берутся из логов по-хорошему.

Вопросы должны быть релевантны.

CRAG (проверка по человеческим эталонным ответам), Self-CRAG (проверка retrieval с выдачей LLM как с эталоном) - %% текста из чанков topN сравнивается c выдачей LLM генерации на их основе. очень важно, чтобы чанки не обрезались.

Генерация типов вопросов - Это точно проверка RAG (RETRIEVAL) а не LLM?

В общем моя претензия - причем тут RAG вообще?

рекоммендую базу

по RAG
1) NirDiamant/RAG_Techniques
2) Hybrid Search Revamped - Building with Qdrant's Query API - Qdrant
3) MUVERA: Making Multivectors More Performant - Qdrant
4) kam1k88/GOST1k: Поиск по документам

по NLP (Sentence Transformers + Embeddings )
1) Quickstart — Sentence Transformers documentation - там же и finetune и прочее. Методы обучения схожие с LLM

Вопрос к Сберу, когда у нас появятся русские эмбеддинг+реранкер модели в связке для dense+sparse+dot под русский язык? Вроде железо есть для файнтюна, датасеты есть, а open-sourse моделей 0-13B нету. Был sber-ruBert когда-то, но уже неактуальный стал.

Паттерны ООП, так не издевались даже… Структурные шаблоны с примерами на Java

APKAH9 Oct 25 2025 at 05:04

Андрей, ты моим кумиром становишься. Когда ты писал про RAG, я о нём только узнал, и сейчас уже эксперт по RAGу.

Теперь с этой статьи я уже понимаю как java работает) все очень схоже с питоном для NLP, только java - под devops) Спасибо, очень хорошие знания для нубов Не хватает только красивой таблицы как памятки твоих методик. Вот только java совсем не торкает )))

Паттерны ООП, так не издевались даже… Структурные шаблоны с примерами на Java

APKAH9 Oct 22 2025 at 17:07

А сейчас все под java стандартизировано уже?

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

APKAH9 Oct 7 2025 at 03:04

БАЗА
https://github.com/NirDiamant/RAG_Techniques
LightRAG включен в RAG-Anything
- https://github.com/HKUDS/LightRAG
  LightRAG/README.md at main · HKUDS/LightRAG
- RAG-Anything/README.md at main · HKUDS/RAG-Anything
  https://github.com/HKUDS/RAG-Anything

Прокачиваем RAG: тестируем техники и считаем их эффективность. Часть 2

APKAH9 Oct 4 2025 at 09:43

Спасибо за личный опыт в статье. Очень полезно. Все бы такие инсайды кидали сюда) Ру-Коммьюнити хочу по ML, а не эти буржуйские-безликие-глобальные-унифицированные github и discord. У нас в стране своя реальность.

Не подскажете, может есть такие?) Типа "форумы" аля закрытый форум banki.ru, который закрылся недавно. Группироваться надо - это полезная тема)

Как не сойти с ума на умной работе: инструкция по психологическому здоровью для ИТ-шников

APKAH9 Oct 3 2025 at 11:30

Статья стала откровением для меня, и ведь правда. Рукоделие - лекарство от серой жизни. Теперь стали понятны мои навязчивые странные побуждения к шитью, лепке и рисованию. Пойду, паяльник куплю, что ли, а то не-поайтишному.

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

APKAH9 Sep 9 2025 at 00:34

Как оказалось... Векторизация-индексация-реранкер-модели-мультимодели -- всё фигня! Главное в доках - это Чанки. От массивных чанкеров к тонким: Langchain(на хайпе)-llamaindex-Tiktokenizer(1love).

Абзацы пункты таблицы все в один target_tokens limit умещаем. overlap 25% от target limit. Но не слишком большой, а то индексикация плохой будет; при малых пунктах/абзацах/таблицах - склеиваем чанки, но чтобы не больше target_tokens по токенам была сумма; слишком большие абзацы ушедшие за лимит аккуратно разделяем между предложениями. слишком маленькый target_tokens - плохой эндпоинт и большой вес модели, лаги, необходимость повторном ретривере.

Еще с таблицами отдельный вопрос. Можно pdftotext/pdfminer.six если сканы хорошие, либо ocrmupdf (нагрузка на vram) А можно CV легенькое как-то подцепить... Это к вопросу о хорошей предобработке даты

Как я слил 400 000 рублей и пол года свободного времени на стартап, который никому не нужен

APKAH9 Sep 5 2025 at 08:26

LLM в дизайне - ни о чем. И еще долго будет ниочем. Картинки котиков, это не векторные изображения с возможностью правок.
ЗЫ: Люди - сволочи. Человек проект жизни открыл - заминусили. Поделился горем - залайкали

+26

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

APKAH9 Aug 30 2025 at 22:47

Почитайте про RAG Flow. . RAG на двух видюхах (моделях) самообучающийся.

И ждем новую статью)

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

APKAH9 Aug 29 2025 at 19:09

Done

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

APKAH9 Aug 29 2025 at 10:36

А в чем проблема предварительно pdf подготовить в .ps через тот же OCR вне RAG? Вся суть rag, что вся база данных актуальной должна быть., чтобы не глючить, а выдавать четкий конкретный ответ по запросу.

RAG и векторные БД: НЕ Сизифов LLM на Java и Spring Ai

APKAH9 Aug 29 2025 at 10:34

Какая же ты умничка, br0mberg. Очень структурно и красиво оформлено, а самое главное - та тема, которую неохотно все внедряют из-за неведения и слабого представлнния всего потенциала четкой RAG

Единственное, взята в пример конкретная внедренная структура, парсинг и очистка может быть совсем иная. Векторность так же можно через llm обучить , но с геммором. Все зависит от поставленных задач, величины базы данных и железа) Но суть статьи - RAG must have. Куда донатить за статью?)

Information

Specialization