Статьи / Профиль ractangle / Хабр

Artem@ractangle

Пользователь

ПрофильСтатьи5ПостыНовостиКомментарии3

ractangle 26 янв в 05:55

Как я сделал классификатор обращений для телеком-поддержки на своей LLM за $10/месяц

3 мин

6.8K

Python * Клиентская оптимизация * Искусственный интеллект

Fine-tuned Qwen2.5-0.5B для классификации обращений в поддержку: intent, category, urgency, sentiment, routing — всё в одном JSON. Модель 350 МБ, работает на CPU, стоимость инфраструктуры $10/месяц. Рассказываю как обучал, квантовал и деплоил.

ractangle 18 янв в 11:09

Я реализовал паттерн памяти из OpenAI Cookbook в Python библиотеку

4 мин

7.2K

Искусственный интеллектPython *

AI-агент который помнит: Python библиотека по рецепту OpenAI

Устал объяснять агенту одно и то же? Я тоже.

Взял паттерн Context Personalization из OpenAI Cookbook и упаковал в pip install:

from agent_memory import MemoryManager
manager = MemoryManager(storage=SQLiteStorage("./memory.db"))
state = manager.load_user("user_123")
prompt = state.to_system_prompt() # Память уже в промпте

Что под капотом:
— Session vs Global память
— LLM-консолидация (5 заметок → 3, умная дедупликация)
— Блокировка PII и prompt injection
— TTL для временных предпочтений

pip install agent-memory-state
Код: github.com/molchanovartem/agent-memory

ractangle 16 янв в 12:47

Log Analyzer Pro 2.0: Добавляем AI-поиск на естественном языке

2 мин

6.5K

DevOps * Текстовые редакторы и IDE * Rust * Искусственный интеллект

Продолжение истории про Rust-based log viewer для VS Code. Теперь с AI: описываешь что искать на человеческом языке — получаешь regex. Плюс объяснение непонятных строк в один клик.

ractangle 8 янв в 14:55

Лоботомия нейросети: удалил 7 слоёв из LLM — она стала на 30% быстрее

Средний

5 мин

12K

Искусственный интеллектМашинное обучение * Natural Language Processing *

Эксперимент по хирургическому удалению слоёв из языковой модели

Современные LLM переобучены — многие слои делают одно и то же. Я проверил эту гипотезу на практике: взял TinyLlama (1.1B параметров, 22 слоя) и измерил, как удаление каждого слоя влияет на perplexity.

Результаты:
• Удаление 1 среднего слоя: +10% скорость, -4% качество
• Удаление 7 «безопасных» слоёв: +32% скорость, -2.5% качество
• Удаление первого слоя: модель полностью ломается

Неожиданно: Layer 2 важнее Layer 0 (perplexity +6.67 vs +3.92 при удалении).

Статья с кодом на PyTorch, графиками и практическими рекомендациями — какие слои можно удалять для ускорения инференса.

+10

ractangle 15 дек 2025 в 06:15

Rust, mmap и 10 миллионов пикселей: делаем производительный Log Viewer для VS Code

Средний

4 мин

8.1K

Rust * Visual Studio * Текстовые редакторы и IDE * Программирование *

Из песочницы

Наверняка у каждого бэкендера или девопса была такая ситуация:
Нужно срочно посмотреть, что случилось на проде. Вы скачиваете server.log, по привычке кликаете на него в VS Code... и всё.
Редактор зависает, кулеры ноутбука взлетают, интерфейс не отвечает. Файл весит всего-то 2-3 ГБ, но для редактора на базе Electron/DOM это приговор.

Обычно в этот момент мы убиваем процесс VS Code и идём в терминал писать less или tail -f. Это работает, но лишает нас комфорта: нормального поиска, копипаста мышкой, подсветки синтаксиса.

Я перепробовал кучу расширений, но все они либо пытались загрузить файл в память (и падали), либо работали слишком медленно. Поэтому я решил написать своё решение — с Rust на бэкенде, memory-mapping и виртуализацией всего, что только можно.

Под катом расскажу, как скрестить VS Code с нативным бинарником, обойти лимиты браузера на высоту скролла и сделать grep по гигабайтам текста мгновенным.

+23